神经网络实现多分类的思路

原创 2018-04-12 17:34 阅读(397)次

在逻辑回归算法的分类问题中,我们提到过    多分类问题的求解思路

在神经网络中,思考的方向也是一样的。

即是给预测的类别(预测概率最高的类别)为1,其他分类为0来表示。

神经网络中的实现思路

是在输出层做出N个节点(N为类别总数),这样在输出不在是一个数,而是一个N维向量,这个向量在预测认为最有可能的分类对应的维度上表示为1,其他维度上表示为0.

如 

    被认为是第2类别。

但第几个类别不是我们空谈,需要训练样本支持,也是就是学习的训练样本的y值也应该是一个N维矩阵,并仅在认为的类别对应的维度上表示为1,其他为0。

分别表示了y^(1) 是第1个类别,y^(2) 是第2个类别,以此类推。

我们得到的数据样本往往不是这样的数据结构,这需要我们进行矩阵转换。

其他方面和逻辑回归相同,输入经过输入层,隐藏层,到输出层得到的N维矩阵。

看起来就像这样

这是andrew ng的视频中表达的概念。

如果类别总数小于3,那只要一个输出层节点就足够表达,如果大于等于3,即需要用N个节点来表示N类结果矩阵。

本文完。

本站作品的版权皆为作品作者所有。

本站文字和内容为本站编辑或翻译,部分内容属本站原创,所以转载前务必通知本站并以超链接形式注明内容来自本站,否则以免带来不必要的麻烦。

本站内容欢迎分享,但拒绝有商业目的的转载!