谈及AI时常听到的「神经网络」和「深度学习」到底是什么意思?
神经网络神经网络是一个模型。
这个模型可能是参照了人的神经细胞和网络的构造,也可以理解成有一堆算法的表现形式刚好和神经网络有些像,然后被形容成神经网络,形象,高大上。
这个模型是什么?解决这个问题最好的途径是回顾历史,找它的起源。
感知器:(英语:Perceptron)是Frank Rosenblatt在1957年就职于Cornell航空实验室(Cornell Aeronautical Laboratory)时所发明的一种人工神经网络。它可以被视为一种最简单形式的前馈神经网络,是一种二元线性分类器。上边是对于感知器的解释,感知器可以看成是最早的神经网络。感知器同样有着一个高大上的名词,不过其本身是一个线性分类器。
线性分类器还是可以理解成一个“模型”。
通过这个模型和一些算法可以将一堆数值转化成两个数值,或者一个概率,举个粗糙的例子:
人是否有好心情和很多因素相关,比如:得到关爱、关爱了别人、遇到喜欢的人、赚钱了、天气不错、终于下班了,等等。这些因素可以看成很多数值,但心情好不好只有两个,心情好和不好。借助感知器这个模型,可以推测人的心情。
感知器可以解决一些实际的问题。不过,有局限性,有局限性就需要解决。
多层感知器(Multilayer Perceptron,缩写MLP)是一种前向结构的人工神经网络,映射一组输入向量到一组输出向量。MLP可以被看作是一个有向图,由多个的节点层所组成,每一层都全连接到下一层。除了输入节点,每个节点都是一个带有非线性激活函数的神经元(或称处理单元)。后来,有人提出了多层感知器,解决了之前感知器的一些不足,更加强大了。
多层感知器可以看成是感知器的增强,由于更加复杂,步骤更多,和神经网络的网络更像一些。之前的单个感知器更像是神经单元。
多层感知器的提出是在1980年左右,其发展并不顺利,到后来随着算法的进步,特别是反向算法的提出;计算能力的提升;GPU的使用;数据的增多,类似于多层感知器,和神经网络有些像的模型在机器学习当中才有了更好的表现。
这些模型流行的同时,其对外的表现形式也越发高大上,比如上图的样子。
神经网络现在给外界的感觉已经不是之前的分类器,而是更加注重流程,淡化了中间的细节。
更像一个模型。
深度学习从字面来看,深度学习是深度的机器学习,这里的深度或许可以这样来看:
计算更加复杂,计算更加深入,结果更好,就像经过深度思考一样。意思是深度学习算法比传统机器学习算法厉害。。。。。。
神经网络中的层数多,可以粗略的看成更深。。。。。。
这里更喜欢这个关于深度学习的由来:
由于多层感知器曾经有一段时间表现并不好,甚至有些负面,近些年崛起之后,为了有一个全新的形象,给起了一个更加牛逼的名字:深度学习。
深度学习(deep neural network)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。深度学习是一种算法。
不过,深度学习的表现过于突出,其含义也更加宽泛,包含神经网络的模型,包含算法。最终,深度学习有些类似一门学科。
相比神经网络和深度学习到底是什么,如何更好的使用深度学习的技术,传统机器学习当中的技术来实现一些应用更为重要。如果没有使用神经网络的模型,没有使用深度学习的算法,但是得到了一个更好的关于机器学习的结果,也挺好。