多层感知器

✍ dations ◷ 2025-08-23 22:59:22 #多层感知器

多层感知器（Multilayer Perceptron,缩写MLP）是一种前向结构的人工神经网络，映射一组输入向量到一组输出向量。MLP可以被看作是一个有向图，由多个的节点层所组成，每一层都全连接到下一层。除了输入节点，每个节点都是一个带有非线性激活函数的神经元（或称处理单元）。一种被称为反向传播算法的监督学习方法常被用来训练MLP。多层感知器遵循人类神经系统原理，学习并进行数据预测。它首先学习，然后使用权重存储数据，并使用算法来调整权重并减少训练过程中的偏差，即实际值和预测值之间的误差。主要优势在于其快速解决复杂问题的能力。多层感知的基本结构由三层组成：第一输入层，中间隐藏层和最后输出层，输入元素和权重的乘积被馈给具有神经元偏差的求和结点,主要优势在于其快速解决复杂问题的能力。 MLP是感知器的推广，克服了感知器不能对线性不可分数据进行识别的弱点。

若每个神经元的激活函数都是线性函数，那么，任意层数的MLP都可被约简成一个等价的单层感知器。

实际上，MLP本身可以使用任何形式的激活函数，譬如阶梯函数逻辑Sigmoid函数，但为了使用反向传播算法进行有效学习，激活函数必须限制为可微函数。由于具有良好可微性，很多S函数，尤其是双曲正切函数（Hyperbolic tangent）及逻辑函数，被采用为激活函数。

在深度学习的最新发展中，线性整流(ReLU)更频繁地被用来克服与S函数相关的数值问题。

两个历史上常见的激活函数都是 S函数，形式是

${displaystyle y(v_{i})=tanh(v_{i})}$ ${displaystyle y(v_{i})=tanh(v_{i})}$ 和 ${displaystyle y(v_{i})=(1+e^{-v_{i}})^{-1}}$ ${displaystyle y(v_{i})=(1+e^{-v_{i}})^{-1}}$ 。

第一个是个双曲正切函数，值域为 -1 到 1；第二个是个逻辑函数，形状很相似但是值域为 0 到 1。令 y_i 为第 i 个节点（神经元）的输出，而 v_i 是输入连接的加权和。也有其他的激活函数，例如线性整流函数，径向基函数（用于径向基函数网络，另一种监督神经网络模型）。

MLP由三层或更多层非线性激活节点组成(一个输入层和一个具有一个或多个隐藏层的输出层)。由于多层互连是完全连接的，所以一层中的每个节点都以一定的权重 w_ij 连接到下一层的每个节点。

MLP 在感知器中进行学习，通过每次处理数据后改变连接权重，降低输出与预测结果的误差量。这是有监督学习的一个例子，通过反向传播来实现，反向传播是线性感知器中最小均方算法的推广。

我们可以将输出节点 j 的第 n 个数据点的误差表示为 ${displaystyle e_{j}(n)=d_{j}(n)-y_{j}(n)}$ ${displaystyle e_{j}(n)=d_{j}(n)-y_{j}(n)}$ ，其中 d 是目标值，y 是由感知器预测的值。调整节点权重的方式是，尝试通过修正节点权重最小化输出的整体误差

使用梯度下降，每个权重的修正量为

其中 y_i 是前一个神经元的输出，η是学习率。η需要精心挑选，保证权重可以快速收敛而不发生震荡。

式中的导数取决于局部场 v_j。场是变化的。很容易证明输出节点的导数可以简化为

其中 ${displaystyle phi ^{prime }}$ ${displaystyle phi ^{prime }}$ 是激活函数的导数。 ${displaystyle phi ^{prime }}$ ${displaystyle phi ^{prime }}$ 是不变的。对于隐藏节点的权重变化，分析更加困难，但是可以看出相关的导数是

代表输出层的第k个节点的权重变化会影响这个导数。因此，为了改变隐藏层权重，输出层权重根据激活函数的导数而改变，因此该算法代表激活函数的反向传播。

术语“多层感知器”不是指具有多层的单感知器，每一层由多个感知器组成。另一种说法是是“多层感知器网络”。此外，MLP的“感知器”不是最严格意义上的感知器。真正的感知器在形式上是人工神经元的一个特例，它使用一个阈值激活函数，如阶跃函数。MLP感知器可以使用任意激活函数。一个真正的感知器执行二进制分类(或者这个或者那个)，一个MLP神经元可以自由地执行分类或者回归，这取决于它的激活函数。

后来应用术语“多层感知器”时，没有考虑节点/层的性质，节点/层可以由任意定义的人工神经元组成，而不是具体的感知器。这种解释避免了将“感知器”的定义放宽到一般意义上的人工神经元。

常被MLP用来进行学习的反向传播算法，在模式识别的领域中算是标准监督学习算法，并在计算神经学及并行分布式处理领域中，持续成为被研究的课题。MLP已被证明是一种通用的函数近似方法，可以被用来拟合复杂的函数，或解决分类问题。

MLP在80年代的时候曾是相当流行的机器学习方法，拥有广泛的应用场景，譬如语音识别、图像识别、机器翻译等等，但自90年代以来，MLP遇到来自更为简单的支持向量机的强劲竞争。近来，由于深度学习的成功，MLP又重新得到了关注。

相关

肌束膜肌束膜（英语：perimysium）是一层把肌纤维组合成束（捆）即肌束（muscle fascicle）的结缔组织鞘（套）。肌肉生理学新近研究发现肌束膜在“侧收缩运动”（lateral contractile movement）中起作
组织 (社会学)组织一词有几层基本含义。作为动词，即按一定目的进行编排、组合；作为名词，就是上述活动的结果——有组织的实体，或实体内组成要素间的关系。“组织”是社会科学、自然科学许多知
EngrishEngrish，源自日语转写系统没有“L”，常用“R”（IPA: .mw-parser-output .IPA{font-family:"Charis SIL","Doulos SIL","Linux Libertine","Segoe UI","Lucida Sans Unicode","C
圣何塞传教所圣何塞传教所（Mission San José），是根据方济各令所修建的21所加州西班牙传教所之一，坐落在现在的美国加州佛利蒙市。圣何塞传教所建于1797年6月11日，是根据方济各令所修建的第十
举升体举升体（lifting body），又称升力体，是指一种让机身能够自己产生升力的飞机外型。它与飞行翼的区别是，飞行翼是完全没有传统的机身结构，它尝试消除无升力的表面，使得在亚音速的巡航效
ILIL可以指：
米切尔·埃雷罗米切尔·阿方索·埃雷罗·雅瓦卢瓦（西班牙语：Miguel Alfonso Herrero Javaloyas，1988年7月29日－），西班牙足球运动员，通常司职中场。现效力于西甲球队巴利亚多利德，曾效力于广州富力
侯维翰侯维翰（英语：Fred Ho，1957年8月10日－2014年4月12日），出生于加州，美国爵士萨克斯演唱家、作曲家、编曲家、作家和社会活动家。他活跃于非裔美国人和亚裔美国人音乐运动。2014年，他因
丁志芳丁志芳（？－1402年），又名志方，山东行省东昌府聊城县（今山东省聊城县）人，明朝政治人物、进士。洪武十七年，山东乡试中举。洪武十八年（1385年），丁志芳中式乙丑科进士，授吴桥县知县，升监察御史。靖难之役后，朱棣进入南京，宫中大火，文帝不知所终，志方以建文帝有仁政，对朱棣采取不合作态度，与山东诸城人谢升、安徽怀宁人甘霖等御史从容就死。史称：“忠愤激发，视刀锯鼎镬甘之若饴，百世而下，凛凛犹有生气。”。东昌府有其祠。弘光元年，赠太仆卿，谥号贞定。
八打灵再也市政厅八打灵再也市政厅（马来语：Majlis Bandaraya Petaling Jaya，简称“MBPJ”）是马来西亚雪兰莪州八打灵再也的地方政府，隶属雪兰莪州政府。八打灵再也市议会于2006年6月20日升格为市政厅。其辖区包括八打灵县东北部区域如万达镇、哥打白沙罗、武吉加星（英语：Bukit Gasing）、八打灵再也南区等，总面积为97.2平方千米（37.5平方英里），占据双溪毛糯和白沙罗两个巫金的一部分。市政厅的职责为负责为辖区进行规划、文物保护、公共和环境卫生、废物管理、交通管理、环境保护、建筑控制