感知器

✍ dations ◷ 2025-09-18 13:02:30 #感知器

感知器(英语:Perceptron)是弗兰克·罗森布拉特(英语:Frank Rosenblatt)在1957年就职于康奈尔航空实验室(Cornell Aeronautical Laboratory)时所发明的一种人工神经网络。它可以被视为一种最简单形式的前馈神经网络,是一种二元线性分类器。

罗森布拉特给出了相应的感知机学习算法,常用的有感知机学习、最小二乘法和梯度下降法。譬如,感知机利用梯度下降法对损失函数进行极小化,求出可将训练数据进行线性划分的分离超平面,从而求得感知机模型。

感知机是生物神经细胞的简单抽象。神经细胞结构大致可分为:树突、突触、细胞体及轴突。单个神经细胞可被视为一种只有两种状态的机器——激动时为‘是’,而未激动时为‘否’。神经细胞的状态取决于从其它的神经细胞收到的输入信号量,及突触的强度(抑制或加强)。当信号量总和超过了某个阈值时,细胞体就会激动,产生电脉冲。电脉冲沿着轴突并通过突触传递到其它神经元。为了模拟神经细胞行为,与之对应的感知机基础概念被提出,如权量(突触)、偏置(阈值)及激活函数(细胞体)。

在人工神经网络领域中,感知机也被指为单层的人工神经网络,以区别于较复杂的多层感知机(Multilayer Perceptron)。作为一种线性分类器,(单层)感知机可说是最简单的前向人工神经网络形式。尽管结构简单,感知机能够学习并解决相当复杂的问题。感知机主要的本质缺陷是它不能处理线性不可分问题。

1943年,心理学家沃伦·麦卡洛克和数理逻辑学家沃尔特·皮茨在合作的《A logical calculus of the ideas immanent in nervous activity》论文中提出并给出了人工神经网络的概念及人工神经元的数学模型,从而开创了人工神经网络研究的时代。1949年,心理学家唐纳德·赫布在《The Organization of Behavior》论文中描述了神经元学习法则——赫布型学习。

人工神经网络更进一步被美国神经学家弗兰克·罗森布拉特(英语:Frank Rosenblatt)所发展。他提出了可以模拟人类感知能力的机器,并称之为‘感知机’。1957年,在Cornell航空实验室中,他成功在IBM 704机上完成了感知机的仿真。两年后,他又成功实现了能够识别一些英文字母、基于感知机的神经计算机——Mark1,并于1960年6月23日,展示与众。

为了‘教导’感知机识别图像,罗森布拉特在Hebb学习法则的基础上,发展了一种迭代、试错、类似于人类学习过程的学习算法——感知机学习。除了能够识别出现较多次的字母,感知机也能对不同书写方式的字母图像进行概括和归纳。但是,由于本身的局限,感知机除了那些包含在训练集里的图像以外,不能对受干扰(半遮蔽、不同大小、平移、旋转)的字母图像进行可靠的识别。

首个有关感知机的成果,由罗森布拉特于1958年发表在《The Perceptron: A Probabilistic Model for Information Storage and Organization in the Brain》的文章里。1962年,他又出版了《Principles of Neurodynamics: Perceptrons and the theory of brain mechanisms》一书,向大众深入解释感知机的理论知识及背景假设。此书介绍了一些重要的概念及定理证明,例如感知机收敛定理。

虽然最初被认为有着良好的发展潜能,但感知机最终被证明不能处理诸多的模式识别问题。1969年,马文·闵斯基和西摩尔·派普特在《Perceptrons》书中,仔细分析了以感知机为代表的单层神经网络系统的功能及局限,证明感知机不能解决简单的异或(XOR)等线性不可分问题,但罗森布拉特和闵斯基及派普特等人在当时已经了解到多层神经网络能够解决线性不可分的问题。

由于罗森布拉特等人没能够及时推广感知机学习算法到多层神经网络上,又由于《Perceptrons》在研究领域中的巨大影响,及人们对书中论点的误解,造成了人工神经领域发展的长年停滞及低潮,直到人们认识到多层感知机没有单层感知机固有的缺陷及反向传播算法在80年代的提出,才有所恢复。1987年,书中的错误得到了校正,并更名再版为《Perceptrons - Expanded Edition》。

近年,在Freund及Schapire(1998)使用核技巧改进感知机学习算法之后,愈来愈多的人对感知机学习算法产生兴趣。后来的研究表明除了二元分类,感知机也能应用在较复杂、被称为structured learning类型的任务上(Collins, 2002),又或使用在分布式计算环境中的大规模机器学习问题上(McDonald, Hall and Mann, 2011)。

感知器使用特征向量来表示的前馈神经网络,它是一种二元分类器,把矩阵上的输入 x {displaystyle x} (实数值向量)映射到输出值 f ( x ) {displaystyle f(x)} 上(一个二元的值)。

w {displaystyle w} 是实数的表示权重的向量, w x {displaystyle wcdot x} 是点积。 b {displaystyle b} 是偏置,一个不依赖于任何输入值的常数。偏置可以认为是激励函数的偏移量,或者给神经元一个基础活跃等级。

f ( x ) {displaystyle f(x)} (0或1)用于对 x {displaystyle x} 进行分类,看它是肯定的还是否定的,这属于二元分类问题。如果 b {displaystyle b} 是负的,那么加权后的输入必须产生一个肯定的值并且大于 b {displaystyle -b} ,这样才能令分类神经元大于阈值0。从空间上看,偏置改变了决策边界的位置(虽然不是定向的)。

由于输入直接经过权重关系转换为输出,所以感知器可以被视为最简单形式的前馈式人工神经网络。

设有 n {displaystyle n} 维输入的单个感知机(如右图示), a 1 {displaystyle {a}_{1}} a n {displaystyle {a}_{n}} n {displaystyle n} 维输入向量的各个分量, w 1 {displaystyle {w}_{1}} w n {displaystyle {w}_{n}} 为各个输入分量连接到感知机的权量(或称权值), b {displaystyle {b}} 为偏置, f ( . ) {displaystyle f(.)} 为激活函数(又曰激励函数或传递函数), t {displaystyle t} 为标量输出。输出 t {displaystyle t} 的数学描述为:

: t = f ( i = 1 n w i x i + b ) = f ( w T x ) {displaystyle t=f(sum _{i=1}^{n}{{w}_{i}{x}_{i}+b})=f(mathbf {w} ^{T}mathbf {x} )}

 

 

 

 

(1)

其中 w = T {displaystyle mathbf {w} =^{T}} x = T {displaystyle mathbf {x} =^{T}} f ( x ) {displaystyle f(x)} 为反对称的符号函数,其定义为:

: f ( n ) = { + 1 if  n 0 1 otherwise {displaystyle f(n)={begin{cases}+1&{text{if }}ngeq 0\-1&{text{otherwise}}end{cases}}}

 

 

 

 

(2)

从式(1)可知,偏置被引申为权量,而对应的输入值为 1 {displaystyle 1} 。故,一感知机的输出行为是求得输入向量与权向量的内积后,经一个激活函数所得一个标量结果。

设输入向量与权向量的内积为零,可得出 ( n + 1 ) {displaystyle (n+1)} 维的超平面。平面的法向量为 w {displaystyle mathbf {w} } ,并经过 ( n + 1 ) {displaystyle (n+1)} 维输入空间的原点。法向量指向的输入空间,其输出值为 + 1 {displaystyle +1} ,而与法向量反向的输入空间,其输出值则为 1 {displaystyle -1} 。故可知这个超平面定义了决策边界,并把输入空间划分为二。

设一训练集为 D = { ( p 1 , t 1 ) , , ( p m , t m ) } {displaystyle D={(mathbf {p} _{1},;t_{1}),;dots ;,(mathbf {p} _{m},;t_{m})}} ,其中 p i {displaystyle mathbf {p} _{i}} 表示输入,而 t i {displaystyle {t}_{i}} 是对应的目标输出。由于符号函数的不连续性,如果采用标准的均方误差,所得误差函数必然是不连续的,因而基于梯度的学习算法也就不能被使用。为此,Rosenblatt提出了感知机准则函数:

: E ( w ) = p i M ( w T p i ) t i {displaystyle E(mathbf {w} )=-sum _{mathbf {p} _{i}in M}^{}{(mathbf {w} ^{T}mathbf {p} _{i});{t}_{i}}}

 

 

 

 

(3)

其中 M {displaystyle M} 是被当前 w {displaystyle mathbf {w} } 错误分类的的输入向量集合。当 w T p i 0 {displaystyle mathbf {w} ^{T}mathbf {p} _{i}geq 0} 时, t i {displaystyle {t}_{i}} 1 {displaystyle -1} ,而当 w T p i < 0 {displaystyle mathbf {w} ^{T}mathbf {p} _{i}<0} 时, t i {displaystyle {t}_{i}} + 1 {displaystyle +1} 。故,误差函数 E ( w ) {displaystyle E(mathbf {w} )} 是一组正数的和,又或当训练集里所有输入都被正确分类时,等于零。

学习算法对于所有的神经元都是一样的,因此下面所有东西都要独立的应用于每个神经元。我们首先定义一些变量:

更进一步,为了简便我们假定偏置量 b {displaystyle b} 等于0。因为一个额外的维 n + 1 {displaystyle n+1} 维,可以用 x ( n + 1 ) = 1 {displaystyle x(n+1)=1} 的形式加到输入向量,这样我们就可以用 w ( n + 1 ) {displaystyle w(n+1)} 代替偏置量。

感知器的学习通过对所有训练实例进行多次的迭代进行更新的方式来建模。令 D m = { ( x 1 , y 1 ) , , ( x m , y m ) } {displaystyle D_{m}={(x_{1},y_{1}),dots ,(x_{m},y_{m})}} 表示一个有 m {displaystyle m} 个训练实例的训练集。

每次迭代权重向量以如下方式更新:

对于每个 D m = { ( x 1 , y 1 ) , , ( x m , y m ) } {displaystyle D_{m}={(x_{1},y_{1}),dots ,(x_{m},y_{m})}} 中的每个 ( x , y ) {displaystyle (x,y)} 对,

注意这意味着,仅当针对给定训练实例 ( x , y ) {displaystyle (x,y)} 产生的输出值 f ( x ) {displaystyle f(x)} 与预期的输出值 y {displaystyle y} 不同时,权重向量才会发生改变。

如果存在一个正的常数 γ {displaystyle gamma } 和权重向量 w {displaystyle w} ,对所有的 i {displaystyle i} 满足 y i ( w , x i + b ) > γ {displaystyle y_{i}cdot left(langle w,x_{i}rangle +bright)>gamma } ,训练集 D m {displaystyle D_{m}} 就被叫被做线性分隔的。Novikoff(1962)证明如果训练集是线性分隔的,那么感知器算法可以在有限次迭代后收敛,错误的数量由 ( 2 R γ ) 2 {displaystyle left({frac {2R}{gamma }}right)^{2}} 限定,其中 R {displaystyle R} 为输入向量的最大平均值。

然而,如果训练集不是线性分隔的,那么这个算法则不能确保会收敛。

相关

  • 针织编织,在广意上是指将线状或条状的材料,经过重复交叠过程,形成一个平面或立体的技术,透过编织制作出来的作品,称作编织物或编织品。而在狭意上来说,编织是被指作利用纱线,重复交叠型
  • 阿巴斯·奇亚罗斯塔米阿巴斯·基亚罗斯塔米(波斯语:عباس کیارستمی‎ ,英语:Abbas Kiarostami,1940年6月22日-2016年7月4日),生于德黑兰,是伊朗革命后最有影响力和最引起争论的电影导演、编剧
  • 原台南州立农事试验场办公厅舍原台南州立农事试验场办公厅舍,为日治时期台南州从事农业相关的研究与试验的机构的农事试验场办公厅舍,1923年设立于台南市竹篙厝,现今台南市东区的西侧。台南州立农事试验场在
  • 电信公司电信公司,又称电讯公司,是电信服务业,包括通信服务公司。电信公司是资金集中式(Capital intensity)的服务业,最大的资本投资是实质的电话网络及电信设备。由于电信是一个国家、地
  • 大星天蛾大星天蛾(学名:)是鳞翅目天蛾科的一种,成虫翅长45毫米,体翅暗黄色,有金色光泽。肩板外缘有白色细纹,胸背中央有“八”字形白色纹。腹部背线为棕黄色斑点,两侧各有一行白褐色圆点。前
  • 里斯托·吕蒂里斯托·海基·吕蒂(芬兰语:Risto Heikki Ryti,1889年2月3日胡伊蒂宁 - 1956年10月25日赫尔辛基),芬兰政治家,芬兰民族进步党成员,曾任芬兰总理和芬兰总统。1941年6月25日带领芬兰
  • 崔潮崔潮(1882年?月?日-?年?月?日),字洵生,山西省赵城县人,宣统二年农科进士,曾留学日本学校。
  • 玛格丽塔岛坐标:11°00′N 64°10′W / 11.000°N 64.167°W / 11.000; -64.167玛格丽塔岛(西班牙语:Isla de Margarita)位于加勒比海,面积920平方公里,属委内瑞拉的新埃斯帕塔州管辖,首府拉
  • 联邦军联邦军(Union Army),美国南北战争(美国内战)时期泛指北方联邦方面军队,亦称北军(Northern Army)、联邦陆军(Federal Army)、洋基佬(the Yankees)(南军以该词贬损和称呼北军)等。在美国南北战争期间,联邦军作战的最高目标是击败联盟军,保卫美国国家统一。联邦陆军最终有效地保卫了一个持续有效、完整的共和国。它主要由北方未脱离联邦的美军正规军、义务役官兵、国民兵兵员以及南方反对奴隶制、要求联邦统一的志愿兵组成。在战争期间联邦总共招募了2,128,948名联邦军士兵,其
  • 鲁道夫·芬茨鲁道夫·芬茨(Rudolph Fentz,亦作Rudolf Fenz)是1952年杰克·芬利科幻短篇小说作品《I'm Scared》的主要角色,并于后来在都市传说之中被描写得绘声绘影。 这个故事讲述了一个19世纪风格打扮的年轻人忽然现身于1951年的时代广场路口中央,并在困惑之间遭迎面而来的车辆撞死;随后,警察在他身上发现了19世纪的物品,显示其或许不由自主地时间旅行了将近一个世纪。鲁道夫·芬茨的故事成为20世纪70年代重要的都市传奇之一,并且自那时开始被间歇提起;随着互联网在20世纪90年代普及,该故事