感知器

✍ dations ◷ 2025-01-11 07:15:43 #感知器

感知器(英语:Perceptron)是弗兰克·罗森布拉特(英语:Frank Rosenblatt)在1957年就职于康奈尔航空实验室(Cornell Aeronautical Laboratory)时所发明的一种人工神经网络。它可以被视为一种最简单形式的前馈神经网络,是一种二元线性分类器。

罗森布拉特给出了相应的感知机学习算法,常用的有感知机学习、最小二乘法和梯度下降法。譬如,感知机利用梯度下降法对损失函数进行极小化,求出可将训练数据进行线性划分的分离超平面,从而求得感知机模型。

感知机是生物神经细胞的简单抽象。神经细胞结构大致可分为:树突、突触、细胞体及轴突。单个神经细胞可被视为一种只有两种状态的机器——激动时为‘是’,而未激动时为‘否’。神经细胞的状态取决于从其它的神经细胞收到的输入信号量,及突触的强度(抑制或加强)。当信号量总和超过了某个阈值时,细胞体就会激动,产生电脉冲。电脉冲沿着轴突并通过突触传递到其它神经元。为了模拟神经细胞行为,与之对应的感知机基础概念被提出,如权量(突触)、偏置(阈值)及激活函数(细胞体)。

在人工神经网络领域中,感知机也被指为单层的人工神经网络,以区别于较复杂的多层感知机(Multilayer Perceptron)。作为一种线性分类器,(单层)感知机可说是最简单的前向人工神经网络形式。尽管结构简单,感知机能够学习并解决相当复杂的问题。感知机主要的本质缺陷是它不能处理线性不可分问题。

1943年,心理学家沃伦·麦卡洛克和数理逻辑学家沃尔特·皮茨在合作的《A logical calculus of the ideas immanent in nervous activity》论文中提出并给出了人工神经网络的概念及人工神经元的数学模型,从而开创了人工神经网络研究的时代。1949年,心理学家唐纳德·赫布在《The Organization of Behavior》论文中描述了神经元学习法则——赫布型学习。

人工神经网络更进一步被美国神经学家弗兰克·罗森布拉特(英语:Frank Rosenblatt)所发展。他提出了可以模拟人类感知能力的机器,并称之为‘感知机’。1957年,在Cornell航空实验室中,他成功在IBM 704机上完成了感知机的仿真。两年后,他又成功实现了能够识别一些英文字母、基于感知机的神经计算机——Mark1,并于1960年6月23日,展示与众。

为了‘教导’感知机识别图像,罗森布拉特在Hebb学习法则的基础上,发展了一种迭代、试错、类似于人类学习过程的学习算法——感知机学习。除了能够识别出现较多次的字母,感知机也能对不同书写方式的字母图像进行概括和归纳。但是,由于本身的局限,感知机除了那些包含在训练集里的图像以外,不能对受干扰(半遮蔽、不同大小、平移、旋转)的字母图像进行可靠的识别。

首个有关感知机的成果,由罗森布拉特于1958年发表在《The Perceptron: A Probabilistic Model for Information Storage and Organization in the Brain》的文章里。1962年,他又出版了《Principles of Neurodynamics: Perceptrons and the theory of brain mechanisms》一书,向大众深入解释感知机的理论知识及背景假设。此书介绍了一些重要的概念及定理证明,例如感知机收敛定理。

虽然最初被认为有着良好的发展潜能,但感知机最终被证明不能处理诸多的模式识别问题。1969年,马文·闵斯基和西摩尔·派普特在《Perceptrons》书中,仔细分析了以感知机为代表的单层神经网络系统的功能及局限,证明感知机不能解决简单的异或(XOR)等线性不可分问题,但罗森布拉特和闵斯基及派普特等人在当时已经了解到多层神经网络能够解决线性不可分的问题。

由于罗森布拉特等人没能够及时推广感知机学习算法到多层神经网络上,又由于《Perceptrons》在研究领域中的巨大影响,及人们对书中论点的误解,造成了人工神经领域发展的长年停滞及低潮,直到人们认识到多层感知机没有单层感知机固有的缺陷及反向传播算法在80年代的提出,才有所恢复。1987年,书中的错误得到了校正,并更名再版为《Perceptrons - Expanded Edition》。

近年,在Freund及Schapire(1998)使用核技巧改进感知机学习算法之后,愈来愈多的人对感知机学习算法产生兴趣。后来的研究表明除了二元分类,感知机也能应用在较复杂、被称为structured learning类型的任务上(Collins, 2002),又或使用在分布式计算环境中的大规模机器学习问题上(McDonald, Hall and Mann, 2011)。

感知器使用特征向量来表示的前馈神经网络,它是一种二元分类器,把矩阵上的输入 x {displaystyle x} (实数值向量)映射到输出值 f ( x ) {displaystyle f(x)} 上(一个二元的值)。

w {displaystyle w} 是实数的表示权重的向量, w x {displaystyle wcdot x} 是点积。 b {displaystyle b} 是偏置,一个不依赖于任何输入值的常数。偏置可以认为是激励函数的偏移量,或者给神经元一个基础活跃等级。

f ( x ) {displaystyle f(x)} (0或1)用于对 x {displaystyle x} 进行分类,看它是肯定的还是否定的,这属于二元分类问题。如果 b {displaystyle b} 是负的,那么加权后的输入必须产生一个肯定的值并且大于 b {displaystyle -b} ,这样才能令分类神经元大于阈值0。从空间上看,偏置改变了决策边界的位置(虽然不是定向的)。

由于输入直接经过权重关系转换为输出,所以感知器可以被视为最简单形式的前馈式人工神经网络。

设有 n {displaystyle n} 维输入的单个感知机(如右图示), a 1 {displaystyle {a}_{1}} a n {displaystyle {a}_{n}} n {displaystyle n} 维输入向量的各个分量, w 1 {displaystyle {w}_{1}} w n {displaystyle {w}_{n}} 为各个输入分量连接到感知机的权量(或称权值), b {displaystyle {b}} 为偏置, f ( . ) {displaystyle f(.)} 为激活函数(又曰激励函数或传递函数), t {displaystyle t} 为标量输出。输出 t {displaystyle t} 的数学描述为:

: t = f ( i = 1 n w i x i + b ) = f ( w T x ) {displaystyle t=f(sum _{i=1}^{n}{{w}_{i}{x}_{i}+b})=f(mathbf {w} ^{T}mathbf {x} )}

 

 

 

 

(1)

其中 w = T {displaystyle mathbf {w} =^{T}} x = T {displaystyle mathbf {x} =^{T}} f ( x ) {displaystyle f(x)} 为反对称的符号函数,其定义为:

: f ( n ) = { + 1 if  n 0 1 otherwise {displaystyle f(n)={begin{cases}+1&{text{if }}ngeq 0\-1&{text{otherwise}}end{cases}}}

 

 

 

 

(2)

从式(1)可知,偏置被引申为权量,而对应的输入值为 1 {displaystyle 1} 。故,一感知机的输出行为是求得输入向量与权向量的内积后,经一个激活函数所得一个标量结果。

设输入向量与权向量的内积为零,可得出 ( n + 1 ) {displaystyle (n+1)} 维的超平面。平面的法向量为 w {displaystyle mathbf {w} } ,并经过 ( n + 1 ) {displaystyle (n+1)} 维输入空间的原点。法向量指向的输入空间,其输出值为 + 1 {displaystyle +1} ,而与法向量反向的输入空间,其输出值则为 1 {displaystyle -1} 。故可知这个超平面定义了决策边界,并把输入空间划分为二。

设一训练集为 D = { ( p 1 , t 1 ) , , ( p m , t m ) } {displaystyle D={(mathbf {p} _{1},;t_{1}),;dots ;,(mathbf {p} _{m},;t_{m})}} ,其中 p i {displaystyle mathbf {p} _{i}} 表示输入,而 t i {displaystyle {t}_{i}} 是对应的目标输出。由于符号函数的不连续性,如果采用标准的均方误差,所得误差函数必然是不连续的,因而基于梯度的学习算法也就不能被使用。为此,Rosenblatt提出了感知机准则函数:

: E ( w ) = p i M ( w T p i ) t i {displaystyle E(mathbf {w} )=-sum _{mathbf {p} _{i}in M}^{}{(mathbf {w} ^{T}mathbf {p} _{i});{t}_{i}}}

 

 

 

 

(3)

其中 M {displaystyle M} 是被当前 w {displaystyle mathbf {w} } 错误分类的的输入向量集合。当 w T p i 0 {displaystyle mathbf {w} ^{T}mathbf {p} _{i}geq 0} 时, t i {displaystyle {t}_{i}} 1 {displaystyle -1} ,而当 w T p i < 0 {displaystyle mathbf {w} ^{T}mathbf {p} _{i}<0} 时, t i {displaystyle {t}_{i}} + 1 {displaystyle +1} 。故,误差函数 E ( w ) {displaystyle E(mathbf {w} )} 是一组正数的和,又或当训练集里所有输入都被正确分类时,等于零。

学习算法对于所有的神经元都是一样的,因此下面所有东西都要独立的应用于每个神经元。我们首先定义一些变量:

更进一步,为了简便我们假定偏置量 b {displaystyle b} 等于0。因为一个额外的维 n + 1 {displaystyle n+1} 维,可以用 x ( n + 1 ) = 1 {displaystyle x(n+1)=1} 的形式加到输入向量,这样我们就可以用 w ( n + 1 ) {displaystyle w(n+1)} 代替偏置量。

感知器的学习通过对所有训练实例进行多次的迭代进行更新的方式来建模。令 D m = { ( x 1 , y 1 ) , , ( x m , y m ) } {displaystyle D_{m}={(x_{1},y_{1}),dots ,(x_{m},y_{m})}} 表示一个有 m {displaystyle m} 个训练实例的训练集。

每次迭代权重向量以如下方式更新:

对于每个 D m = { ( x 1 , y 1 ) , , ( x m , y m ) } {displaystyle D_{m}={(x_{1},y_{1}),dots ,(x_{m},y_{m})}} 中的每个 ( x , y ) {displaystyle (x,y)} 对,

注意这意味着,仅当针对给定训练实例 ( x , y ) {displaystyle (x,y)} 产生的输出值 f ( x ) {displaystyle f(x)} 与预期的输出值 y {displaystyle y} 不同时,权重向量才会发生改变。

如果存在一个正的常数 γ {displaystyle gamma } 和权重向量 w {displaystyle w} ,对所有的 i {displaystyle i} 满足 y i ( w , x i + b ) > γ {displaystyle y_{i}cdot left(langle w,x_{i}rangle +bright)>gamma } ,训练集 D m {displaystyle D_{m}} 就被叫被做线性分隔的。Novikoff(1962)证明如果训练集是线性分隔的,那么感知器算法可以在有限次迭代后收敛,错误的数量由 ( 2 R γ ) 2 {displaystyle left({frac {2R}{gamma }}right)^{2}} 限定,其中 R {displaystyle R} 为输入向量的最大平均值。

然而,如果训练集不是线性分隔的,那么这个算法则不能确保会收敛。

相关

  • 热带热带,(英语:Tropics)的广义是指地球上南、北回归线(南、北纬23度26分)之间的地区的总称,但在气候方面一般会进一步区分出赤道热带和亚热带,无极昼极夜现象。热带有时从气候上定义,指
  • 质子﹣质子链反应质子﹣质子链反应是恒星内部将氢融合成氦的几种核聚变反应中的一种,另一种主要的反应是碳氮氧循环。质子﹣质子链反应在太阳或更小的恒星上占有主导的地位。克服两个氢原子核之间
  • span class=nowrapCoClsub2/sub/spanN7791-13-1(六水合物)  N氯化钴,常称氯化亚钴、二氯化钴或氯化钴(I),化学式为CoCl2;无水的氯化钴呈蓝色,它的水合物很多,常见者为粉红色的六水合氯化钴CoCl2·6H2O;无水物具吸湿性
  • 浮华世界《名利场》(Vanity Fair: A Novel without a Hero)是英国小说家威廉·梅克比斯·萨克雷的讽刺小说,于1847年出版,并曾多次改编成电影与电视剧,生性狡诈虚荣的女主人翁利蓓加·夏
  • 宣皇后喜塔喇氏宣皇后(16世纪-1569年),昂果都理巴颜系喜塔腊氏出身,满洲译名额穆齐(满语:ᡝᠮᡝᠴᡳ,穆麟德:Emeci,太清:Emeqi。宣皇帝塔克世的嫡妻,清太祖努尔哈赤的生母。宣皇后是昂果都理巴颜长子都
  • 微扰反常反常(anomaly)是指经典守恒定律在量子论中的破坏,其著名例子是量子场论中的轴矢流反常(或称为三角反常,Adler-Bell-Jackiw反常)。在量子场论模型中,如果规范对称性出现反常,则意味着
  • 忍者司令《忍者司令》(法语:)是一部2018年法国武侠科幻动作喜剧片,由本杰明·康斯(Benjamin Combes)执导、监制、编剧、摄影和剪辑。该片是向1980年代的动作片致敬,如《终结者》(1984年)、《
  • 沈瑜庆沈瑜庆(1858年12月4日-1918年10月6日),字志雨,号爱苍,别号涛园,福建省侯官县人,沈葆桢第四子,为同光体闽派诗人'。辛亥革命时交出贵州政权,1918年九月初二日卒,宣统帝谥为敬裕。长女沈
  • 钟楼爱人周汤豪、孟耿如、黄薇渟、张捷大川大立数位影音公司《钟楼爱人》(英语:),2017年东森电视自制戏剧系列之第八部作品。是东森第一部穿越剧。由周汤豪、孟耿如、黄薇渟、张捷领衔主
  • 钱德勒福特枪击案钱德勒福特枪击案是2007年9月13日南英格兰南安普敦附近小镇钱德勒福特发生的抢劫未遂案,警方行动代号赫洛克行动,伦敦警察厅警员枪杀持枪抢劫现金运输车的两名男子。伦敦警察厅机动警察队一直在追查南伦敦武装劫匪团伙,估计这帮人已18次抢劫保安车,抢走50万英镑。机动警察队从线报得知该团伙已选中钱德勒福特的汇丰分行,决定守株待兔,当场抓获抢劫嫌犯。武装警察9月13日清晨抵达钱德勒福特,藏身银行附近的公共厕所,附近高楼有狙击手支援。上午十点零五分,戴面罩的马克·努内斯在G4S现金运输车抵达后不久靠近警卫,用枪口要