感知器

✍ dations ◷ 2025-02-26 08:29:36 #感知器

感知器(英语:Perceptron)是弗兰克·罗森布拉特(英语:Frank Rosenblatt)在1957年就职于康奈尔航空实验室(Cornell Aeronautical Laboratory)时所发明的一种人工神经网络。它可以被视为一种最简单形式的前馈神经网络,是一种二元线性分类器。

罗森布拉特给出了相应的感知机学习算法,常用的有感知机学习、最小二乘法和梯度下降法。譬如,感知机利用梯度下降法对损失函数进行极小化,求出可将训练数据进行线性划分的分离超平面,从而求得感知机模型。

感知机是生物神经细胞的简单抽象。神经细胞结构大致可分为:树突、突触、细胞体及轴突。单个神经细胞可被视为一种只有两种状态的机器——激动时为‘是’,而未激动时为‘否’。神经细胞的状态取决于从其它的神经细胞收到的输入信号量,及突触的强度(抑制或加强)。当信号量总和超过了某个阈值时,细胞体就会激动,产生电脉冲。电脉冲沿着轴突并通过突触传递到其它神经元。为了模拟神经细胞行为,与之对应的感知机基础概念被提出,如权量(突触)、偏置(阈值)及激活函数(细胞体)。

在人工神经网络领域中,感知机也被指为单层的人工神经网络,以区别于较复杂的多层感知机(Multilayer Perceptron)。作为一种线性分类器,(单层)感知机可说是最简单的前向人工神经网络形式。尽管结构简单,感知机能够学习并解决相当复杂的问题。感知机主要的本质缺陷是它不能处理线性不可分问题。

1943年,心理学家沃伦·麦卡洛克和数理逻辑学家沃尔特·皮茨在合作的《A logical calculus of the ideas immanent in nervous activity》论文中提出并给出了人工神经网络的概念及人工神经元的数学模型,从而开创了人工神经网络研究的时代。1949年,心理学家唐纳德·赫布在《The Organization of Behavior》论文中描述了神经元学习法则——赫布型学习。

人工神经网络更进一步被美国神经学家弗兰克·罗森布拉特(英语:Frank Rosenblatt)所发展。他提出了可以模拟人类感知能力的机器,并称之为‘感知机’。1957年,在Cornell航空实验室中,他成功在IBM 704机上完成了感知机的仿真。两年后,他又成功实现了能够识别一些英文字母、基于感知机的神经计算机——Mark1,并于1960年6月23日,展示与众。

为了‘教导’感知机识别图像,罗森布拉特在Hebb学习法则的基础上,发展了一种迭代、试错、类似于人类学习过程的学习算法——感知机学习。除了能够识别出现较多次的字母,感知机也能对不同书写方式的字母图像进行概括和归纳。但是,由于本身的局限,感知机除了那些包含在训练集里的图像以外,不能对受干扰(半遮蔽、不同大小、平移、旋转)的字母图像进行可靠的识别。

首个有关感知机的成果,由罗森布拉特于1958年发表在《The Perceptron: A Probabilistic Model for Information Storage and Organization in the Brain》的文章里。1962年,他又出版了《Principles of Neurodynamics: Perceptrons and the theory of brain mechanisms》一书,向大众深入解释感知机的理论知识及背景假设。此书介绍了一些重要的概念及定理证明,例如感知机收敛定理。

虽然最初被认为有着良好的发展潜能,但感知机最终被证明不能处理诸多的模式识别问题。1969年,马文·闵斯基和西摩尔·派普特在《Perceptrons》书中,仔细分析了以感知机为代表的单层神经网络系统的功能及局限,证明感知机不能解决简单的异或(XOR)等线性不可分问题,但罗森布拉特和闵斯基及派普特等人在当时已经了解到多层神经网络能够解决线性不可分的问题。

由于罗森布拉特等人没能够及时推广感知机学习算法到多层神经网络上,又由于《Perceptrons》在研究领域中的巨大影响,及人们对书中论点的误解,造成了人工神经领域发展的长年停滞及低潮,直到人们认识到多层感知机没有单层感知机固有的缺陷及反向传播算法在80年代的提出,才有所恢复。1987年,书中的错误得到了校正,并更名再版为《Perceptrons - Expanded Edition》。

近年,在Freund及Schapire(1998)使用核技巧改进感知机学习算法之后,愈来愈多的人对感知机学习算法产生兴趣。后来的研究表明除了二元分类,感知机也能应用在较复杂、被称为structured learning类型的任务上(Collins, 2002),又或使用在分布式计算环境中的大规模机器学习问题上(McDonald, Hall and Mann, 2011)。

感知器使用特征向量来表示的前馈神经网络,它是一种二元分类器,把矩阵上的输入 x {displaystyle x} (实数值向量)映射到输出值 f ( x ) {displaystyle f(x)} 上(一个二元的值)。

w {displaystyle w} 是实数的表示权重的向量, w x {displaystyle wcdot x} 是点积。 b {displaystyle b} 是偏置,一个不依赖于任何输入值的常数。偏置可以认为是激励函数的偏移量,或者给神经元一个基础活跃等级。

f ( x ) {displaystyle f(x)} (0或1)用于对 x {displaystyle x} 进行分类,看它是肯定的还是否定的,这属于二元分类问题。如果 b {displaystyle b} 是负的,那么加权后的输入必须产生一个肯定的值并且大于 b {displaystyle -b} ,这样才能令分类神经元大于阈值0。从空间上看,偏置改变了决策边界的位置(虽然不是定向的)。

由于输入直接经过权重关系转换为输出,所以感知器可以被视为最简单形式的前馈式人工神经网络。

设有 n {displaystyle n} 维输入的单个感知机(如右图示), a 1 {displaystyle {a}_{1}} a n {displaystyle {a}_{n}} n {displaystyle n} 维输入向量的各个分量, w 1 {displaystyle {w}_{1}} w n {displaystyle {w}_{n}} 为各个输入分量连接到感知机的权量(或称权值), b {displaystyle {b}} 为偏置, f ( . ) {displaystyle f(.)} 为激活函数(又曰激励函数或传递函数), t {displaystyle t} 为标量输出。输出 t {displaystyle t} 的数学描述为:

: t = f ( i = 1 n w i x i + b ) = f ( w T x ) {displaystyle t=f(sum _{i=1}^{n}{{w}_{i}{x}_{i}+b})=f(mathbf {w} ^{T}mathbf {x} )}

 

 

 

 

(1)

其中 w = T {displaystyle mathbf {w} =^{T}} x = T {displaystyle mathbf {x} =^{T}} f ( x ) {displaystyle f(x)} 为反对称的符号函数,其定义为:

: f ( n ) = { + 1 if  n 0 1 otherwise {displaystyle f(n)={begin{cases}+1&{text{if }}ngeq 0\-1&{text{otherwise}}end{cases}}}

 

 

 

 

(2)

从式(1)可知,偏置被引申为权量,而对应的输入值为 1 {displaystyle 1} 。故,一感知机的输出行为是求得输入向量与权向量的内积后,经一个激活函数所得一个标量结果。

设输入向量与权向量的内积为零,可得出 ( n + 1 ) {displaystyle (n+1)} 维的超平面。平面的法向量为 w {displaystyle mathbf {w} } ,并经过 ( n + 1 ) {displaystyle (n+1)} 维输入空间的原点。法向量指向的输入空间,其输出值为 + 1 {displaystyle +1} ,而与法向量反向的输入空间,其输出值则为 1 {displaystyle -1} 。故可知这个超平面定义了决策边界,并把输入空间划分为二。

设一训练集为 D = { ( p 1 , t 1 ) , , ( p m , t m ) } {displaystyle D={(mathbf {p} _{1},;t_{1}),;dots ;,(mathbf {p} _{m},;t_{m})}} ,其中 p i {displaystyle mathbf {p} _{i}} 表示输入,而 t i {displaystyle {t}_{i}} 是对应的目标输出。由于符号函数的不连续性,如果采用标准的均方误差,所得误差函数必然是不连续的,因而基于梯度的学习算法也就不能被使用。为此,Rosenblatt提出了感知机准则函数:

: E ( w ) = p i M ( w T p i ) t i {displaystyle E(mathbf {w} )=-sum _{mathbf {p} _{i}in M}^{}{(mathbf {w} ^{T}mathbf {p} _{i});{t}_{i}}}

 

 

 

 

(3)

其中 M {displaystyle M} 是被当前 w {displaystyle mathbf {w} } 错误分类的的输入向量集合。当 w T p i 0 {displaystyle mathbf {w} ^{T}mathbf {p} _{i}geq 0} 时, t i {displaystyle {t}_{i}} 1 {displaystyle -1} ,而当 w T p i < 0 {displaystyle mathbf {w} ^{T}mathbf {p} _{i}<0} 时, t i {displaystyle {t}_{i}} + 1 {displaystyle +1} 。故,误差函数 E ( w ) {displaystyle E(mathbf {w} )} 是一组正数的和,又或当训练集里所有输入都被正确分类时,等于零。

学习算法对于所有的神经元都是一样的,因此下面所有东西都要独立的应用于每个神经元。我们首先定义一些变量:

更进一步,为了简便我们假定偏置量 b {displaystyle b} 等于0。因为一个额外的维 n + 1 {displaystyle n+1} 维,可以用 x ( n + 1 ) = 1 {displaystyle x(n+1)=1} 的形式加到输入向量,这样我们就可以用 w ( n + 1 ) {displaystyle w(n+1)} 代替偏置量。

感知器的学习通过对所有训练实例进行多次的迭代进行更新的方式来建模。令 D m = { ( x 1 , y 1 ) , , ( x m , y m ) } {displaystyle D_{m}={(x_{1},y_{1}),dots ,(x_{m},y_{m})}} 表示一个有 m {displaystyle m} 个训练实例的训练集。

每次迭代权重向量以如下方式更新:

对于每个 D m = { ( x 1 , y 1 ) , , ( x m , y m ) } {displaystyle D_{m}={(x_{1},y_{1}),dots ,(x_{m},y_{m})}} 中的每个 ( x , y ) {displaystyle (x,y)} 对,

注意这意味着,仅当针对给定训练实例 ( x , y ) {displaystyle (x,y)} 产生的输出值 f ( x ) {displaystyle f(x)} 与预期的输出值 y {displaystyle y} 不同时,权重向量才会发生改变。

如果存在一个正的常数 γ {displaystyle gamma } 和权重向量 w {displaystyle w} ,对所有的 i {displaystyle i} 满足 y i ( w , x i + b ) > γ {displaystyle y_{i}cdot left(langle w,x_{i}rangle +bright)>gamma } ,训练集 D m {displaystyle D_{m}} 就被叫被做线性分隔的。Novikoff(1962)证明如果训练集是线性分隔的,那么感知器算法可以在有限次迭代后收敛,错误的数量由 ( 2 R γ ) 2 {displaystyle left({frac {2R}{gamma }}right)^{2}} 限定,其中 R {displaystyle R} 为输入向量的最大平均值。

然而,如果训练集不是线性分隔的,那么这个算法则不能确保会收敛。

相关

  • SOCCSKSARGENSOCCSKSARGEN(或SoCCSKSarGen)是菲律宾的一个大区,位于菲律宾棉兰老岛的中部,编号XII。面积14,373km²,人口2,598,210。SOCCSKSARGEN旧称中棉兰老大区,在加入一个原属南棉兰老大区
  • 黔南民族师范学院黔南民族师范学院黔南民族师范学院,位于贵州省都匀市北开发区,前身为黔南民族师范专科学校,2000年3月28日,经国家教育部教发57号文件批准黔南民族师范专科学校、黔南教育学院、
  • 费奥多尔·亚历山德罗维奇·阿勃拉莫夫费奥多尔·亚历山德罗维奇·阿勃拉莫夫(俄语:Фёдор Александрович Абрамов, 1920年2月29日-1983年5月),苏联作家。他的小说以自己农村生活的深入观察
  • 急救超人兵团《急救超人兵团》(住めば都のコスモス荘)是日本作家阿智太郎的轻小说,其插画和改编漫画是由漫画家矢上裕负责,在2003年7月到9月播出电视动画作品。由乡下到城市念书的一般专校学
  • 陈桱陈桱,字子经,浙江四明(今属浙江宁波余姚)人。明朝初年政治人物。曾祖父陈德刚,南宋工部尚书。祖父陈著与文天祥同榜进士,官太学博士,上书论贾似道奸佞,出判临安府。父陈泌,曾担任校官
  • 瓦莱丽雅·布鲁尼-特德斯奇瓦莱丽雅·布鲁尼·特德斯奇(意大利语:Valeria Bruni Tedeschi,1964年11月16日-),生于意大利都灵,意大利女演员,萨科齐夫人卡拉·布鲁尼同母异父的姐姐。
  • 雅典农业大学雅典农业大学(希腊语: Γεωπονικό Πανεπιστήμιο Αθηνών),为希腊雅典市的一所公立大学。该大学创办于1920年,以农业科学为主要特色。学校占地面积25
  • Dominion自治领(英语:Dominion)指大英帝国的殖民地制度下一个特殊的国家体制,此外还可以指:
  • 乔治·弗洛伊德乔治·弗洛伊德(英语:George Floyd,1973年10月14日-2020年5月25日),非裔美国人,出生于费耶特维尔,2020年5月被三名滥用职权的警员(分别为德里克·肖万、杜涛及J·亚历山大·金)暴力执法致死。乔治·佩里·弗洛伊德出生于北卡罗莱纳州费耶特维尔。2岁父母离异并跟随母亲生活,后来他母亲认识未婚夫。婚后,他们脱离贫苦的生活。乔治有五名子女,每天早餐都会吃香蕉跟美乃滋面包。2020年5月25日傍晚8时许,乔治在Cup Foods便利商店使用疑似假钞的20美元购买香烟,但给女店员拨打911
  • 数码迷彩数码迷彩(英语:Digital camouflage)是一种融合了微观和宏观模式的,运用电脑辅助设计而成的新式迷彩,常常由像素样的方点组成。从分形原理上说,这种迷彩提供多种观察尺度(相应地,多种距离)下的伪装。在红外探测和夜视镜下,数码迷彩因其复杂的设计,在隐蔽上比传统的迷彩具有更大的优势。数码迷彩并非全为像素构成;像素化本身也并不一定能提供优势。美国西点军校的教授Timothy R. O'Neill中校是最早注意到此迷彩效果的人。20世纪70年代,美国陆军曾研究过数码迷彩,但没有重视。1978年到80年