虚拟助理(virtual assistant)是一种能替个人执行任务或服务的软件代理(software agent)。有时候“聊天机器人”泛指虚拟助理,亦或专指网络聊天使用的软件机器人(有时候更专指娱乐而非实用的网络聊天)。但也可以指一种职业,或者企业组织,其乃是透过网络执行远端服务。
至2017年,随着新产品进入市场,虚拟助理的功能与运用正快速扩张。一项2017年5月的线上调查显示,美国的市占率依次为苹果 Siri(34%)、Google个人助理(19%)、Amazon Alexa(6%)及微软Cortana(4%)。搭载这些助理的智慧扬声器(英语:smart speaker)也有着巨大的变化;苹果直到2017年6月才宣布其智慧扬声器。脸书的 M虚拟助理(英语:M (virtual assistant)) 预计2017年在 Facebook Messenger 上会有数亿的用量。 大量的智能手机用户安装了苹果和 Google的助理,微软则是在视窗的PC上 (Cortana 也可安装于手机和智慧扬声器);Amazon Alexa 则是首先具备线上订购的功能。
最早具备数位语音识别功能的工具是 IBM Shoebox(英语:IBM Shoebox),在1962年西雅图世界博览会向民众发表。这个早年的电脑开发比IBM个人电脑早20年,能够识别16个字以及数字0到9。语音识别的下一个里程碑出现于1970年代的卡内基美隆大学,受到美国国防部及国防高等研究计划署(DARPA)大力支持。其工具“Harpy”能够驾驭约一千字——三岁儿童的字汇。大约十年后,同一个科研团队,利用隐马尔可夫模型开发了不但能分析单一的字而且是连串词的系统。 因此早期运用语言识别的虚拟助理是自动总机(英语:automated attendant)与医疗数位答录(英语:digital dictation)软件。 1990年代,数位语音识别技术成为微软、IBM、飞利浦等个人电脑厂商争取消费者的一个卖点。之后市场于1994年推出第一个智能手机IBM Simon,为我们现在认知的智能虚拟助理奠下基础。 第一个安装于智能手机上的现代数位虚拟助理是Siri——iPhone 4S 2011年10月4日引进的新功能。 苹果公司在2010并购Siri公司后开发Siri。Siri公司是美国国防部及国防高等研究计划署出资成立的SRI International(英语:SRI International)旗下的衍生公司。
虚拟助理的作业媒介:
有些虚拟助理的使用方式多样,例如Google智能助理在Google Allo app 用文字,Google Home 智慧扬声器则用语音。
虚拟助理利用自然语言处理(NLP)从使用者的文字、语音输入,找到相应的可执行指令。许多助理利用人工智能的技巧,包括机器学习,不断学习。
用语音启动虚拟助理,可能需要用到“唤醒词”(wake word),这是一个或一组词,例如 Alexa 或者 OK Google。
虚拟助理可提供多样的服务,尤其是 Amazon Alexa 和 Google 个人助理,日新月异,包括:
Amazon Alexa 的“Skills”和 Google 的“Actions”,基本上让应用程序能够在助理平台上执行。
广泛使用的虚拟助理的平台也可用于解决其他的问题:
前代文字聊天为主的虚拟助理,通常有个代表的头像(avatar也称为“线上互动人物”或“自动化的人物”)——这叫做具体化的代理(英语:embodied agent)。
虚拟助理赋予的数位经验,被视为近来一种最主要的技术跃进,也是最有前途的消费趋势。专家声称,数位经验可以达到与真实经验同等的分量,甚至更被追求,更为看重。 这个趋势被证实于大量的经常使用者以及全球虚拟助理使用人数的巨幅增长。2017年中, 数位虚拟助理的经常用户数目,全世界估计在十亿左右。 此外可以观察到,虚拟助理技术不再限于智能手机的应用,而是跨及不同产业(包括汽车、电信、零售、医疗、和教育)。