图像自动标注

✍ dations ◷ 2024-09-20 17:52:58 #人工智能应用,计算机视觉应用

图像自动标注是由计算机系统自动通过图片说明或关键词的形式分配元数据给一张数字图像的过程。这个计算机视觉技术的应用被用在图像检索系统来对数据库组织和定位感兴趣的图像。

这种方法可以被看作是一种具有非常大量类别(有词汇量那么大)的多元分类的图像分类问题。通常,提取特征向量和训练标注单词的图像分析使用机器学习技术来尝试对新图像自动标注标签。刚开始的方法学习图像的特征和训练标签之间的相关性,之后技术发展为使用机器翻译尝试翻译带“视觉词汇”的文本词汇,或聚集区域。遵循这些努力的工作包括分类方法、相关模型等。

与基于内容的图像检索相比,自动图像标注的优点是,查询可以由用户更自然地指定。基于内容的图像检索通常(目前)需要用户去通过图像的概念进行搜索,如颜色和纹理,或查找示例查询。在示例图像中的某些图像特征可能会覆盖用户真正关注的概念。图像检索的传统方法,如被库使用的,依赖于手动标注的图像,而这是昂贵和费时的,尤其是给定大量不断增长的图像数据库。

有些标注引擎是在线的,其中包括宾夕法尼亚州立大学研究人员开发的ALIPR.com实时标记引擎和Behold图像搜索。

相关

  • 亚历山大·伏打电池 甲烷 伏特 电势物理学亚历山德罗·朱塞佩·安东尼奥·阿纳斯塔西奥·伏打(意大利语:Alessandro Giuseppe Antonio Anastasio Volta,1745年2月18日-1827年3月5日),意大利物理
  • 角色角色(拼音:jué sè或jiǎo sè),或称虚构角色。是在叙事艺术作品描绘的人,演员根据剧本演绎的人物或漫画作品中的登场人物往往也被称作人物。故事的载体可以是小说、戏剧、动漫
  • 阅听人阅听人(英语:audience),又名传媒受众,观众,即由传播媒体接收讯息的人,讯息的来源可以是任何传播媒介,如文字、电影、 印刷媒体、电视和广播等。“阅听人”一词较常出现于台湾学术用
  • 安德烈·萨哈罗夫安德烈·德米特里耶维奇·萨哈罗夫(俄语:Андре́й Дми́триевич Са́харов,姓氏也译作沙卡洛夫,1921年5月21日-1989年12月14日),苏联原子物理学家,闻名于核
  • 强盗抢劫,亦称打劫、行抢,是指以暴力或威吓,夺取对方对某物之所有权的一种犯罪行为。抢劫是对他人的财产权、人身安全的严重侵害,也彻底背弃人类文明价值,因此各国的刑罚皆极重。。进
  • 康斯坦丁·费奥多罗维奇·卡图谢夫康斯坦丁·费奥多罗维奇·卡图谢夫(俄语:Константи́н Фёдорович Ка́тушев,1927年10月1日-2010年4月5日)是苏共中央书记处成员、苏联部长会议副主席
  • 同心绳西洋传统婚礼上的同心绳、结婚绳(wedding cord),在英文语境里也被称之为wedding lasso(同心套索、结婚套索)、wedding lazo cord(同心环绳、结婚环绳),或者称为yugal,乃是使用在一些
  • 韩鹏飞 (演员)韩鹏飞(1992年-)出生于河北省邯郸市临漳县临漳镇西南角村,豫剧演员。2008年9月参加河南电视台梨园春并夺得年度总冠军,之后便小有名气。先后就读于邯郸市第四中学和中国戏曲学院
  • 库尔 (神)其他传说在苏美尔神话中,库尔(Kur)被认为是有史以来的第一条龙,常指苏美尔东部的扎格罗斯山。楔形文字“库尔”就是一个表意符号-“山”的象形字,它也可指“异邦”。虽然“大地”
  • 核主成分分析核主成分分析(英语:kernel principal component analysis,简称kernel PCA)是多变量统计领域中的一种分析方法,是使用核方法(英语:Kernel method)对主成分分析的非线性扩展,即将原数据