图像自动标注

✍ dations ◷ 2025-07-24 18:01:38 #人工智能应用,计算机视觉应用

图像自动标注是由计算机系统自动通过图片说明或关键词的形式分配元数据给一张数字图像的过程。这个计算机视觉技术的应用被用在图像检索系统来对数据库组织和定位感兴趣的图像。

这种方法可以被看作是一种具有非常大量类别(有词汇量那么大)的多元分类的图像分类问题。通常,提取特征向量和训练标注单词的图像分析使用机器学习技术来尝试对新图像自动标注标签。刚开始的方法学习图像的特征和训练标签之间的相关性,之后技术发展为使用机器翻译尝试翻译带“视觉词汇”的文本词汇,或聚集区域。遵循这些努力的工作包括分类方法、相关模型等。

与基于内容的图像检索相比,自动图像标注的优点是,查询可以由用户更自然地指定。基于内容的图像检索通常(目前)需要用户去通过图像的概念进行搜索,如颜色和纹理,或查找示例查询。在示例图像中的某些图像特征可能会覆盖用户真正关注的概念。图像检索的传统方法,如被库使用的,依赖于手动标注的图像,而这是昂贵和费时的,尤其是给定大量不断增长的图像数据库。

有些标注引擎是在线的,其中包括宾夕法尼亚州立大学研究人员开发的ALIPR.com实时标记引擎和Behold图像搜索。

相关

  • 朗罕氏巨细胞朗罕氏巨细胞(英语:Langhans giant cells,又称Pirogov-Langhans cells,也译作:langhans巨细胞、朗汉斯细胞)是在肉芽肿组织下发现的一类多核巨细胞。它体积大,胞浆宽,着粉红色,胞核从
  • 希克苏鲁伯陨石坑希克苏鲁伯陨石坑(西班牙语:Cráter de Chicxulub),又译奇虚乐陨石坑或契克苏勒伯陨石坑,是一个位在墨西哥尤卡坦半岛的撞击陨石坑,埋藏在地表之下。这个陨石坑的名称,取自于陨石坑
  • 美国人口调查局美国普查局(英语:United States Census Bureau,按《美国法典第13卷 § 11》官方称呼为Bureau of the Census)是美国商务部经济和统计管理局下属的一个机关。它的任务由美国宪
  • 僧伽罗语僧伽罗语(සිංහල),是斯里兰卡的官方语言之一。是占斯里兰卡大多数人口的僧伽罗人的语言;使用人口大约一千九百万。从1956年开始,僧伽罗语及泰米尔语同时都是《斯里兰卡宪法》
  • 花园夜市花园夜市(官方英语名称:Tainan Flowers Night Market),为台湾台南市北区的流动型夜市,每周四、六、日营业,花园夜市历史虽不如其他台湾夜市拥有悠久历史,但在短时间内却发展成今日
  • 巴基斯坦穆斯林联盟巴基斯坦政府与政治 系列条目宪法巴基斯坦穆斯林联盟(乌尔都语:(پاکستان مسلم لیگ (ن‎‎)是巴基斯坦中间偏右政党,总部位于伊斯兰堡,现任领导人为纳瓦兹·谢里夫
  • 赵铁桥赵铁桥(1886年-1930年),原名猷,又名式金,四川叙永县金鹅乡(今兴文县金鹅乡)人。清末民初的中国革命家,后被暗杀。赵铁桥早年就读于泸州经纬学堂(现川南师范学院),参与成立输新社。其成员
  • 三坡镇三坡镇,是中华人民共和国河北省保定市涞水县下辖的一个乡镇级行政单位。三坡镇下辖以下地区:下庄村、北禅房村、南禅房村、马各庄村、交界口村、紫石口村、上庄村、松口村、刘
  • 涡潮号列车涡潮号列车(日语:うずしお )是四国旅客铁道(JR四国)和西日本旅客铁道(JR西日本)运行的特急列车,主要运行于高松站和德岛站之间的高德线路段,少部分班次更会由高站伸延至冈山站,途经濑
  • 格温·乔根森1英里: 4:39.43 i 3000m: 9:10.12 i 5000m: 15:52.19 格温·乔根森(Gwen Rosemary Jorgensen,1986年4月25日-)是一名美国女子铁人三项运动员,参加过2012年奥运会,以1小时56分钟