Lingua Libre是法国维基媒体协会创建的一个在线协作项目与工具,用以创建使用使用自由授权条款的协作、多语言、视听语料库。
Lingua Libre可以录制任何语言的单字、短语或句子,包含口语(录音)或手语(录影)。
单字以列表的形式呈现给要录制语音的人,该列表可能会是即时制作或是提前制作,又或是使用既有的维基媒体分类。录制语音的人只需要念出屏幕上显示的单字,当软件侦测到念完单字后的沉默时,就会跳到下一个单字。这个行为是在其创建者,Nicolas Vion,的协助下从开放源代码软件Shtooka录制程序处借用,使得每小时录制数百个单字成为可能。然后录音会自动从网页客户端上传至维基共享资源媒体库。
2021年春季,Lingua Libre因史特拉斯堡发生火灾而离线,但并未丢失任何录音。
可在Lingua Libre或维基共享资源上查阅录音。其主要用于其他维基媒体项目,例如用来说明维基词典中的条目或是维基百科文章中的专有名词。
并可在语言教学环境中重复使用录音,语言学习者可以免费下载发音并在流行的词典软件GoldenDict上使用。因此,此处的录音可在GoldenDict上作为“发音词典”使用,而不需要互联网连线。
这些录音也会在自然语言处理项目中重复使用,例如用来驱动Mozilla的DeepSpeech语音识别引擎。
Lingua Libre于2015年1月23日启动,经历过三个主要版本:
作为项目的一部分,该项目目标是在维基媒体与互联网项目上记录并推广法国的区域语言,Lingua Libre的概念于2015年11月开始,部分资金来自DGLFLF(法语及法国语言总代表团,英语:General Delegation for the French language and the languages of France)。该项目的第一个版本于2016年8月推出。当时仅适用于录音,Lingua Libre在2016年12月的奥克语工作坊上展示,然后呈现给在线维基媒体社群,也于2017年的国际活动上展示。
2017年底全面重建。新版Lingua Libre是以MediaWiki为基础,使用Wikibase与OAuth以便更好地融入维基媒体环境。其接口透过Translatewiki.net翻译,因此该项目可被大量社群使用。新版的网站于2018年6月准备就绪,并于2018年8月向大众开放。
2020年,平台发生重大变化;有了专为该网站开发的新外观,而.org网域也取代了先前使用的.fr网域。Lingua Libre现在支持透过视频录制手语。
2017年9月 (v.1) 时的录音室画面
2018年12月 (v.2) 时的录音室画面
2020年10月 (v.2.2) 时的录音室画面
在项目启动的前两年,大约制作了一万份的录音。向v.2的过渡也同时伴随着贡献的快速增加。在不到一年的时间内,录音的数量增加超过十倍,于2019年5月时就超过十万份,这些录音是由127位贡献者以近50种语言录制的。到了2020年9月,该平台已有90种语言的超过三十万份录音,贡献者超过350人。2021年6月达到了五十万份录音的里程碑这要归功于120种语言的540名贡献者。