原始南亚语是构拟出的南亚语系的祖语。哈里·肖托(Harry L. Shorto)的《孟高棉比较词典》中给出了原始孟高棉语(即蒙达语族以外的所有南亚语),保罗·西德韦尔则在进行新的原始南亚语构拟工作。
一般认为原始南亚语分化的时间距今约5至4千年(即公元前3000-2000年),原乡位于华南或湄公河河谷。
原始孟高棉语是构拟出的孟高棉语族祖语,孟高棉语族是南亚语系的主要分支。不过孟高棉语族已经在最近的分类方案中被否决,这使得原始孟高棉语等同于原始南亚语。蒙达语族没有被很好地记录下来,并且已经通过外部语言接触进行了重组,没有包括在构拟中。
哈里·肖托(Harry L. Shorto)(2006)的原始孟高棉语共有21个辅音、7个元音,可以延长或声门化,还有3个双元音。
原始孟高棉语有很多元音:* *a, *aa
双元音有:
保罗·西德韦尔和费利克斯·劳(Felix Rau)(2015)的原始南亚语音节结构如下。* *Ci(Cm)VCf
还可以加前缀和中缀,以及主音节影响前音节发生可能的“韵尾复制”。
西德韦尔 & 劳 (2015)构拟了21-22个原始南亚语辅音(*ʄ不确定)。
内爆音和浊塞音之外的所有原始南亚辅音都可做韵尾(Cf)。
所有原始南亚语的清塞音和浊塞音,以及*m-、*N-、*r-、*l- 和 *s-,都可以作为前置音节或倍半音节(Cp)出现。
中辅音(Cm)是*-w-、*-r-、*-l-、*-j-和*-h-。
西德韦尔 & 劳 (2015)构拟了8个原始南亚语元音,且每个都有长短对立。长元音以附加三角冒号(ː)书写。
原始南亚双元音是*iə和*uə,可能还有*ie和*uo。
常见的结构有*CV(C)和*CCV(C)词根。*CVC词根也可以加前缀或中缀,如*C-CVC或*C⟨C⟩VC (Shorto 2006)。Sidwell (2008)给出了以下两种词干的结构。
:R是可选的中间辅音/r、l、j、w、h/之一。
Sidwell (2008)认为两个在形态上最保守的孟高棉语分支是克木语支和亚斯里语支。越南语的形态和汉语和台语支更相似,并且失去了原始孟-高棉语的许多形态特征。
以下原始孟-高棉词缀仍是暂定的,已由西德韦尔 (Sidwell 2008:257-263)构拟。
罗杰·布伦奇(Roger Blench)(2012)指出,南亚语和汉藏语在词结构方面有许多相似之处,尤其是名词词缀(也称为倍半音节或小音节前缀)。布伦奇 (2012)没有就这些相似性是如何产生的做出明确的结论,但认为这种类型的扩散可能是由越南北部、老挝和缅甸东北部之间的一个地区的密集接触而产生的。
类似于台语支,原始孟高棉语是SVO语序。原始孟高棉语还有量词和连动结构(Shorto 2006)。
然而,西德韦尔 (2018)则认为原始南亚语实际上可能是动词在前的语序,由于东南亚语言联盟在中南半岛扩张,才带来SVO语序。各种现代南亚语言都展现动词在前的语序,包括浦那尔语和佤语(Jenny 2015)。:317–340尼科巴语也如此。
21世纪,关于南亚语系原乡和扩张的理论发展迅速。
保罗·西德韦尔(Paul Sidwell) (2009)认为南亚语系的原乡可能在湄公河流域,且并不像人们通常认为的那么古老,可以追溯到公元前2000年之久。
不过佩洛斯(Peiros)(2011)严厉批评了西德韦尔2009年的河流扩散假说,并声称存在许多矛盾。他用他的分析表明,南亚的故乡就在长江附近。他认为四川盆地很可能就是原始南亚语迁移到中国中南部其他地区,然后进入东南亚之前的原乡。他进一步分析说,这个语系必须与原始南岛语和原始汉藏语一样古老,甚至更老。
无我 (2011)认为南亚语系的原乡在华南某地,是在珠江沿岸地区。他进一步提出,基于遗传研究,来自台湾的壮侗语系民族的迁徙取代了原始的南亚语言,但对人的影响很小。当地的南亚语族群改说壮侗语,并部分采用了他们的文化。:361-390沙加尔 (2011)和贝尔伍德(Bellwood)(2013)支持中国南方长江沿岸起源说。
2015年关于东亚古代人的遗传和语言研究表明,南亚语系的原乡可能在今天的华南以北。
保罗·西德韦尔(2015)将计算系统发育语言学与最近的考古发现相结合,进一步扩展了他的湄公河假说,提出南亚语系最终从岭南扩展到中南半岛,随后的湄公河流域扩散发生在华南新石器时代农民的到来之后。他试探性地提出,在东南亚大陆新石器革命时期,南亚语系可能在公元前3000年开始分裂,公元前2000年南亚语系所有主要分支都形成了。这些分支可能从岭南珠江流域西缘、或沿越南海岸地区,或经云南沿湄公河顺流而下,共两条路径。重建的原始南亚语词汇和考古记录都清楚地表明,公元前4000年左右的早期南亚语使用者种植水稻和杂谷,饲养狗、猪和鸡等牲畜,并且主要在河口而不是沿海环境中繁衍生息。在公元前2500年,这种“新石器时代族群”突然从岭南地区来到中南半岛,取代了早期的前新石器时代狩猎采集文化,中南半岛北部在公元前2100年发现谷壳,中南半岛南部则在公元前1800年。西德韦尔还发现铁在原始南亚语中是不可重构的,因为每个语支都有不同的单词表示铁,这些术语是晚近从泰语、汉语、藏语、马来语和其他语言中借来的。在约公元前500年的铁器时代,中南半岛比较年轻的南亚语分支,如越语支、戈都语支、比尔语支和高棉语等已经形成,而内部更多样化的巴拿语支(形成时间约公元前1000年)则经历了更激烈的内部多样化。截止到铁器时代,所有南亚语分支基本上都大致在其今天所在的位置,南亚语系内部最大的多样性诞生于铁器时代。
保罗·西德韦尔(2018)认为在水稻农业到达中南半岛期间,南亚语系在约4000年前迅速多样化,但也指出原始南亚语本身的起源早于那个日期。原始南亚语词汇可分为早期和晚期两个层次。早期层由基本词汇组成,包括身体部位、动物名称、自然特征和代词,而文化项目名称(农业术语和文化用品,在原始南亚语中可重构)构成了后期层。
罗杰·布伦奇(2018)认为与水域生活策略(如船只、水道、河流动物群和鱼类捕获技术)相关的词汇可以重建为原始南亚语。布伦奇(2018)发现了广泛传播的“河流、山谷”“船”“鱼”“鲶鱼”“鳗鱼”“虾”“虾”(中南亚)“螃蟹”“龟”“乌龟”“水獭”“鳄鱼”“苍鹭、渔鸟”和“鱼钩”等词根。中南半岛北部(越南北部、老挝和其他邻近区域)存在农业的考古证据可以追溯到距今4000年(公元前2000年),而农业最终从更远的长江流域北部引入它的历史可以追溯到距今6000年。因此,这表明与汉藏语系相比,南亚语系沿河传播相对较晚,汉藏语使用者有独特的非河流文化。除了过着以水生为基础的生活方式之外,早期的南亚语使用者还可以接触到牲畜、农作物和更新类型的船只。由于早期的南亚语使用者通过水路迅速分散,他们会遇到已经在该地区定居的较老语系的住民,例如汉藏语系。
西德韦尔 (2021)认为原始南亚语的原乡在4000到4500年前在红河三角洲地区。南亚语通过海上航线和河谷传播。克木语支、佤德昂语支和卡西语支是从红河谷地向西扩散的结果。根据它们目前的分布,大约一半的南亚语支(包括尼科巴语支和蒙达语支)可以追溯到沿海海洋扩散。
原始南亚语词汇:
原始南亚语人称代词如下,摘自Sidwell & Rau (2015)和Shorto (2006)。