中国语言关系动态网络图谱

(使用前请先阅读以下说明)

中国语言关系动态网络图谱根据语言之间的相似度呈现中国民族语言内部、汉语方言内部的关系。本网络图谱的相似度数据根据马普研究院制作的“相似度自动判断程序数据库”(https://asjp.clld.org/)计算得到,详细计算方法可以参考该网站,也可参看相关论文(见文末所附参考文献列表)。

本网络图谱的中国民族语言包括 592 个语档(doculect),汉语方言包括 516 个语档,均通过公开资源收集,来源包括语言/方言志、语言/方言词汇/词典、期刊论文、博硕士论文、ASJP 原数据库等。全部 1108 个语档在地理上的分布如下图所示(分布地图制作:丁俊、林珈亦):

语档分布

本网络图谱的相似度为 ASJP 相似度归一化至 [1, 100] 后的数据。为保证页面响应速度,总图谱中只显示相似度大于等于 50 的数据,各分图谱中则显示全部数据。每个语档节点的大小由语档名称后面的数字决定,数字表示该语档与整个语言群体的关系(可以称为近群指数),数字越大与整个语言群体相似度越高;数字越小与整个语言群体相似度越低。

除所有语档关系总图之外,也可以通过图谱下方的输入框,选择相应信息,筛选对应的图谱。

592 个少数民族语档关系动态网络图谱支持以下 3 种筛选方式:

  • 语系:单独显示某个语系内部语档的两两关系。包括阿尔泰语系、汉藏语系、南岛语系、南亚语系、印欧语系等 5 种语系以及混合语等 6 个选项。
  • 语族:单独显示某个语族内部语档的两两关系。包括藏缅语族、苗瑶语族、壮侗语族、满—通古斯语族、蒙古语族、突厥语族、印度尼西亚语族、孟—高棉语族、印度—伊朗语族等 9 个语族以及混合语共 10 个选项。
  • 语档:单独显示某个语档与其他 591 个语档的关系。

516 个汉语方言语档关系动态网络图谱支持以下 3 种筛选方式:

  • 方言区:单独显示某方言区内部语档的两两关系。包括官话、晋语、湘语、客家话、赣语、徽语、吴语、粤语、平话、土话、闽语等 11 个方言区。
  • 官话方言:单独显示某个官话次方言语档的两两关系。包括北京、东北、冀鲁、江淮、胶辽、兰银、西南、中原等 8 个官话次方言。
  • 语档:单独显示某个语档与其他 515 个方言语档的关系。

其他说明:

  • 由于移动端浏览器的限制,请在电脑浏览器上查看。图谱较大,建议点击“全屏模式”查看(如无法打开,请右键点击“全屏模式”在新的标签打开,再次点击“全屏模式”),以便获得更好效果。
  • 图谱上方的边阈值横条可以设置图中显示的相似度最低值。为更好地呈现网络主体关系,初始状态下边阈值为最大值。如需查看更多信息,调整横条即可。
  • 每个语档节点的大小,表示该语档与整个语言群体的接近程度(称之为“近群指数”),计算方式为一个语档与某个语言群体中所有其他语档的相似度的均值。例如一个民族语言语档的近群指数为该语档与其他 591 个民族语言语档的相似度的均值;一个汉语方言语档的近群指数为该语档与其他 515 个汉语方言语档的相似度的均值。
  • 双击某个语档的圆圈可以突出显示只与该语档有关的其他语档。再次双击该圆圈则显示所有关系。
  • 用鼠标左键按住拖动图中圆圈之外的地方,可以上下左右任意移动动态图的位置。
592 个少数民族语语档516 个汉语方言语档

参考文献

  1. Brown, Cecil H., Eric W. Holman, Søren Wichmann, and Viveka Velupillai. 2008. Automated classification of the world’s languages: A description of the method and preliminary results. STUF – Language Typology and Universals 61.4: 285-308.
  2. Holman, Eric W., Søren Wichmann, Cecil H. Brown, Viveka Velupillai, André Müller, and Dik Bakker. 2008. Explorations in automated language classification. Folia Linguistica 42.2: 331-354.
  3. 江荻(2017)藏缅语谱系的自动分类实验,《中国民族语言学报》第一辑62-105页,商务印书馆。
  4. 冉启斌、王帅(2023)内部差异与外部关联——中国民族语言592个语档的相似度计算分析,《民族语文》第3期,3-16页。
  5. 冉启斌、丁俊(2023)汉语方言的相似度与差异——基于ASJP模式语言距离计算的考察,《语文研究》第2期,17-26页。
项目总体设计:冉启斌
语言关系代码:许可、段嘉华
网络在线部署:萨沙、王天恒、许可