科技能拯救濒危语言吗?

标签:科技濒危语言

访客:21340  发表于:2015-04-23 16:21:01

【导读】如果不采取任何行动,世界上50%~90%的语言将在21世纪末消亡,随之消失的还有丰富的、科学未破解的知识和文化。

科技能拯救濒危语言吗?

目前世界上有11种语言使用人数最多:汉语普通话、英语、西班牙语、阿拉伯语和印地语,有超过上亿人将其作为母语,再加上葡萄牙语、孟加拉语、俄语、日语、法语和德语,以这11种语言为母语的人群占到了世界总人口的一半以上。但是这11种语言却仅占到人类全部语言数量的1/100,世界上现存的语言数量接近7000种。弱势语言通常仅在小群体中使用,往往不足1万人。
“我给你的爱写在公元前,深埋在美索不达米亚平原。”很多人相信,不同的语言孕育着不同的世界观,语言的失落会是人类的悲剧。但对于语言多样性的流失,人们的观点向来都有分歧。“适者生存”观点认为语言的竞争乃自然规律,更少的语言意味着人们能更轻松彻底地交流,省掉翻译的昂贵费用。另一种观点认为语言能够帮助人们了解历史,数千年来土著居民与自然世界联系紧密,对本土、植物、动物和生态系统有深刻的洞悉,而这些可能是科学尚无记录的。联合国教科文组织前任总干事松浦晃一郎曾说:“在森林遭到毁灭的地方,也是弱势语言使用者们的家园。一种语言的消失导致许多非物质文化遗产形式的消失,特别是使用这种语言的团体。”
造成语言濒危的原因是多方面的,但全球化、信息化无疑加快了弱势语言走向濒危的步伐。世界上4/5的网页是英文,只有不到1/5的人类语言在互联网上使用,数以千计的语言基本上进不了新闻媒体、教育体系、出版物和公共场所。
然而,这一过程并非不可避免,也并非不可逆转:精心制定并经落实的语言政策能够鼓励各语言社群持续努力维护与振兴母语,并传授给年轻一代。新西兰在拯救毛利语时实行了一个政府计划,名叫“语言小巢”,在幼儿园中传授毛利语,不仅拯救了毛利语,也成为抢救濒危语言的典范。
而借助技术手段,将语言的语法、词汇、句法以及一些民间文学形式按照语言学科学的方式完整记录下来,成为眼下更加被关注的话题。美国社会语言学家费舍曼认为:“濒危语言之所以濒危,是因为缺少非正式的代际传递和日常使用,而不是因为它们没有在学校里被教授或缺乏官方的地位。”
逆流而上的拯救
一些探索者试图逆流而上,以科技的力量来拯救濒危的语言,乃至复活灭绝的语言。2003年8月,美国康奈尔大学的科学家丹尼尔·艾布拉姆斯(Daniel Abrams)等人在英国《自然》杂志上给出了一个专门针对濒危语言演化的计算机数学模型,为语言学家对濒危语言进行定量和定性分析提供了十分有用的研究工具。英国剑桥大学在2010年也启动了“世界口头文学项目”,将世界上正在迅速消失的歌曲、诗歌、传说等口头文学用音频、视频及其他多媒体形式予以记录存档。
越来越多的极客和语言学家们积极联手,希望用各种计算机和互联网技术,拯救濒危小语种。2012年谷歌在其官方博客中宣布与语言多样性联盟共同合作,发起成立“濒危语言项目”(Endangered Languages Project)。这个网站收录了超过3000种濒临语言,几乎占到了世界语言数目的一半。通过这个项目网站,用户可以通过互动地图探索那些濒危语言的地理分布和生存状态。网站地图上的一个点,就代表了一种语言。点击之后,用户可以了解该语言目前的使用地区、全球范围内以此语言为母语的人数,还可以了解以该语言使用人数的变化趋势。
例如,当你搜索“baka”语时,地图上就会显示36个搜索结果,它们分别分布在非洲的不同地区,其中4个在它的发源地喀麦隆。其中的部分语言还保存了高质量的音频和视频资料,如果你想聆听那些语言,你可以点击下载那些祖辈口口相传的歌谣,或是世代流传的口述故事。可惜的是,网站还没有能够为每一种语言取得音频或是视频资料。
这个网站并不是被动式的记录,它提倡积极的互动式讨论,用户可以在网站上提交文本,分享关于该语种的最新研究成果、最佳实践方法和案例研究。例如有用户发现,世代以放养驯鹿为生的西伯利亚图法拉尔人,在其语汇中有不少描述驯鹿皮色、花纹、头部标记以及生活习性、个性等综合信息的语汇,这对研究野生动物的进化史来说弥足珍贵。还有在玻利维亚部落中的卡拉瓦娅语,是懂得某种古老医术的人为了使平生所学得以代代相传,而专门创造的一种语言。印度的克罗语属于藏缅语系的一种口头语言,没有文字,现在仅800人能说这种语言,也蕴藏着当地鲜为人知的历史、物种、草药学的信息。
“语言是是一个信息贮藏库,每当我们失去一种语言,不仅意味着族群的消亡,随之消失的还有族群在几个世纪以来对于时间、季节、海洋生物、驯鹿、食用花卉、数学、风景、神话、音乐、未知事物以及日常生活的思考成果和积累的宝贵经验。我们现在使用的拯救方式,就是让语言学家在当地用高清录音和录像收集尽可能多的语言资料。语言学家起到了带头作用,然后,这些视频和录音经过社交网络的传播,成为学习语言的现成资料。”“濒危语言项目”经理克拉拉·莱沃拉·罗德里奎兹(Clara Rivera Rodriguez)这样评价项目的做法和意义。

标本式保护
除了“濒危语言项目”,“谷歌翻译”也是另一个拯救濒危语言的尝试,已经具备了非常高的精确度。它会自动搜索网络上的语言资料,找到对应的翻译文本,目前可以翻译的语种达到了91种,较为罕见的小语种有海地克里奥尔语、毛利语、苗语、马拉雅拉姆语、齐切瓦语、僧伽罗语、宿务语、伊博语、意第绪语等等。但这个程序还有很大的潜力可以挖掘:如果有足够多的小语种资料和对应的翻译资料,谷歌可以研发出翻译更多濒危语种的系统。
其他互联网技术巨头也有类似的尝试。微软的译者中心也在研发某种语言的特定智能翻译模型,让网页可以一键转换为用户所熟悉的语言,但这项功能也仅仅覆盖了约100种语言。尽管研发的速度赶不上濒危语言消失的速度,但重要的是让计算机尽快学会这些语言。
欧洲通信运营商沃达丰也加入到这个阵营中,在发起的“沃达丰的第一次”活动中,为拯救阿亚帕涅科语发起了专门的网站(ayapaneco.com)。他们邀请斯坦福大学语言学教授詹姆斯·福克斯(James Fox)亲自飞到塔巴斯克为这门语言编写在线词典之外,还在网站上发布了许多触动人心的视频内容,让网友通过网站学习古老的墨西哥语言,感受古墨西哥文明的魅力。网站内每一条更新都可以通过“我喜欢”和“赞一个”被收藏起来。
除了这些项目,在拯救濒危语言方面,Wikitongues也是最被看好的网站之一,它的意图是让每个人都能方便地接触到世界上所有的语言。这个创立于2014年的网站的主要目标就是保护语言,不仅仅是语言学家,每个人都可以奉献自己的一份力量。用户怀揣Wiki的合作共享精神,以草根运动的方式,用口头语言或是肢体动作的方式,记录下每个人的母语。只需要一个帐号,志愿者就能以Youtube视频、众人合撰的词典、短语本和其他相关鲜活资料的方式将其记录下来并上传到网站。
迄今为止,Wikitongues共收录了153种语言,这些志愿者来自瑞士、津巴布韦、南非、挪威、俄罗斯和西班牙等地。尽管只占到世界语言总数的2%,但是在过去的六个月里视频的数量有较为迅速的增长,预计今年用户上传的语言总数将超过300种。有意思的是,网站还特意收录了来自不同地区的网友说同一母语时的音调异同,例如以英语为母语的美国人和南非人的不同视频资料,以展现人类语言的丰富性。 
除了网站,其他技术也让濒危语种有了复兴的可能。历史经验表明,语言的保育并非只是学术上的空想。例如希伯来语就从一个只被少数土耳其人和巴勒斯坦人使用的语言,被复兴成为超过700万人使用的语言。今天,有越来越多的在线词典、形形色色的App应用、云端数据库和交互式学习软件,帮助那些濒危的语言以另一种形式延存下去。不管是澳大利亚土著语的视频学习站点,还是利用iphone程序扩大影响力的齐佩瓦语,都渐渐结成硕果。“互联网的兴起让小语种处于被遗忘的弱势地位,现在,人们却要用互联网技术去拯救它们。我们终于看到了其正面作用。”
不过,尽管互联网把濒危的语言用录音和录像的方式保存起来,但这种训诂和文献学“标本式”的保护方式,究竟能不能挽回语言的垂危和濒危呢?大多数人所创造的文明和他们的故事,是否都将如同两河流域的楔形文字那样,湮灭于历史的尘埃之中呢?且行且看吧。
-----------------------------
本文系IT经理世界/经理+原创,作者:陈婧,转载请注明出处和作者名

评论(0)

您可以在评论框内@您的好友一起参与讨论!

<--script type="text/javascript">BAIDU_CLB_fillSlot("927898");