2019-04-03 星期三
日期检索 本期头版  本期内容导航 

人工智能会成为濒危语言的救命稻草吗

如果使用到位,至少能避免“一个人带走一种语言”重演

2019年04月03日   05: 焦点   稿件来源:解放日报  


两年前,讯飞输入法也曾推出方言保护计划,呼吁“为世界留下多彩乡音”。2018年春节返乡时,北京地铁4号线上的讯飞输入法乡音广告让很多人拿起手机,录下几句家乡话。目前,讯飞输入法宣称支持粤语、四川话、上海话等23种方言语音识别。

数字技术的发展和人工智能的应用,为语言保护工程带来新的可能。和传统手段相比,新技术不仅让语言存档速度和能力提升,并且可以通过互动学习为方言库的完善做出贡献。

四川话声音模特还没找到合适的

人工智能可以成为濒危语言的救命稻草吗?《人民日报》曾评论称,“从某种程度上说是可以的,如果使用到位,至少能避免重演‘一个人带走一种语言’的尴尬。”

刚成立不到一个月的阿里AI labs(人工智能实验室)方言保护专项小组,现在是虚拟小组状态,语音识别和语音合成两块业务正在推进。据阿里巴巴集团公关部公关经理朱珠介绍,目前四川话的语音识别工作已经完成。

反响热烈的四川话声音模特招募,正是为了语音合成做准备。朱珠表示,虽然报名四川话声音模特的人数众多,但目前还没找到合适人选。“声音模特跟大家意义中的配音不一样,在技术上我们要求声音模特录制基本的语料,这些语料可以自由组合,合成新的句子。即使没有录制过这句话,也能‘说’出来。声音模特人选确定后,技术开发还需要3个月左右的时间。”

四川话是西南官话,使用者众且一致性强。与学界优先保护濒危语言的做法不同,阿里AI labs方言保护始于四川话,正是看准了语音交互产品在方言优势地域的巨大商业价值,这背后是三四线城市以及农村地区。朱珠承认:“现阶段,我们做不到像语保工程那么广的覆盖度,但我们重在积累厚度。同时也要考虑方言和产品的结合,选择从有大量使用者的方言起步。”

方言保护不可能瞬间用钱砸出来

在陕西师范大学文学院教授邢向东眼中,企业参与方言保护,在技术和资金方面有强大的优势。“不过也有困难,方言文化资料的记录、保存在语保工程里都有明确、严格的规范和标准,企业做的动态方言库中,如何收集方言材料?方言材料的质量有没有一个下限式的标准?如何判断是什么方言?人工智能对方言材料依照什么原则分类和存储?这些都需要在启动、设计阶段就考虑到。”

对于学者提出的疑问,朱珠回应称:“产品开发还在进行中,我们需要和学界多沟通,共同研究出更科学的方式。”

阿里AI labs的方言保护小组还没来得及和他们的顾问见面。作为第一位顾问,暨南大学华文学院教授郭熙得知项目投入1亿元后说,“估计不够”。

朱珠表示,在初步阶段,学界对于这个项目是很好奇的,自己接触的专家中还是鼓励的多。“郭老师也说,他相信肯定有一些改变,至于我们能做成什么样,他也很想看一看。”朱珠强调,方言保护不是一个人或一家公司能做到的事情,也不可能指望能瞬间用钱砸出来,“记录和保留即将消失的语言,我不知道能不能做得到,这是一个很终极的目标。希望能借此提高大家对于方言保护的关注度,更重视方言,更愿意使用方言。”