[图文]中文系列讲座――西方传教士编撰的闽方言文献的挖掘与研究           ★★★ 【字体:
厦门大学研发成功闽南方言人工智能语音系统

中国语言文学系   发布时间: 2018-12-12   信息员:    浏览次数: 10


 “爱拼才会赢”、“酒干倘卖无”,这些极具地方特色的闽南话,现在也可以对机器说了。近日,厦门大学智能语音团队采用深度学习方法,研发成功闽南方言人工智能语音系统。据悉,该系统语音识别准确率超过讯飞输入法,而且可以用普通话显示识别结果,让用户更容易理解。厦大智能语音团队有着雄厚的技术研发能力,前期的研究成果已经实现多方应用,例如华为Mate20手机采用的就是厦大声纹技术。方言语音及文本数据采集方面人文学院更是有传承的实力和丰富的经验,团队成员已承担多项国家课题、横向课题等。



闽南方言智能语音系统由厦门大学信息科学与技术学院洪青阳科研团队和人文学院许彬彬科研团队联合研发,包括以下系列:

 1、闽南方言语音识别软件(人机对话系统)已经成功研发,目前iOS系统软件和Android系统软件历经多个阶段的内部测试,准确率较高,目前软件可开放广大市民试用。

 2、闽南方言语音合成软件,基于深度学习模型和闽南方言音库,合成自然流畅的人声。

 3、闽南方言语音库和文本库的建设,其中文本数据(除了日常口语的搜集,大量闽南方言文献的数位化以及俚俗谚语的收集)、语音数据、词典音素规模庞大,目前继续开放收集中,以提高识别软件的准确率、提升语音合成的自然度和流畅度。


在语音识别领域,方言语音识别一直是需要解决的难题。闽南话是我国重要方言之一,它保留了晋、唐时期中原官话的特点,有“古汉语活化石”的美誉。目前,全世界大约有6000万人在说闽南话,主要分布在福建的厦、漳、泉地区,台湾,广东潮汕,雷州半岛,海南岛部分地区以及浙江温州部分乡镇等。由于闽南话方言的复杂性,闽南话存在非常多的多音字,复杂的文白现象,有音无字的问题等,这对训练模型过程中语音数据与其对应音素的正确映射带来了较大的麻烦。厦大研发团队对闽南语语音识别采取了特定规则的发音词典标注,同时经过半年多的算法攻坚,实现了质的突破,找到了较优方法来训练闽南语语音识别模型。针对语音合成,厦大研发团队则采用端到端深度学习方法,取得非常逼真的效果。


闽南方言智能语音系统的研发得到厦门闽韵公司和厦门天聪智能软件有限公司的支持和协助。该软件的研发成功,有利于扩大人工智能领域的应用范围,促进“一带一路”方言与文化的传播。


闽南语语音识别APP

Android版本:https://fir.im/hokkienAnd


iOS版本:https://fir.im/hokkien



最新热点 最新推荐 相关文章
  网友评论:(只显示最新10条。评论内容只代表网友观点,与本站立场无关!)