发音吧 关注:236贴子:6,661
  • 0回复贴,共1

多语言发音词典成为语言识别合成数据库基础数据

只看楼主收藏回复

  北京海天瑞声科技有限公司是一家全球领先的、多语言、跨领域的人工智能数据资源及相关数据服务的提供商。北京海天瑞声科技有限公司在刚刚落幕的ICASSP2016上充分展示了其在多语种发音词典方面的成果。
  北京海天瑞声科技有限公司自1998年成立以来,海天瑞声已经为150多家全球知名企业和研究机构,提供了覆盖75个国家和地区、110多种语言的语音数据资源和科研服务,并拥有超过500个可授权使用的大规模数据库资源产品,以及300多个科研数据资源,覆盖语音合成 、语音识别 、机器翻译、网络搜索、自然语言理解、图像识别等人机交互技术领域。详询:http://www.speechocean.com/
  据“海天瑞声”的首席科学家、研究中心总监郝玉峰博士介绍,“海天瑞声”是国内唯一一家有能力制作多语种发音词典的数据供应商。截止目前,针对语音识别与合成研究与应用,海天瑞声能够提供近60个语言和地区的发音词典,可授权词条达400多万,不但包括业内较为罕见的阿拉伯语、希伯来语、乌尔都语等语言词典,部分词典还包括词性标注、词频标注和领域标注等标注信息。同时,考虑到语音语言应用研究的发展与标准化,“海天瑞声”还大力推进X-SAMPA方案设计多语种音素集,目前30%以上的发音词典支持此方案。而且,“海天瑞声”具有优秀的语言学家团队,可以为用户给出专业化的语言语音方面顾问服务。
  从国内的基础数据资源市场看,在2005年之前,可用于大规模工程化应用的大型中文语音数据库市场还是一片空白。直到2005年之后,市场上才开始逐渐出现了一些以“海天瑞声”为代表的、以工程化应用为主要目的语音数据库供应商,其中,不仅在中文普通话数据库,而且在方言、重口音普通话和少数民族语言的语音语料库开发方面,做了大量的开创性工作。从另一方面讲,国内的基础资源市场现状仍不容乐观,还有大量的空白需要填补。简单来说,目前的现状是:数据种类少,分布不均匀,尤其是方言、重口音、其他语类资源仍然特别短缺;中小型、适合学术和科研使用的数据虽多但质量较差,大规模、高质量工程化数据资源还是比较稀缺;数据的重复开发情况比较普遍,但重复利用度低,缺乏数据共享机制,也存在着严重的知识产权问题。
  数据库成本居高不下也是一个很重要的问题,这造成了技术和市场进入的壁垒,导致只有那些IT巨头们才有能力进行人工智能的巨大而持久的投入。唐涤飞先生介绍说,海天瑞声也在不断的进行数据库制作的技术创新和采集处理方式创新,目标是不仅能提供更多种类的高品质的基础数据资源,也能使其生产成本有效的降低。
  


1楼2016-08-11 17:00回复