www.g22.com - 新濠天地娱乐

搜索: 您的位置首页 > 产品展示

智能语音产业观察: 翻译机成新落地场景 各巨头争相入局

时间:2019-02-05 03:27:56  来源:本站  作者:

  智能语音产业观察: 翻译机成新落地场景 各巨头争相入局“智能语音目前最实在落地的场景便是翻译,如果产品确实能够做好的话,市场空间很大。”赛迪顾问人工智能研究中心副总经理向阳向21世纪经济报道记者表示。

  这不仅是因为翻译机产品种类的火爆,在京东搜索翻译机,能够出现超过7300件商品。在这背后,则是越来越多的玩家争相步入该市场:科大讯飞自2016年底便推出晓译翻译机,经过2017年底的升级后,于今年4月推出讯飞2.0翻译机;今年1月,搜狗公司的旅行翻译宝正式亮相,3月在京东正式启动预售;5月,小米生态链公司香蕉出行推出魔芋AI翻译机,并在微软Build开发者大会上得以展示;7月19日,猎豹移动发布AI翻译产品——小豹AI翻译棒,为翻译机市场再添战火。

  除此之外,据21世纪经济报道记者不完全统计,目前市面上还有准儿翻译机、网易有道翻译蛋、百度途鸽翻译机等。甚至,有智能手机厂商还专门推出主打翻译功能的手机。

  “智能语音目前最实在落地的场景便是翻译,如果产品确实能够做好的话,市场空间很大。”赛迪顾问人工智能研究中心副总经理向阳向21世纪经济报道记者表示,“不过现在许多产品性能并不足够稳定,效果也不太突出,仍有待进一步改进。”

  首先是翻译机内置麦克风辨识使用者说话的语言及内容,并将语音转换为文字,然后通过机器翻译引擎进行文字对文字的翻译,将原始语言转化为目标语言。最后,将翻译的内容进行语音合成并播放出来。

  其中,语音识别就好比“机器的听觉系统”,该技术让机器通过识别和理解,把语音信号转变为相应的文本或命令。自2009年以来,将机器学习领域深度学习研究引入到语音识别声学模型训练,使用带RBM预训练的多层神经网络,提高了声学模型的准确率,同时借助大数据语料的积累,语音识别技术取得突飞猛进的进步。

  在此方面,微软公司研究人员率先取得了突破性进展,他们使用深层神经网络模型(DNN)后,语音识别错误率降低了30%。近几年来,各大科技巨头自动语音识别能力几乎均提升至95%以上。根据Gartner预测,到2020年,人类30%的浏览活动将由语音识别系统帮助完成。

  语音合成又名文语转换,是将文本转换为语音的技术。如果说语音识别技术是让计算机学会“听”人的话,将输入的语音信号转换成文字,那么语音合成技术就是让计算机程序把我们输入的文字“说”出来,将任意输入的文本转换成语音输出。从语音合成发展历史来看,表现力、音质、复杂度和自然度是合成技术的技术难点所在。不过随着技术演进,当前语音合成技术在音质、复杂度和自然度方面已有了极大改善。

  机器翻译同样在近几年内经历了剧变。在2013年之前,基于统计模型的机器翻译一直都是主流,此后基于人工神经网络的机器翻译(NMT, Neural Mahcine Translation) 逐渐兴起。

  21世纪经济报道记者了解到,人工神经网络翻译拥有一个有海量节点的深度神经网络,通过传导运算,实现生成另一种语言的译文。2016年底,谷歌翻译开发并使用了Google神经机器翻译系统(GNMT, Google NMT)。与之前的统计模型相比,神经网络机器翻译具有译文流畅、准确易理解、翻译速度快等优点。

  在种种技术成熟的加持下,如今的翻译机也具备了相当的实力。讯飞翻译负责人翟吉博向21世纪经济报道记者透露,通过语音识别、语义理解等AI技术,讯飞翻译机2.0语音识别准确率能够达到98%,目前已能够实现对34种语言的即时互译;讯飞语音引擎也已支持22种中国方言识别,该能力将逐步整合进讯飞翻译机,目前2.0产品支持粤语、河南话、四川话、东北话四种方言。

  搜狗相关人士则向记者介绍,搜狗翻译硬件采用了搜狗相关AI技术。在语音识别方面,搜狗可做到准确率超过98%。

相关文章列表
    无相关信息
推荐资讯
栏目更新
热点排行