您好!欢迎来到深圳市互联网学会官网!
首页 > 资讯中心 > 互联网要闻 > 热点话题 > AI赛道中持续发力,搜狗领跑语音翻译行业

AI赛道中持续发力,搜狗领跑语音翻译行业

  • A-
  • A+
来源:TechWeb.com.cn    2018-10-31
  • 分享

原标题:搜狗击败讯飞阿里 获IWSLT国际口语机器翻译评测大赛冠军


表1 IWSLT大赛baseline Model赛道最终结果


222.jpg

--取自IWSLT官方公布结果:https://workshop2018.iwslt.org/downloads/Proceedings_IWSLT_2018.pdf


这是搜狗继WMT 2017机器翻译顶级评测大赛夺冠之后,所摘得的又一翻译领域的技术桂冠。短期内连续登顶世界第一的位置,充分证明了搜狗在翻译行业特别是口语翻译领域已位居领先地位。


IWSLT是什么比赛?


IWSLT是国际最具影响力的口语机器翻译评测比赛,从2004年开始已经举办了15届。每届比赛都吸引了世界各地机器翻译领域的知名企业和研究机构参与,本届比赛吸引了讯飞、阿里巴巴等国内公司,爱尔兰ADAPT中心,美国约翰霍普金斯大学,德国卡尔斯鲁厄理工学院,芬兰赫尔辛基大学,英国爱丁堡大学,美国AppTek公司等多家国际知名大学、研究机构和公司参加。


表2 IWSLT2018大赛参赛情况


111.jpg

--取自IWSLT官方公布结果:https://workshop2018.iwslt.org/downloads/Proceedings_IWSLT_2018.pdf


本届IWSLT 2018的口语机器翻译任务主要评测基于指定数据集从英语到德语的语音翻译能力,共分为baseline Model(基线模型赛道)和End-to-End(端到端赛道)两个赛道,其中baseline Model赛道主要评测语音翻译的流水线方案,输入语音先通过语音识别系统得到语音识别结果,之后将结果送入机器翻译系统获得译文,这也是业内最主流、效果最好的语音翻译解决方案,市场上商用机器同传、翻译机等语音翻译类产品几乎都采用了类似的方法;End-to-End则是本次评测新增设的赛道,主要鼓励参赛方探索基于神经网络的端到端语音翻译解决方案,希望能够输入语音,基于深度神经网络模型直接输出译文,这种方法目前仍处于早期研究阶段,受制于语音-文本平行语料难以大规模采集、算法研究不成熟等因素的限制,距离商用仍存在较大距离。本次评测中,在训练集、测试集相同的情况下,baseline Model赛道最好的系统取得了28.09的BLEU(机器翻译质量评价指标,值越大代表翻译质量越好),而End-to-End赛道最好的系统仅取得了19.4的BLEU,较baseline Model赛道相差8.69个BLEU,差距非常明显,也证明了baseline Model赛道评测的算法仍是目前最可行和实用的解决方案。


搜狗本次参加的是baseline Model赛道的评测,并取得了第一名的好成绩。评测任务面向TED演讲和大会学术报告场景,测试集包括来自英国、欧洲、印度等各个国家的英语演讲者,存在噪声、口音、自由表达等复杂语音现象,同时语言中存在大量领域专有名词和口语化的表达(如:大量语气词、错误语法表达等),具有极强的实战意义和挑战性。最终,搜狗提交的系统BLEU值达到28.09,领先排名第二的科大讯飞1.6个BLEU,证明了搜狗在口语机器翻译领域强大的实力。


AI赛道中持续发力,搜狗领跑语音翻译行业


搜狗的AI战略蓝图之中,语言是最核心的重头戏。一直以来,搜狗都坚持着“自然交互+知识计算”的人工智能核心方向,并持续深耕技术,推动技术向产品的快速转化,2016年,搜狗发布了自有人机交互解决方案-知音引擎。拥有充足真实语料数据优势的搜狗,将语音识别与机器翻译技术相结合,并在2016年推出了全球首款商用AI同传系统-搜狗同传,引领了语音翻译技术的普及与应用。通过数百场的国际会议“实战”,搜狗同传获得了无数媒体和观众的好评,成为当下炙手可热的“AI字幕君”。


与此同时,搜狗也推出了一系列的智能硬件,将语音翻译技术应用到了更广阔的场景之中,帮助用户打破了跨国交流时的语言困境。2018年3月,搜狗推出了搜狗旅行翻译宝,具备离线翻译功能与拍照翻译功能,让马化腾都为之心动,在朋友圈里大打广告。作为首款智能翻译硬件,它支持42种语言对话翻译,解决了旅游场景中用户听不懂、看不懂、不会说等真实痛点。该项产品在京东平台首发当日即告售罄,首日销售额破千万。与此同时,搜狗还推出了录音翻译笔,提供录音转写、对话翻译、同声传译等功能,把AI同传落地到了消费级产品之中,开拓了语音翻译的新航道。


众所周知,人工智能是未来科技的风向标。通过这次在IWSLT比赛中的优秀成绩,可以看到以搜狗为代表的国产科技巨头企业,已表现出了引领行业的技术硬实力。


结语:随着互联网概念的遍及,智能语音也通过语音识别系统、智能语音交互系统、语音数据存储系统、智能数据统计整合等。而所谓的智能语音,主要是依据大量的语音数据收集整理,通过智能剖析,以声音的方式接纳下令并实行,是一个以声音的方式予以用户反应的智能化体制。


  • 分享
关键词:互联网学会      AI战略      搜狗     神经网络     人工智能 

深圳市互联网学会

学会的宗旨:整合行业资源,服务互联网,普及互联网知识,打造互联网在线学习、互联网生态服务。
更多学习进入互联网在线学习《互联网学会》公众号

欢迎加入学会
我们随时为您提供帮助

成为会员

热门文章

查看更多

咨询热线

0755-32875048

周一至周五 9:00-18:00

地址:深圳市福田区南园路68号上步大厦18A

特别声明: 本会所有证书与官网一致为准。

  • 深圳市互联网学会官方微博扫码加客服微信
  • 深圳市互联网学会官方微信关注微信公众号
@深圳市互联网学会 版权所有
  备案号:粤ICP备14018046号