加入收藏 | 设为首页 | 会员中心 | 我要投稿 52刷机网 (https://www.52shuaji.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 智能家居 > 正文

边看PPT边思考!搜狗“AI翻译官”同传3.0逆天了

发布时间:2019-12-28 12:26:17 所属栏目:智能家居 来源:网络整理
导读:搜狗同传三年“过三关”,担任了上千场大会的“AI翻译官”后,现在“投子”、“罗辑思维”等高难度词都能翻对。
边看PPT边思考!搜狗“AI翻译官”同传3.0逆天了

备选标题:

搜狗“语境引擎”AI 翻译官来了!能听会看会思考,与人工差距缩小60%

边看PPT边口播!搜狗“AI翻译官”同传3.0逆天了

三年实战千场大会,搜狗同传推语境引擎3.0版,高难度词汇翻译正确率提升40%

智东西(公众号:zhidxcom)
文| 李水青

近日,搜狗推出了业内首个带有“语境引擎”的同声传译系统3.0版,新增多模态和自主学习能力。以大会同传为例,搜狗同传3.0系统在听声的过程中,还能够实时阅读PPT,并将它所看到的内容拓展成知识网络,从而经“思考”后让实时翻译变得更准确。

据统计,针对演讲核心内容,搜狗同传3.0识别正确率提升了21.7%,翻译正确率提升了40.3%。

边看PPT边思考!搜狗“AI翻译官”同传3.0逆天了

随着国际交流日趋频繁,国际交流中的现有同声传译服务成本高、人才不足,难以满足需求。搜狗CEO王小川说,全球20%的人口是说中文,但是全球95%的信息是用英文所写的,因此如何帮助中国人跟外国人进行更好的交流,变成了一个重大的技术课题。

在同传行业中,翻译从业者并没有减少,但满足专业同传需求的人才却更加稀缺。面对大会传译中专业术语识别和翻译,许多英语出身的普通翻译工作者难以驾驭,现有的同传机器也大多采用通用模型,因此许多医疗、物理、经济、人工智能领域的专业术语及新兴概念翻译成为一大难点,弄不好就“驴头不对马嘴”。

其实,针对这些行业痛点,搜狗早在2018年推出的同传2.0就具备了“个性化定制”功能。同传2.0通过对大会嘉宾的文稿、PPT、百科知识进行提前学习,使得现场传译更加准确。

但是,现实很骨感。当真正一场大会举办起来时,一些演讲人的PPT和材料很难提前获取,因此定制环节也变得难以在会前完成。搜狗同传3.0由此应运而生。3.0版本通过实时捕捉PPT上的内容,进而发挥“语境引擎”作用优化翻译效果。

一、“投子”、“罗辑思维”都能翻对,与人工差距缩短60%

以大会同传为例,当嘉宾说出“投子”,机器很可能识别为“投资”,但是搜狗同传3.0通过识别PPT上的“阿尔法狗”和“李世石”,能够扩展出“投子”这样的术语;

当听到“罗辑思维”,搜狗同传3.0会根据PPT上的“罗振宇”进行知识图谱扩展,从而直到此“罗辑”非彼“逻辑”;

当听到“INI”,人们不太熟悉这个缩写,搜狗同传3.0会查询中英文知识库后,把相应的中文解释“国际神经科学研究所”给翻译出来。

边看PPT边思考!搜狗“AI翻译官”同传3.0逆天了
▲搜狗同传3.0的对众多易错词汇的翻译准确率大大提高

从某权威论坛的数据评测得分上可以看到,相比于人工同传4.08的得分,3.0版本的系统得分从2.0版本的3.41分上升为3.82分,与人工同传的差距缩短60%左右。

除了大会演讲的同传之外,搜狗同传3.0作为一套完整的技术体系,在众多场景中都有用途。比如记者采访、跨国办公会议、中英文视频直播、字幕翻译、法院庭审等等,都可以在搜狗语境引擎的辅助下完成更简单的表达和信息获取。

二、语境引擎、知识图谱加持,5步优化翻译

简单来说,搜狗语境引擎最主要的创新是为同传系统增加了视觉通道。同样以大会同传为例,利用“语境引擎”进行“边听边看边思考”地翻译大致包括以下5个步骤:

1、通过OCR技术识别PPT页面上的内容;

2、针对识别结果,生成与PPT对应的领域词汇表;

3、利用领域词汇表进行知识图谱的扩展,从而形成扩展词汇表;

4、针对扩展词汇表,查询搜狗中英专业术语库;

5、在语音识别端和机器翻译端使用扩展词汇表进行增强,提升整体翻译效果。

通过语境引擎技术,搜狗将能“视听合一”的多模态思路应用到新的同传系统,它带有一些简单的思考能力,通过知识图谱能够实时地把它看到的东西拓展成知识网络,放到同传生态系统中去,从而优化翻译效果。

边看PPT边思考!搜狗“AI翻译官”同传3.0逆天了
▲搜狗同传3.0技术架构图

三、三年上千场大会,搜狗同传“过三关”

早在2016年,搜狗就在第三次世界互联网大会上发布了大会同传1.0。在当时,语音识别准确率便超过97%,机器翻译准确率达90%。

但是,搜狗AI交互技术部总经理陈伟告诉智东西,当时的准确率是在一定的测试集上测出来的,但当面临实践中的方言口音、专业术语、中英混说等问题,系统的波动性很大。

而这种只有深入行业后才能真实体会到的行业痛点,也成为搜狗同传产品不断迭代的动力。

2018年,搜狗同传进入2.0的阶段,可以实时根据用户语料进行定制;而近日推出的同传3.0,主要强调的是多模态和自主学习的过程,能听会看,能理解和推理大会场景下演讲人到底在说什么。

从搜狗同传3.0技术框图可知,搜狗同传系统主要包括语音识别、机器翻译和语音合成。

边看PPT边思考!搜狗“AI翻译官”同传3.0逆天了

从语音识别模块的演进来看,1.0系统仅仅输入语音;2.0的时候开始做到语音+个性化,以及说话人的语境背景输入;3.0的时候则加入了知识图谱,把这些信息作为语音识别的输入。

(编辑:52刷机网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

推荐文章
    热点阅读