微信翻译为WeTV打造字幕翻译引擎,覆盖超20个国家及地区、支持8语种翻译

访客2年前AI生活161

近日,微信翻译团队与WeTV(腾讯视频海外视频流媒体服务平台)展开合作,将机器翻译技术应用到WeTV平台。该字幕翻译引擎支持以中文和英文为源语言,目标语种包含英语、泰语、印尼语等8个语种,覆盖泰国、美国、西班牙等在内的超过 20 个国家及地区。

自合作以来,微信翻译共为 WeTV 平台提供了超13W分钟的多语种字幕翻译,品类涵盖电视剧、综艺、电影、动漫、少儿、纪录片6大品类。

这项合作不仅能够满足多国及地区用户同步国内追剧的需求,也将助力国产剧集的海外推广,让更多人看到来自中国的优质内容。

微信翻译为WeTV打造字幕翻译引擎,覆盖超20个国家及地区、支持8语种翻译

近年来,随着国产剧集在海外越来越受欢迎,字幕翻译也扮演了越来越重要的角色。但传统的人工翻译不仅翻译速度慢、人力资源消耗大,海外用户在追剧时常常落后于国内用户一步。为了保障海外用户的最佳观看体验,微信翻译团队研发了一套专服务于字幕场景的翻译引擎,并引入腾讯视频海外视频媒体流服务WeTV 平台。该引擎可以将字幕中一词多义、语境依赖、口语化等问题进行优化,并赋予模型术语翻译及上下文融合的能力。

首先,针对字幕翻译场景的常见问题,微信翻译对引擎进行定向优化,在提升字幕翻译的效率的同时也保证了译文质量。在一般的翻译引擎中,“好啊你小子,看我怎么收拾你”这类充满中文特色的句式,常被直译成“All right, kid. Let’s see what I do to you.”,由于过于生硬而令海外用户难以理解。在经过混合微调的训练后,微信翻译引擎将其翻译成“Come on, I’ll teach you a lesson.”,在保持“原汁原味”的同时还贴合了西方语境,提高了海外用户的观看体验。

再例如,中国古代剧中常出现的“东京”一词,在中文语境中为中国城市开封的古称,但在大部分训练语料中常被捆绑为“Tokyo”(日本城市名),海外用户在遇到此类翻译通常会产生迷惑。而微信翻译打造的字幕翻译引擎则可以在保留原文含义的情况下,以一种更智能的方式使用术语进行翻译,将中国古装剧中的“东京”准确地翻译为“Kaifeng”。同时,腾讯视频还为此打造了一整套术语系统,方便译员对每个剧集维护各自的术语库,从而实现了术语的实时修改、即时生效。

微信翻译为WeTV打造字幕翻译引擎,覆盖超20个国家及地区、支持8语种翻译

据介绍,WeTV作为腾讯视频海外视频流媒体服务平台,以流媒体的形态拓宽华语文化输出的渠道,WeTV主要输出来自腾讯视频的中文原创内容,以及东南亚本地的自制内容。目前,WeTV已经成为东南亚TOP3的区域性流媒体平台。

微信翻译作为日均翻译约百亿字符的高质量多语言机器翻译引擎,目前支持30+语种间的双向翻译,覆盖微信聊天、朋友圈、WebView、企业邮箱、企业微信、微信读书、WeTV等20多个产品业务。

未来,微信翻译将继续打造兼容多场景业务的翻译服务,帮助WeTV等合作伙伴提高翻译效率,推动我国优秀国产影视剧海外推广,让很多海外用户看到中国优质内容的同时,也促进多元文化的相互交流。

本站部分文章来自互联网,文章版权归原作者所有。如有疑问请联系QQ:362580117!

相关文章

用意识同时控制两条机械臂,这在医学上还是首次!

用意识同时控制两条机械臂,这在医学上还是首次!

有这样一位名为 Buz Chmielewski 的男子,曾在一次出海冲浪时不幸遭遇意外,四肢瘫痪。从正值十几岁的大好年华到此后的 30 余年...

中国造车新势力,苦「牌照」久矣

中国造车新势力,苦「牌照」久矣

回到两个月前的那场发布会,李一男对自游家充满信心。 耗时4年,牛创旗下的自游家终于发布了首款新车NV。新车型亮相后,自游家紧接宣布了一系列销...

中关村数智港,数智普惠时代开启“数实融创、普惠共赢”创新实践

中关村数智港,数智普惠时代开启“数实融创、普惠共赢”创新实践

3月24日,由中关村创客小镇主办,中关村科技企业家协会、中国技术创业协会制造业创新创业工作委员会、中商企协信息化和数字化建设工作委员会、北...

阿里云财报:13年来首次年度盈利,进入高质量发展阶段

阿里云财报:13年来首次年度盈利,进入高质量发展阶段

5月26日晚间,阿里巴巴集团发布最新财报,阿里云全年总收入在抵销跨分部交易前和抵销后分别为1001.8亿元和745.68亿元,并实现了13年来...

首款高性能RISC-V处理器「刺向」Arm小核心

首款高性能RISC-V处理器「刺向」Arm小核心

几乎所有芯片创业公司的CEO都会说,“我们最核心的价值是用更好的芯片解决客户的实际问题。” 然而,摆在众多芯片初创公司面前的问题是,芯片设计和...

通义千问开源320亿参数模型,已实现7款大语言模型全开源

通义千问开源320亿参数模型,已实现7款大语言模型全开源

4月7日消息,阿里云通义千问开源320亿参数模型Qwen1.5-32B,可最大限度兼顾性能、效率和内存占用的平衡,为企业和开发者提供更高性价比...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。