当前位置: 商业快讯 > 正文

HMS Core Discovery第16期回顾长文与虎墩一起,玩转AI新“声”态

2022-07-29 18:17:23       来源:财讯界

HMS Core 在AI领域最新的技术能力有哪些?本期Discovery直播以《与虎墩一起,玩转AI新“声”态》为主题,邀请了HMS Core 机器学服务产品经理、机器翻译高级专家以及HMS Core的新朋友“虎墩”,为大家展示机器学的语音语言创新技术,分享机器学与人工智能的宏观发展趋势。一起回顾一下本期精彩内容!

【精彩回顾】

1、抖音网红IP“虎墩小镖师”强势来袭

2、同声传译新亮相,底层技术大揭秘

3、AI翻译能力升级,语种扩充可播报

【专家观点】

机器翻译暂时无法替代人类。目前需求不高的翻译需求可以依赖机器但要求较高的翻译需求还需要人工介入,人工可以做到点到面的全方位质量把控,比如说话地道与否、语言通顺与否,还可以贡献数据和知识,提升机器翻译质量。

AI是智能机器的广义领域,而机器学是AI的核心应用之一。它指的是任何能够自行“学”的计算机应用程序,而无需人类的明确规则。未来机器学技术将会更注重情感体验,向多模态(语音、文字、视觉)、多技术(VR/AR等)、多台多系统协同态势的方向发展。

【精彩答疑】

Q1:什么是TTS音色定制?TTS音色定制与虎墩在碰撞一起会有什么新玩法?

A:依托华为的数据积累和成熟算法TTS音色定制在语音合成技术的加持下,只需要提供少量的干净录音数据,就可以进行模型训练,得到高还原度、高清晰度、高稳定的专属音库,助于提升产品特色、快速打造个化的品牌特色。ML Kit的新能力TTS与 IP“虎墩小镖师”正在合作中,TTS通过机器训练还原虎墩的音色,后续将逐步开放虎墩音色给开发者使用,助力开发者应用在各类个化场景。

Q2:机器学服务提供的翻译和同声传译能力,如何赋能App打造新“声”态?

A:文本翻译能力解决了用户因语言不通而导致交流不畅的痛点。比如通话场景,经过实时语音识别,可以快速将识别文字转化为目标语言文字;阅读场景,支持提词翻译器功能,帮助用户快捷看到译文;视频类App集成文本翻译服务后,用户可以流畅体验AI实时字幕功能。通过对语音识别、机器翻译、语音合成三项技术的有机整合,同声传译能力有较低时延、较高准确率的特,适用于会议、直播、演讲等实时高的场景,支持应用将音频内容实时输出为目标语言文字,生成双语字幕,同时对目标语言文本进行实时播报,降低理解成本,兼具质量与效率。

Q3:除以上语音语言类能力,机器学服务有新推出其它创新能力吗?

A:在金融电商领域,机器学服务还提供了活体检测能力。动作活体检测能力使用人脸关键点定位和人脸追踪等技术,通过指令配合动作的形式可以验证用户是否为真实活体本人操作。在银行、证券和借贷等实名制和安全要求较高的金融领域,活体检测可作为用户远程注册和密码找回环节中的辅助验证,帮助用户甄别欺诈行为,有效抵御攻击行为,保障业务安全。

Q4:机器学的宏观技术发展趋势是怎样的?

A:首先,机器学会更加注重情感体验。机器将具有识别、理解和表达喜怒哀乐的能力,识别用户的需求以及环境信息的变化,理解人的情感意图,做出适当反应;其次,是多模态的发展。深度学技术正从语音、文字、视觉等单模态向学多模态智能学发展。未来甚至可以对嗅觉、味觉、心理学等难以量化的信号进行融合,实现多个模态的联合分析,在更多场景、更多业务上辅助人类工作;再次,是多技术的融合,比如VR/AR以及元宇宙等。相信未来AI还将呈现台多系统协同态势,以实现更为广泛的赋能,将通用台、行业台和端侧应用的协同组合,以软硬一体的方式实现具体应用的功能定制和扩展。

【了解更多】

欢迎登录HMS Core机器学服务首页了解更多技术细节。

登录华为开发者联盟官网了解更多HMS Core开放能力

如有相关技术需求,请联系hmscore@huawei.com

免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。

关键词:

责任编辑:kj005

文章投诉热线:156 0057 2229 投诉邮箱:29132 36@qq.com
商业快讯

HMS Core Discovery第16期回顾长文与虎墩一起,玩转AI新“声”态

2022-07-29 18:17:23   财讯界

HMS Core 在AI领域最新的技术能力有哪些?本期Discovery直播以《与虎墩一起,玩转AI新“声”态》为主题,邀请了HMS Core 机器学服务产品经理、机器翻译高级专家以及HMS Core的新朋友“虎墩”,为大家展示机器学的语音语言创新技术,分享机器学与人工智能的宏观发展趋势。一起回顾一下本期精彩内容!

【精彩回顾】

1、抖音网红IP“虎墩小镖师”强势来袭

2、同声传译新亮相,底层技术大揭秘

3、AI翻译能力升级,语种扩充可播报

【专家观点】

机器翻译暂时无法替代人类。目前需求不高的翻译需求可以依赖机器但要求较高的翻译需求还需要人工介入,人工可以做到点到面的全方位质量把控,比如说话地道与否、语言通顺与否,还可以贡献数据和知识,提升机器翻译质量。

AI是智能机器的广义领域,而机器学是AI的核心应用之一。它指的是任何能够自行“学”的计算机应用程序,而无需人类的明确规则。未来机器学技术将会更注重情感体验,向多模态(语音、文字、视觉)、多技术(VR/AR等)、多台多系统协同态势的方向发展。

【精彩答疑】

Q1:什么是TTS音色定制?TTS音色定制与虎墩在碰撞一起会有什么新玩法?

A:依托华为的数据积累和成熟算法TTS音色定制在语音合成技术的加持下,只需要提供少量的干净录音数据,就可以进行模型训练,得到高还原度、高清晰度、高稳定的专属音库,助于提升产品特色、快速打造个化的品牌特色。ML Kit的新能力TTS与 IP“虎墩小镖师”正在合作中,TTS通过机器训练还原虎墩的音色,后续将逐步开放虎墩音色给开发者使用,助力开发者应用在各类个化场景。

Q2:机器学服务提供的翻译和同声传译能力,如何赋能App打造新“声”态?

A:文本翻译能力解决了用户因语言不通而导致交流不畅的痛点。比如通话场景,经过实时语音识别,可以快速将识别文字转化为目标语言文字;阅读场景,支持提词翻译器功能,帮助用户快捷看到译文;视频类App集成文本翻译服务后,用户可以流畅体验AI实时字幕功能。通过对语音识别、机器翻译、语音合成三项技术的有机整合,同声传译能力有较低时延、较高准确率的特,适用于会议、直播、演讲等实时高的场景,支持应用将音频内容实时输出为目标语言文字,生成双语字幕,同时对目标语言文本进行实时播报,降低理解成本,兼具质量与效率。

Q3:除以上语音语言类能力,机器学服务有新推出其它创新能力吗?

A:在金融电商领域,机器学服务还提供了活体检测能力。动作活体检测能力使用人脸关键点定位和人脸追踪等技术,通过指令配合动作的形式可以验证用户是否为真实活体本人操作。在银行、证券和借贷等实名制和安全要求较高的金融领域,活体检测可作为用户远程注册和密码找回环节中的辅助验证,帮助用户甄别欺诈行为,有效抵御攻击行为,保障业务安全。

Q4:机器学的宏观技术发展趋势是怎样的?

A:首先,机器学会更加注重情感体验。机器将具有识别、理解和表达喜怒哀乐的能力,识别用户的需求以及环境信息的变化,理解人的情感意图,做出适当反应;其次,是多模态的发展。深度学技术正从语音、文字、视觉等单模态向学多模态智能学发展。未来甚至可以对嗅觉、味觉、心理学等难以量化的信号进行融合,实现多个模态的联合分析,在更多场景、更多业务上辅助人类工作;再次,是多技术的融合,比如VR/AR以及元宇宙等。相信未来AI还将呈现台多系统协同态势,以实现更为广泛的赋能,将通用台、行业台和端侧应用的协同组合,以软硬一体的方式实现具体应用的功能定制和扩展。

【了解更多】

欢迎登录HMS Core机器学服务首页了解更多技术细节。

登录华为开发者联盟官网了解更多HMS Core开放能力

如有相关技术需求,请联系hmscore@huawei.com

免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。

责任编辑:kj005

相关阅读

美图推荐

金融科技下,金融企业如何保障信息安全
主播雨化田们再接新活,这次让网友们下载的是交管12123APP
深圳看到科技发布Kandao Meeting S 180°超广角智能视频会议机
QQ音乐做了“一件有意义的小事”,让这些孩子听见“听不见”的音乐

精彩推荐