智能家电语音交互方案如何落地？云知声给出解题思路

来源：财讯网 2023-03-17 10:01:20

A+ A-

智能语音识别与交互在家电领域的标配应用，已是家居产品智能化的重要内容。当前，家电产业正不断加大语音识别与交互技术的研发投入。

下一步智能语音识别与交互将如何发展？现行的标准技术要求能否满足行业需求？评价测试的场地和设备已形成了哪些规范？近日，为推动以智能语音为代表的人工智能核心技术发展，广东省智能家电创新中心召开“智能家电语音识别与交互系统标准技术研讨会”。

作为国内人工智能语音领域的佼佼者，云知声出席活动并发表《解密语音交互方案抉择与落地的关键动作》主题演讲。

▲云知声资深专家现场作主题演讲

面向AIoT领域，云知声基于多年技术沉淀，通过标准化组件，构建云端芯一体化的产品解决方案，赋能智能家居、智慧酒店、智慧社区、智慧交通、智慧园区、智慧校园等多个场景，合作伙伴包含华为、美的、格力、长虹、京东、TCL等行业龙头企业。

现场，云知声基于在AIoT领域的实践经验，向与会嘉宾深度分享了AIoT语音交互的通用流程和核心模块及方案选型思路。

以下为分享精华，我们做了整理，谨供学习：

语音交互落地面临的挑战

当前，语音交互的落地面临三大挑战：

首先面临的是感知、表达、认知三大核心能力的构建——通过感知能力，我们能知道用户在说什么；通过认知能力深入理解用户的意图；通过语音合成、图像或其他形象化方式等表达能力将内容和信息传递给用户。

其次是AI公司都会面临的问题：落地场景的碎片化。不同应用场景的终端设备不同，也就意味着不同的预期、不同的功能需求。

最后是连接和互操作的挑战。我们发出的语音指令，需要实现多端同步、数据上报、表达操作结果等。

那么，云知声是如何突破这些挑战，更好适配市场需求的呢？

离线or在线的方案抉择

针对不同的产品形态载体，云知声总结了一套通用的语音交互流程，无论在线、离线，都适用，但每个模块实现的复杂程度和效果可能有较大差异，也就是说对核心能力的要求是存在差异的。

在离线化方案中，有些模块则需要进行简化。但降噪算法、语音唤醒和语音识别这三个模块，直接关乎用户体验的性能不能简化。其余简化处理的部分，不是不需要了，而是基于用户刚需和硬件资源间找准平衡。

而在云端化方案中，可以达到语音识别和合成的词汇量扩充到任意级别，并且具备对自然对话的理解能力。即使这样在自然语言理解、对话逻辑、自然语言生成、内容服务这几个模块，不同场景下的用户需求也千差万别。

对比一下离线化方案和云端化方案，可以看出，云端化的目的有二：一是实现更强的识别和理解能力，二是提供更丰富的内容。但对于家电而言，大多数产品需要的是识别和理解能力，而非内容层面。

那能不能在离线方案上实现识别和理解能力的提升，更好满足用户体验？

云知声给出的答案是：离线自由说——在离线方案上，实现基于深度学习的语音交互。

云知声语音交互的实践与探索

为加速语音 AI 落地，云知声将麦克风阵列、信号降噪、语音识别、自然语言理解等技术封装在芯片中，以此为终端提供“认知+感知+表达”核心能力，打造面向物联网的人机交互入口。

同时，通过云端开发平台，快速实现算法、芯片、软件应用到智能化终端的一体化：零代码降低研发门槛，标准化提升落地速度，满足终端智能化升级的价格预期，实现规模化落地和行业爆发。

目前，云知声芯片及模组出货量达千万级水平，积累超过千家合作客户。其中，作为白电和小家电领域大规模量产的语音方案，已经赋能近700品类家居设备，覆盖多种日常生活场景，始终保持市场领先。

可以预见，随着chatGPT等大模型技术应用的逐渐展开，机器的交互能力将不断增强，用户将更愿意与之互动，用户粘性的增加也将反向推动交互能力的进一步提升，人机交互浪潮将愈演愈烈。接下来，云知声将继续向感知与分析、认知技术、决策与生成三大方向发力，持续探索智能交互边界，以技术优势赋予AIoT无限想象，打开更多市场空间。

责任编辑：kj005

文章投诉热线:156 0057 2229 投诉邮箱:29132 36@qq.com