度家语音一体化是什么,语义集成应该怎么做-赢咖4注册

aihot 2022-04-30 20:29:22 赢咖4注册 | 查看评论

当你想知道明天的天气，可以直接问家里的智能音箱；开车时想切换导航路线，可以直接说出新的目的地；当你觉得空调不够凉的时候，你也可以直接告诉空调调低温度…

智能标准可能非常广泛，但语音交互是最基本的门槛。

在刚刚结束的2021云志技术论坛上，百度AI云给度家语音和语义集成平台留了不少空间。在语音能力逐渐成为“智能”的代名词，并升级为赢咖4注册产品标配的情况下，百度AI云的计划是什么？

01技术的幸存者偏差

与机器对话似乎不是一个新概念。

早在20世纪80年代，语音识别就开始走出实验室，并有了商业应用。虽然机器只能识别单个单词，而且识别准确率保持在相当低的水平，但却没能阻止人们的尝鲜。IBM的Via-vioce系统，微软的Whisper系统，英国剑桥大学的HTK系统相继诞生。

2010年是语音识别的转折点。一些学者开始将深度学习技术引入语音识别领域，语音识别的准确率不断打破新纪录。

到2015年底，百度语音识别的准确率首次达到90%，相当于人类对同一段对话的速记水平。谷歌在2017年6月宣布语音识别准确率达到95%。仅仅10个月后，就被百度以97%的准确率超越。

技术已经被证明是产业繁荣的催化剂，语音识别的商业化就是一个直接的例子。

根据华西证券的研究报告，AIoT是大众接触消费者最常见的渠道。目前，智能语音已经应用于智能手机、可穿戴设备、智能汽车、智能家居等产品。2020年市场规模为241.1亿元，预计到2023年市场规模将达到570.3亿元。

语音技术的成熟和语音市场的持续繁荣是否预示着语音交互的用户体验已经彻底告别了早期采用者时期？

事实可能有些令人失望。心理学上有个概念叫幸存者偏差。如果以百度这样的技校为主，语音交互早就上了一个新台阶。但在相当比例的智能硬件产品中，唤醒率低、识别率低、答非所问等现象仍是一种常态。像百度这样的头部玩家还在刷新纪录，但是很多主要的语音控制产品还处于伪智能阶段。

2度族给出的最优解

对于这种市场现象，不难给出合理的解释。

语音技术在消费者服务中的应用通常有两种方式:一种是将语音技术能力封装成SDK或API，由下游客户或开发者直接调用。优势在于成本低，但技术能力因人而异；二是提供定制化解决方案，即根据客户需求进行定制和深度合作，在一定程度上保证了终端的用户体验。缺点是成本高。

这大概就是百度AI云推出度家平台的原因吧。与上述两种合作模式不同的是，杜家的语音语义融合的思路让外界看到了三个优势:

首先，独家输出软硬件解决方案，集成百度自主研发的洪湖芯片，打破了传统解决方案在性能、兼容性、扩展性等方面的束缚。

比如传统芯片的平均功耗往往很高，而鸿鹄芯片直接在云端识别提取的语音特征，准确率很高，不仅保证了语音识别的准确率，而且平均功耗只有100mw鸿鹄芯片支持多达六路麦克风阵列语音信号，支持deep peak、deep cnn语音唤醒和百度最新的双麦克风模型波束算法，可满足设备唤醒后的360度死角识别；同时可以集成各种Android和linux芯片作为板载解决方案。

关于本站

加入我们

网站合作

标签（推荐）