aihot  2022-05-06 20:07:19  赢咖4 |   查看评论   
  最近小米发布了小爱音箱Art。这款音箱采用了全新的金属机身,机身扬声器开口设计为0.7mm厚的金属装饰板,兼具功能和质感。小米爱音箱Art通过2.5英寸全频扬声器,让声音的细节更加自然。

  作为小米推出的第9款智能音箱,小米萧艾音箱art也在技术上全面升级,搭载第三代萧艾同学,支持情感语音交互、全屋播放、就近唤醒。通过这款音箱可以看出,小米的声学语音技术已经进行了充分的自研,并且在自研的部分领域还在继续。

  情感语音交互:情感TTS有迭代声学模型支持。

  对于智能设备来说,实现情感语音交互是一个挑战。“情感”本身就是主观多样的感受。一种情绪可以以多种形式呈现,更适合人与人之间面对面的对话。情感语音交互对技术要求很高,技术方、数据方、质检方等各方要在情感浓度、情感解读方法等标准上达成共识,统一和规范主观情感音位。

  随着赢咖4技术的发展,在实现人机对话的基础上,各大厂商都在探索情感语音交互领域。为了给机器添加情感元素,小米AILab在“情感数据量有限”的前提下,通过不同的声学模型和不同的声码器,最终推出了具有自然拟人效果的情感TTS,成为业内首家大规模推出情感TTS的企业。

  通过小米AILab的不断培养,小米萧艾同学Art完全支持情感语音交互。基于有限但不同类型的情感音频数据(如快乐、关心、害羞、惊喜等。),通过不同的技术对声学模型进行训练和迭代,最终支持情感TTS合成,实现“萧艾同学”的影响力和拟人化。

  未来,小米语音将升级这项技术,支持情感TTS的实时合成。从下图可以看出,在大数据集预训练模型的基础上,利用目标说话人的中性情感数据对网络进行微调,得到目标说话人的中性情感模型;在此基础上,利用带有情感的小批量数据进一步对模型进行微调,最终得到带有不同情感的模型,最终实现情感合成。

  在国内语音助手行业,小米首次实现了情感TTS的大规模落地。未来将打造情感更加丰富的“小爱同学”,为用户提供多样化的语音交互体验,为赢咖4注册设备增添更丰富、更立体、更真实的语音交互体验。

  语音支持全室播放:立体声组合同步播放同一音频。

  小米爱音箱Art是第一款可以实现全屋播放语音支持的设备。用户可以直接对萧艾的同学说“全屋播放XX”,无需提前在App端手动设置即可实现一句话语音交互,为用户提供了更便捷的使用方式。

  要实现这个功能,音箱需要具备AIoT播放技术。在克服了无线网络抖动、晶振时钟漂移、弱网络下数据不可访问等一系列技术难题后,小米AIoTplayback自研技术将不同音箱播放的声音同步优化到微秒级,同时实现了不同类型音箱之间的数据同步,提供更细腻的音质和宽广的声像。
 

除特别注明外,本站所有文章均为 赢咖4注册 原创,转载请注明出处来自小米语音系统再次升级,竟然可以模仿人的声音

留言与评论(共有 0 条评论)
   
验证码:
[lianlun]1[/lianlun]