交互系统的构建之(三)TTS语音合成的加盟
本文将完成:
TTS语音合成模块,具体是移植 Ekho(余音)TTS引擎并整合到TLD系统中。
有关于本系统构建的文章结构都会由三个部分来组织,一是该功能模块的介绍和在Linux下简单应用的实现;二是将该功能模块整合到交互系统(先以TLD为地基)中去;三是分析目前存在的问题与未来的解决构思。
一、TTS的介绍和Ekho(余音)TTS的安装与
二、整合Ekho(余音)TTS引擎到TLD系统中
1、文件整合:
我的人机交互系统的工程目录是mysystem。
拷贝ekho-4.12源码目录下的libekho.a和lib/*到新建的mysystem/lib下,再将ekho-4.12源码目录下的config.h和include/*,还有sonic/*.h、utfcpp/source/*拷贝到mysystem/include目录下。拷贝结束后,大概的代码结构如下:(红色的部分是TLD本身的,其他的是由ekho加入的,有地方有省略。可能看懂下面这些得先看前面的“目前已完成”的内容)
.
├── bounding_boxes.txt
├── include
│ ├── config.h
│ ├──FerNNClassifier.h
│ ├── festival
│ │ ├── festival.h
│ │ ├── fngram.h
│ │ ├── ......
│ ├──LKTracker.h
│ ├── sonic.h