叮当是一款可以工作在 Raspberry Pi 上的中文语音对话机器人/智能音箱项目。
授权协议:GPL
开发语言:Python
操作系统:跨平台
叮当是一款可以工作在 Raspberry Pi 上的中文语音对话机器人/智能音箱项目。
叮当包括以下诸多特性
模块化。功能插件、语音识别、语音合成、对话机器人都做到了高度模块化,第三方插件单独维护,方便继承和开发自己的插件。
微信接入。支持接入微信,并通过微信远程操控自己家中的设备。
中文支持。集成百度、科大讯飞、阿里、谷歌等多家中文语音识别和语音合成技术,且可以继续扩展。
对话机器人支持。支持接入图灵机器人、Emotibot,未来还将支持接入更多机器人。
全局监听,离线唤醒。支持无接触地离线语音指令唤醒。
灵活可配置。支持定制机器人名字,支持选择语音识别和合成的插件。
智能家居。集成 HomeAssistant 插件,支持语音控制智能家电。
叮当的工作模式
叮当被唤醒后,用户的语音指令先经过在线 STT 引擎进行 ASR 识别成文本,然后对识别到的文本进行技能匹配,交给适合处理该指令的技能插件去处理。插件处理完成后,得到的结果再交给 TTS 引擎合成成语音,播放给用户。
虽然一次交互可能包含多次网络请求,不过带来的好处是:每一个环节都可以被修改和定制。
Raspberry Pi 全系列,或其他 Linux 主机;
USB 麦克风(建议选购麦克风阵列);
音箱(不建议蓝牙音箱);
至少 8G 的 Micro-SD 内存卡(刷镜像要求内存卡的实际容量至少 7.9 GB,否则可能刷不成功);
摄像头(可选,用于拍照)。
读卡器(可选,用于刷镜像进内存卡)。