开源机器人论坛

瓦力机器人接入deepseek实现对话教程

瓦力机器人

abby 2026 年3 月 30 日 08:26 1

前言：

我们使用瓦力机器人的形象仅为技术分享与演示，无任何商业目的。

本篇教程主要介绍瓦力机器人通过树莓派接入deepseek实现对话的全过程，本项目附有镜像文件、接线图，有兴趣的伙伴自取。

接入deepseek的瓦力可以“思考”实现自由对话，但整体反馈速度较慢需要8秒左右，目前我们还没接入动作和联网思考。

本篇希望能给对瓦力AI对话感兴趣的伙伴提供思路，想继续升级的朋友可以自行尝试，期待各位不同的瓦力！

具体实现效果可参考我们发布的视频：

需要准备的硬件

关于瓦力机器人如何如何组装、3D打印文件、arduino舵机校准等具体操作请移步上篇。

从零开始制作的材料清单请参考：

接入deepseek的方案用到的主控硬件是树莓派，还需要一对喇叭和一个麦克风。

树莓派4代B型*1个，规格：4代B型，单主板内存RAM：8GB
喇叭和麦克风找相似的就可以

上篇篇中接入的语音模块硬件套组可以移除：

这些不需要使用：

ASR-PRO语音智能语音识别控制模块*1个，规格：ASR-PRO喇叭

ASR-PRO语音智能语音识别控制模块*1个，规格：STC-LINK官方下载器（核心板专用）不带壳+4P杜邦线

ASR-PRO语音智能语音识别控制模块*1个，规格：ASR-PRO核心板4M（排针未焊）

ASR-PRO语音智能语音识别控制模块*1个，规格：高灵敏度麦克风带咪套（核心板专用）

接线图

（需要高清PDF版请留言）

实现思路

以下介绍我们的整体实现思路和操作，感兴趣的可以试一下。

要让瓦力机器人装上deepseek的“大脑”实现对话效果，基础的思路是这样的：

瓦力需要被唤醒词唤醒——接着瓦力需要实时语音识别——把识别到的内容发送到deepseek进行思考——把思考的结果通过语音播放出来。

文件资料

这是我们整理好的文件包，可以先下载。

点击跳转：瓦力接入deepseek文件

29863d5f72743b56d379c02a44c41db91332×796 73.3 KB

文件说明：

boot.img 配置好的镜像文件可以直接刷到内存卡使用
bye.mp3 语音退出提示音
requirement.txt 运行环境整合包
wake_feedback.mp3 唤醒提示音
walle.pmdl 语音唤醒模型
walle.py 主程序

树莓派镜像文件

其中文件“boot.img” 是树莓派镜像文件已经安装好运行环境和所需文件，烧录到树莓派内存卡内，打开主程序可直接运行。

注意：提示音和退出音效可以换成自己喜欢的，但是文件名必须一致

具体操作

1.唤醒词模型

可以直接使用文件里的做唤醒词模型，我们设置的唤醒词是“瓦力瓦力”和“你好瓦力”。

也可以按照以下方法重新设置唤醒词或是自行更换唤醒词模型。

我们用的是开源的语音唤醒引擎snowboy。

Snowboy Personal Wake Word地址：https://snowboy.hahack.com/

直接用它网页上现成的工具就能训练自定义的唤醒词模型，点击录音，把想要的唤醒词录进去。

例如：我们设置的唤醒词是“瓦力瓦力”和“你好瓦力”。

最后生成文件就是瓦力的唤醒词模型了。

也可以直接使用我提供的“walle.pmdl”文件。

2.智能语音识别

语音识别用的是阿里云的智能语音交互。

这一步需要在阿里云创建属于自己的 AppKey

参考网址和资料:

获取AccessKey-阿里云帮助中心

智能语音交互新手指南_智能语音交互(ISI)-阿里云帮助中心

智能语音交互控制台

先去阿里云控制台按照上面的步骤创建一个AccessKey，如果不涉及商业可以选择免费版先试用。

根据这个操作步骤创建：获取AccessKey-阿里云帮助中心

然后登录控制台智能语音交互控制台—新建项目—项目类型选“仅语音识别”。

创建完成后就会得到一个 AppKey，这个Appkey后面需要写入主程序中。

3.创建deepseek API

登录deepseek开放平台官网(https://platform.deepseek.com)

进入进入API keys页面，创建自己的API key。

瓦力主程序

主程序是我们自己写的，如果不想自己写的可以直接用我这个程序。

把刚刚2、3中得到的阿里云的APPkey和deepseek的API key替换成自己的。

这里也可以根据需求设置角色性格，也能更换添加唤醒词和提示音。

有需要的可以自己加一些设置。

例如我的程序里面就加了“15秒没有说话就自动退出，再次唤醒需要重新说唤醒词。退出时播放退出提示音。”

微软文字转语音

在主程序中安装微软的edge TTS，如果需要修改音色可以按照以下方法修改，不想改的可以不用做。

由于deepseek目前还不支持语音输出，所以这个部分我们用的是微软的 Edge TTS文字转语音功能，上面有很多不同的音色可以选择。

在Github上找到喜欢的音色对应的指令，之后在代码里输入音色指令并完成其他语音设置，这样文字转语音就可以实现了。

点击跳转：github TTS音色指令

image1418×836 62.1 KB

树莓派配置

在树莓派创建一个英文文件夹，把文件夹里的文件和修改后的主程序一起拷贝到文件夹根目录。

方法一：直接使用我们给的树莓派镜像文件

这里可以直接使用我们提供的的镜像文件“boot.img ”，里面已经安装好运行环境和所需文件，把它烧录到树莓派内存卡内。

**之后打开主程序，**在终端该目录下执行“python walle.py”这个指令就可以运行主程序了。

方法二：自己配置树莓派环境

在树莓派创建一个英文文件夹，把上面提到的文件还有自己配置的Python环境包一起拷贝到文件夹根目录。

先创建一个虚拟环境命名为walle。

接着就是开始安装Python环境包，直接用requirement.txt这个文件进行安装。

安装前要确保系统一定要确保已经安装了Python3和pip

之后在这个文件夹目录下打开终端执行这个指令“pip install -r requirements.txt”安装环境包

一切准备好后，在终端该目录下执行“python walle.py”这个指令就可以运行主程序开始进行对话。

如果环境一直安装失败，推荐使用方法一，直接使用我们配置好的树莓派文件。

总结

以上就是瓦力接入 DeepSeek 后的整体表现。总得来说，它能顺畅聊天，而且带DeepSeek 大模型的思考，完全可以当个聊天机器人玩一玩。

但是缺点是反应速度比较慢，我们从一开始的 20 秒调到 15 秒，再到现在的 8 秒，虽然快了不少，但和专业聊天机器人比还是有点慢；

我们做的这个版本的deepseek+瓦力目前还不能进行联网搜索和动作控制，但理论上都是可以实现的，有感兴趣的朋友可以尝试看看。