👉 人类:给 AI 装摄像头 vs AI:当场发现主人三天没洗头【bilibili】
👉 手工打造你的 AI 女友,新手入门教程【bilibili】
小智 AI 聊天机器人作为一个语音交互入口,利用 Qwen / DeepSeek 等大模型的 AI 能力,通过 MCP 协议实现多端控制。
当前 v2 版本与 v1 版本分区表不兼容,所以无法从 v1 版本通过 OTA 升级到 v2 版本。分区表说明参见 partitions/v2/README.md。
使用 v1 版本的所有硬件,可以通过手动烧录固件来升级到 v2 版本。
v1 的稳定版本为 1.9.2,可以通过 git checkout v1 来切换到 v1 版本,该分支会持续维护到 2026 年 2 月。
- Wi-Fi / ML307 Cat.1 4G
 - 离线语音唤醒 ESP-SR
 - 支持两种通信协议(Websocket 或 MQTT+UDP)
 - 采用 OPUS 音频编解码
 - 基于流式 ASR + LLM + TTS 架构的语音交互
 - 声纹识别,识别当前说话人的身份 3D Speaker
 - OLED / LCD 显示屏,支持表情显示
 - 电量显示与电源管理
 - 支持多语言(中文、英文、日文)
 - 支持 ESP32-C3、ESP32-S3、ESP32-P4 芯片平台
 - 通过设备端 MCP 实现设备控制(音量、灯光、电机、GPIO 等)
 - 通过云端 MCP 扩展大模型能力(智能家居控制、PC桌面操作、知识搜索、邮件收发等)
 - 自定义唤醒词、字体、表情与聊天背景,支持网页端在线修改 (自定义Assets生成器)
 
详见飞书文档教程:
面包板效果图如下:
- 立创·实战派 ESP32-S3 开发板
 - 乐鑫 ESP32-S3-BOX3
 - M5Stack CoreS3
 - M5Stack AtomS3R + Echo Base
 - 神奇按钮 2.4
 - 微雪电子 ESP32-S3-Touch-AMOLED-1.8
 - LILYGO T-Circle-S3
 - 虾哥 Mini C3
 - 璀璨·AI 吊坠
 - 无名科技 Nologo-星智-1.54TFT
 - SenseCAP Watcher
 - ESP-HI 超低成本机器狗
 
新手第一次操作建议先不要搭建开发环境,直接使用免开发环境烧录的固件。
固件默认接入 xiaozhi.me 官方服务器,个人用户注册账号可以免费使用 Qwen 实时模型。
👉 新手烧录固件教程
- Cursor 或 VSCode
 - 安装 ESP-IDF 插件,选择 SDK 版本 5.4 或以上
 - Linux 比 Windows 更好,编译速度快,也免去驱动问题的困扰
 - 本项目使用 Google C++ 代码风格,提交代码时请确保符合规范
 
- 自定义开发板指南 - 学习如何为小智 AI 创建自定义开发板
 - MCP 协议物联网控制用法说明 - 了解如何通过 MCP 协议控制物联网设备
 - MCP 协议交互流程 - 设备端 MCP 协议的实现方式
 - MQTT + UDP 混合通信协议文档
 - 一份详细的 WebSocket 通信协议文档
 
如果你已经拥有一个小智 AI 聊天机器人设备,并且已接入官方服务器,可以登录 xiaozhi.me 控制台进行配置。
在个人电脑上部署服务器,可以参考以下第三方开源的项目:
- xinnan-tech/xiaozhi-esp32-server Python 服务器
 - joey-zhou/xiaozhi-esp32-server-java Java 服务器
 - AnimeAIChat/xiaozhi-server-go Golang 服务器
 
使用小智通信协议的第三方客户端项目:
- huangjunsen0406/py-xiaozhi Python 客户端
 - TOM88812/xiaozhi-android-client Android 客户端
 - 100askTeam/xiaozhi-linux 百问科技提供的 Linux 客户端
 - 78/xiaozhi-sf32 思澈科技的蓝牙芯片固件
 - QuecPython/solution-xiaozhiAI 移远提供的 QuecPython 固件
 
这是一个由虾哥开源的 ESP32 项目,以 MIT 许可证发布,允许任何人免费使用,修改或用于商业用途。
我们希望通过这个项目,能够帮助大家了解 AI 硬件开发,将当下飞速发展的大语言模型应用到实际的硬件设备中。
如果你有任何想法或建议,请随时提出 Issues 或加入 QQ 群:1011329060

