小众AI

xiaozhi-esp32
xiaozhi-esp32 - 基于 ESP32 的 AI 聊天机器人
xiaozhi-esp32是一款基于 ESP-IDF 开发框架的开源硬件项目,旨在利用低成本硬件打造个人专属的 AI 聊天机器人。它通过 WebSocket 或 UDP 协议与 LLM、TTS API 服务连接,实现实时语音交互功能,无需在设备上运行 LLM,支持中文在内的多国语言、语音识别用户身份、自定义提示词和音色等功能,兼容多款 ESP32 开发板。
  代码仓

xiaozhi-esp32是一款基于 ESP-IDF 开发框架的开源硬件项目,旨在利用低成本硬件打造个人专属的 AI 聊天机器人。它通过 WebSocket 或 UDP 协议与 LLM、TTS API 服务连接,实现实时语音交互功能,无需在设备上运行 LLM,支持中文在内的多国语言、语音识别用户身份、自定义提示词和音色等功能,兼容多款 ESP32 开发板。

主要功能

  • Wi-Fi / ML307 Cat.1 4G
  • BOOT 键唤醒和打断,支持点击和长按两种触发方式
  • 离线语音唤醒 ESP-SR
  • 流式语音对话(WebSocket 或 UDP 协议)
  • 支持国语、粤语、英语、日语、韩语 5 种语言识别 SenseVoice
  • 声纹识别,识别是谁在喊 AI 的名字 3D Speaker
  • 大模型 TTS(火山引擎 或 CosyVoice)
  • 大模型 LLM(Qwen2.5 72B 或 豆包 API)
  • 可配置的提示词和音色(自定义角色)
  • 短期记忆,每轮对话后自我总结
  • OLED / LCD 显示屏,显示信号强弱或对话内容

安装和使用

面包板手工制作实践

详见飞书文档教程:

👉 《小智 AI 聊天机器人百科全书》

已支持的开源硬件

固件部分

免开发环境烧录

新手第一次操作建议先不要搭建开发环境,直接使用免开发环境烧录的固件。固件使用的是作者友情提供的测试服,目前开放免费使用,请勿用于商业用途。

👉 Flash烧录固件(无IDF开发环境)

开发环境
  • Cursor 或 VSCode
  • 安装 ESP-IDF 插件,选择 SDK 版本 5.3 或以上
  • Linux 比 Windows 更好,编译速度快,也免去驱动问题的困扰

AI 角色配置

如果你已经拥有一个小智 AI 聊天机器人,可以参考 👉 后台操作视频教程

详细的使用说明以及测试服的注意事项,请参考 👉 小智测试服的帮助说明


更多...


gptme
终端中的个人 AI 助手,带有工具,因此它可以:使用终端、运行代码、编辑文件、浏览 Web、使用视觉等等; 通过简单但功能强大的 CLI 协助各种知识工作,尤其是编程。
AI-on-the-edge-device
演示了使用 **ESP32**(一种低成本、支持 AI 的设备)进行边缘计算,以数字化您的模拟电表,无论是水表、燃气表还是电表。通过经济实惠的硬件和简单的说明,您可以将任何标准仪表变成智能设备。
Lite.Ai.ToolKit
一个轻量级的 C++ 工具包,包含 100+ 个很棒的 AI 模型,例如对象检测、人脸检测、人脸识别、分割、遮罩等。请参阅 Model Zoo 和 ONNX Hub、MNN Hub、TNN Hub、NCNN Hub。