小众AI

xiaozhi-esp32
xiaozhi-esp32 - 基于 ESP32 的 AI 聊天机器人
xiaozhi-esp32是一款基于 ESP-IDF 开发框架的开源硬件项目,旨在利用低成本硬件打造个人专属的 AI 聊天机器人。它通过 WebSocket 或 UDP 协议与 LLM、TTS API 服务连接,实现实时语音交互功能,无需在设备上运行 LLM,支持中文在内的多国语言、语音识别用户身份、自定义提示词和音色等功能,兼容多款 ESP32 开发板。
  代码仓

xiaozhi-esp32是一款基于 ESP-IDF 开发框架的开源硬件项目,旨在利用低成本硬件打造个人专属的 AI 聊天机器人。它通过 WebSocket 或 UDP 协议与 LLM、TTS API 服务连接,实现实时语音交互功能,无需在设备上运行 LLM,支持中文在内的多国语言、语音识别用户身份、自定义提示词和音色等功能,兼容多款 ESP32 开发板。

主要功能

  • Wi-Fi / ML307 Cat.1 4G
  • BOOT 键唤醒和打断,支持点击和长按两种触发方式
  • 离线语音唤醒 ESP-SR
  • 流式语音对话(WebSocket 或 UDP 协议)
  • 支持国语、粤语、英语、日语、韩语 5 种语言识别 SenseVoice
  • 声纹识别,识别是谁在喊 AI 的名字 3D Speaker
  • 大模型 TTS(火山引擎 或 CosyVoice)
  • 大模型 LLM(Qwen2.5 72B 或 豆包 API)
  • 可配置的提示词和音色(自定义角色)
  • 短期记忆,每轮对话后自我总结
  • OLED / LCD 显示屏,显示信号强弱或对话内容

安装和使用

面包板手工制作实践

详见飞书文档教程:

👉 《小智 AI 聊天机器人百科全书》

已支持的开源硬件

固件部分

免开发环境烧录

新手第一次操作建议先不要搭建开发环境,直接使用免开发环境烧录的固件。固件使用的是作者友情提供的测试服,目前开放免费使用,请勿用于商业用途。

👉 Flash烧录固件(无IDF开发环境)

开发环境
  • Cursor 或 VSCode
  • 安装 ESP-IDF 插件,选择 SDK 版本 5.3 或以上
  • Linux 比 Windows 更好,编译速度快,也免去驱动问题的困扰

AI 角色配置

如果你已经拥有一个小智 AI 聊天机器人,可以参考 👉 后台操作视频教程

详细的使用说明以及测试服的注意事项,请参考 👉 小智测试服的帮助说明


更多...


AutoAgent
由香港大学数据智能实验室(HKUDS)开发的一个开源AI智能体框架,托管于GitHub。它允许用户通过纯自然语言描述需求,快速创建和部署定制化的AI智能体,无需任何编程基础。
index
在做浏览器自动化脚本时,我们常常需要编写大量代码来处理复杂的网页交互,不仅耗时耗力,还难以调试和优化,要是出错更是难以精准定位问题所在。
n8n
n8n 是一个开源的工作流自动化工具,类似于 IFTTT。它的优点是开源、可以自托管、下载安装方便、易于使用,可以互联的服务包括 Github、Google、RSS、Slack、Telegram、Gitlab、Redis、RabbitMq、数据库等等上百种服务。