DeepSeek塞进小盒子?ESP32微型AI伴侣开发指南!

原创 嵌入式大杂烩 2025-03-28 11:38

大家好,我是杂烩君。

今天要给大家介绍的,是一个充满趣味与挑战的开源项目 —— 小智 AI 聊天机器人。

一、小智简介

小智 AI 聊天机器人是虾哥开发的开源项目,以 MIT 许可证发布:

https://github.com/78/xiaozhi-esp32

这个项目旨在帮助更多人踏入 AI 硬件开发的大门,让我们了解如何将当下热门的大语言模型应用到实际硬件设备中。

面包板效果:

已经支持的开源硬件:

  • 立创·实战派 ESP32-S3 开发板
  • 乐鑫 ESP32-S3-BOX3
  • M5Stack CoreS3
  • AtomS3R + Echo Base
  • AtomMatrix + Echo Base
  • 神奇按钮 2.4
  • 微雪电子 ESP32-S3-Touch-AMOLED-1.8
  • LILYGO T-Circle-S3
  • 虾哥 Mini C3
  • Moji 小智AI衍生版
  • 璀璨·AI吊坠
  • 无名科技Nologo-星智-1.54TFT
  • 无名科技Nologo-星智-0.96TFT
  • SenseCAP Watcher

二、小智已实现功能

  • 多样联网方式:支持 Wi-Fi 和 ML307 Cat.1 4G 联网。

  • 便捷唤醒与打断:BOOT 键唤醒和打断,支持点击和长按两种触发方式,还具备离线语音唤醒 ESP - SR 功能,操作简单又高效,能实时打断对话,就像和真人聊天一样自然。

  • 强大的语音交互:实现流式语音对话,支持国语、粤语、英语、日语、韩语 5 种语言识别。

  • 优质大模型加持:集成了大模型 TTS(火山引擎或 CosyVoice)和大模型 LLM(Qwen, DeepSeek, Doubao),拥有可配置的提示词和音色,还具备短期记忆功能,每轮对话后能自我总结,让对话更加连贯和智能。

  • 丰富的显示功能:OLED/LCD 显示屏不仅能显示信号强弱,还能展示对话内容,甚至支持 LCD 显示图片表情,为你的聊天增添更多乐趣。

三、硬件支持

项目支持多种开源硬件,从立创・实战派 ESP32 - S3 开发板,到乐鑫 ESP32 - S3 - BOX3、M5Stack CoreS3 等,满足不同开发者的需求。

而且,它还支持面包板手工制作,对于想要亲手实践的朋友来说,是个绝佳的机会。

详细教程可在飞书文档《小智 AI 聊天机器人百科全书》中查看,即使是硬件小白,也能轻松上手。

https://ccnphfhqs21z.feishu.cn/wiki/F5krwD16viZoF0kKkvDcrZNYnhb

四、开发环境与智能体配置

  • Cursor 或 VSCode
  • 安装 ESP-IDF 插件,选择 SDK 版本 5.3 或以上
  • Linux 比 Windows 更好,编译速度快,也免去驱动问题的困扰
  • 使用 Google C++ 代码风格,提交代码时请确保符合规范

如果我们已经拥有一个小智 AI 聊天机器人设备,可以登录 xiaozhi.me 控制台进行配置。

同时,项目还提供了详细的 WebSocket 通信协议文档,对于想要在个人电脑上部署服务器的朋友,可以参考:

https://github.com/78/xiaozhi-esp32/blob/main/docs/websocket.md

五、Linux版本小智

百问网团队最近也在嵌入式Linux平台上进行适配,项目链接:

https://github.com/100askTeam/xiaozhi-linux

已支持硬件列表:

  • 100ASK_T113s3-PRO Tina4系统 : 100ASK_T113s3-Pro_Tina4
  • 100ASK_T113s3-PRO Tina5系统: 100ASK-T113s3-Pro_Tina5
  • DongshanPI-AICT Tina4系统 : DongshanPI-AICT
  • 100ASK_IMX6ULL-PRO Buildroot20系统 : 100ASK_IMX6ULL-PRO

感兴趣的朋友可以去玩一玩。无论是从学习技术,还是从享受趣味科技的角度来看,都非常值得一试。


猜你喜欢:

嵌入式编程模型 | MVC模型

嵌入式编程模型 | 观察者模式

手把手教你搭建嵌入式容器化开发环境!

一款优雅的嵌入式多功能调试器!

一个非常轻量的嵌入式日志库!

一个非常轻量的嵌入式线程池库!

Github上热门 C 语言项目汇总!

实用 | 10分钟教你通过网页点灯

嵌入式开发必备技能 | Git子模块

嵌入式大杂烩 专注于嵌入式技术,包括但不限于C/C++、嵌入式、物联网、Linux等编程学习笔记,同时,内包含大量的学习资源。欢迎关注,一同交流学习,共同进步!
评论 (0)
  • 真空容器的材料选择取决于其应用场景(如科研、工业、医疗)、真空等级(低真空、高真空、超高真空)以及环境条件(温度、压力、化学腐蚀等)。以下是常见材料及其优缺点分析:1. 不锈钢(如304、316L)优点:耐腐蚀性强:316L含钼,耐酸碱和高温氧化,适合高真空和腐蚀性环境。高强度:机械性能稳定,可承受高压差和外部冲击。低放气率:经电解抛光或镀镍处理后,表面放气率极低,适合超高真空系统(如粒子加速器、半导体镀膜设备)。易加工:可焊接、铸造,适合复杂结构设计。缺点:重量大:大型容器运输和安装成本高。磁
    锦正茂科技 2025-03-29 10:52 47浏览
  • 真空容器内部并非wan全没有压强,而是压强极低,接近于零。真空状态下的压强与容器内外气体的分子数量、温度以及容器本身的性质有关。一、真空与压强的基本概念真空指的是一个空间内不存在物质或物质极少的状态,通常用于描述容器或系统中气体的稀薄程度。压强则是单位面积上所受正压力的大小,常用于描述气体、液体等流体对容器壁的作用力。二、真空状态下的压强特点在真空状态下,容器内部的气体分子数量极少,因此它们对容器壁的作用力也相应减小。这导致真空容器内部的压强远低于大气压强,甚至接近于零。然而,由于技术限制和物理
    锦正茂科技 2025-03-29 10:16 148浏览
  •        随着智能驾驶向L3级及以上迈进,系统对实时性的要求已逼近极限。例如,自动紧急制动(AEB)需在50毫秒内完成感知、决策到执行的全链路响应,多传感器数据同步误差需小于10微秒。然而,传统基于Linux-RT的方案在混合任务处理中存在天然缺陷——其最大中断延迟高达200微秒,且多任务并发时易引发优先级反转问题。据《2024年智能汽车电子架构白皮书》统计,超60%的车企因实时性不足被迫推迟舱驾一体化项目落地。为旌电子给出的破局之道,是采用R5F(实
    中科领创 2025-03-29 11:55 219浏览
  • 在工业控制与数据采集领域,高精度的AD采集和实时显示至关重要。今天,我们就来基于瑞芯微RK3568J + FPGA国产平台深入探讨以下,它是如何实现该功能的。适用开发环境如下:Windows开发环境:Windows 7 64bit、Windows 10 64bitLinux开发环境:Ubuntu18.04.4 64bit、VMware15.5.5U-Boot:U-Boot-2017.09Kernel:Linux-4.19.232、Linux-RT-4.19.232LinuxSDK:LinuxSD
    Tronlong 2025-03-28 10:14 172浏览
  • 本文介绍瑞芯微RK356X系列复用接口配置的方法,基于触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。复用接口介绍由下图可知,红圈内容当前引脚可配置为SPI0或者PWM0功能。由标准系统固件以及相关系统手册可得,当前接口默认配置为SPI0功能:console:/ # ls dev/spidev0.0dev/spidev0.0再由原理图可知当前GPIO为GPIO0_C3
    Industio_触觉智能 2025-03-28 18:14 142浏览
  • Shinco音响拆解 一年一次的面包板社区的拆解活动拉开帷幕了。板友们开始大显身手了,拆解各种闲置的宝贝。把各自的设计原理和拆解的感悟一一向电子爱好者展示。产品使用了什么方案,用了什么芯片,能否有更优的方案等等。不仅让拆解的人员了解和深入探索在其中。还可以让网友们学习电子方面的相关知识。今天我也向各位拆解一个产品--- Shinco音响(如下图)。 当产品连接上电脑的耳机孔和USB孔时,它会发出“开机,音频输入模式”的语音播报,。告诉用户它已经进入音响外放模式。3.5mm耳机扣接收电脑音频信号。
    zhusx123 2025-03-30 15:42 78浏览
  • 在智能语音交互设备开发中,系统响应速度直接影响用户体验。WT588F系列语音芯片凭借其灵活的架构设计,在响应效率方面表现出色。本文将深入解析该芯片从接收指令到音频输出的全过程,并揭示不同工作模式下的时间性能差异。一、核心处理流程与时序分解1.1 典型指令执行路径指令接收 → 协议解析 → 存储寻址 → 数据读取 → 数模转换 → 音频输出1.2 关键阶段时间分布(典型值)处理阶段PWM模式耗时DAC模式耗时外挂Flash模式耗时指令解析2-3ms2-3ms3-5ms存储寻址1ms1ms5-10m
    广州唯创电子 2025-03-31 09:26 98浏览
  • 3月27日,长虹中玖闪光超高剂量率电子射线放射治疗系统(e-Flash)临床试验项目在四川大学华西医院正式启动,标志着该项目正式进入临床试验阶段。这不仅是我国医学技术领域的一项重大突破,更是我国在高端医疗设备研发和应用方面的重要里程碑。e-Flash放射治疗系统适用于哪些病症,治疗周期为多久?会不会产生副作用?治疗费用高不高……随着超高剂量率电子射线放射治疗系统(e-Flash)正式进入临床试验阶段,社会各界对该项目的实施情况尤为关注。对此,中国工程院院士范国滨,以及四川大学华西医院、四川省肿瘤
    华尔街科技眼 2025-03-28 20:26 287浏览
  • 在智能家居领域,无线门铃正朝着高集成度、低功耗、强抗干扰的方向发展。 WTN6040F 和 WT588F02B 两款语音芯片,凭借其 内置EV1527编解码协议 和 免MCU设计 的独特优势,为无线门铃开发提供了革命性解决方案。本文将深入解析这两款芯片的技术特性、应用场景及落地价值。一、无线门铃市场痛点与芯片方案优势1.1 行业核心痛点系统复杂:传统方案需MCU+射频模块+语音芯片组合,BOM成本高功耗瓶颈:待机电流
    广州唯创电子 2025-03-31 09:06 66浏览
  • 在智能语音设备开发中,高音量输出是许多场景的核心需求,例如安防警报、工业设备提示、户外广播等。 WT588F02BP-14S 和 WTN6040FP-14S 两款语音芯片,凭借其内置的 D类功放 和 3W大功率输出 能力,成为高音量场景的理想选择。本文将从 性能参数、应用场景、设计要点 三大维度,全面解析这两款芯片的选型策略。一、核心参数对比与选型决策参数WT588F02BP-14SWTN6040FP-14S输出功率3W@4Ω(THD<1%)3W@4Ω(THD<0.8%)功
    广州唯创电子 2025-03-28 09:15 111浏览
  • 本文介绍OpenHarmony5.0 DevEco Studio开发工具安装与配置,鸿蒙北向开发入门必备!鸿蒙北向开发主要侧重于应用层的开发,如APP开发、用户界面设计等,更多地关注用户体验、应用性能优化、上层业务逻辑的实现,需要开发者具备基本的编程知识、对操作系统原理的简单理解,以及一定的UI设计感。由触觉智能Purple Pi OH鸿蒙开发板演示。搭载了瑞芯微RK3566四核处理器,支持开源鸿蒙OpenHarmony3.2至5.0系统,适合鸿蒙开发入门学习。下载与安装开发工具点下面链接下载:
    Industio_触觉智能 2025-03-28 18:16 189浏览
  • 一、真空容器的定义与工作原理真空容器是一种能够创造并保持一定真空度的密闭容器。其工作原理通常涉及抽气系统,该系统能够逐渐抽出容器内部的气体分子,从而降低容器内的气压,形成真空环境。在这个过程中,容器的体积并不会因抽气而改变,但容器内的压力会随着气体的抽出而逐渐降低。二、真空容器并非恒压系统真空容器并非一个恒压系统。恒压系统指的是在外部环境变化时,系统内部压力能够保持相对稳定。然而,在真空容器中,随着气体的不断抽出,内部压力会持续降低,直至达到所需的真空度。因此,真空容器内部的压力是变化的,而非恒
    锦正茂科技 2025-03-29 10:23 142浏览
  • 文/杜杰编辑/cc孙聪颖‍3月11日,美国总统特朗普,将自费8万美元购买的特斯拉Model S,开进了白宫。特朗普此举,绝非偶然随性,而是有着鲜明的主观意图,处处彰显出一种刻意托举的姿态 。特朗普也毫不讳言,希望他的购买能推动特斯拉的发展。作为全球电动车鼻祖,特斯拉曾凭借创新理念与先进技术,开辟电动汽车新时代,引领行业发展潮流。然而当下,这家行业先驱正深陷困境,面临着前所未有的挑战。就连“钢铁侠”马斯克自己都在采访时表示“非常困难”,的确是需要美国总统伸手拉一把了。马斯克踏入白宫的那一刻,特斯拉
    华尔街科技眼 2025-03-28 20:44 173浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦