Python

AI开源软件 > Python

一个 100% 本地替代 Manus AI 的方案，这款支持语音的 AI 助理能够自主浏览网页、编写代码和规划任务，同时将所有数据保留在您的设备上。专为本地推理模型量身打造，完全在您自己的硬件上运行，确保完全的隐私保护和零云端依赖。

Magentic-UI 是一个以人为本的界面的研究原型，由多代理系统提供支持，可以在 Web 上浏览和执行作，生成和执行代码，以及生成和分析文件。 Magentic-UI 对于需要在 Web 上执行作（例如，填写表单、自定义食品订单）、在未被搜索引擎索引的网站中进行深度导航（例如，过滤航班、从个人站点查找链接）或需要 Web 导航和代码执行的任务（例如，从在线数据生成图表）的 Web 任务特别有用。

dify - 易用的 LLMOps 平台

Dify 是一个易用的 LLMOps 平台，旨在让更多人可以创建可持续运营的原生 AI 应用。Dify 提供多种类型应用的可视化编排，应用可开箱即用，也能以“后端即服务”的 API 提供服务。

Craw4AI - LLM友好的网页爬虫

Crawl4AI旨在让网页爬取和数据提取变得简单而高效。无论构建复杂的 AI 应用程序还是增强大语言模型，Crawl4AI 都能提供简化工作流程所需的工具。凭借完全的异步支持，Crawl4AI 可确保爬取任务快速、可靠且可扩展。

Opik - 评估、测试和监控 LLM 应用

Opik 是一个用于评估、测试和监控 LLM 应用程序的开源平台。由 Comet 建造。从 RAG 聊天机器人到代码助手，再到复杂的代理管道等等，通过跟踪、评估和仪表板构建运行得更好、更快、更便宜的 LLM 系统。

Suna - 开源多面手 AI 代理

Suna 是一个完全开源的 AI 助手，可帮助您轻松完成实际任务。通过自然对话，Suna 成为您进行研究、数据分析和日常挑战的数字伴侣 — 将强大的功能与直观的界面相结合，了解您的需求并提供结果。

Void - Cursor 的开源平替

Void，这款编辑器号称是开源的 Cursor 和 GitHub Copilot 替代品，而且完全免费！

UI-TARS - 基于视觉语言模型的多模式代理

基于视觉语言模型（Vision-Language Model）的 GUI 代理应用，允许用户通过自然语言控制电脑操作。它结合了视觉识别和自然语言处理技术，能够理解用户的指令并执行相应的操作。

fastmcp - 更好用的 MCP Python 框架

用于构建 MCP（Model Context Protocol）服务器和客户端的 Python 框架，帮助开发者以更快速、简洁的方式向 LLM 暴露数据资源和工具。

Agent-S - 操作计算机的智能代理框架

让 AI 像人一样操作电脑（如 macOS、Windows、Linux、Android），可自动完成复杂的 GUI 操作任务的 AI Agent 框架。它采用“通用体+专家体”组合架构，支持主动分层规划。

cua - 为 AI 智能体提供高性能虚拟环境

一个专为 AI 智能体设计的高性能操作系统虚拟化与控制框架。它通过轻量级、近乎原生速度的虚拟容器，让 AI Agent 能够在完全隔离的 macOS 或 Linux 环境中自动执行“用电脑”任务，如操作应用、上网、写代码、自动化复杂办公流程等，并内置多种主流 LLM（大模型）接口。

WeClone - 用微信聊天记录微调大语言模型

使用微信聊天记录微调大语言模型，使用微信语音消息大模➕0.5B大模型实现高质量声音克隆，并绑定到微信机器人，实现自己的数字分身。数字克隆/数字分身/声音克隆/LLM/大语言模型/微信聊天机器人/LoRA

BitNet - 微软开源的 1-bit 大模型推理框架

微软专为 CPU 本地推理和极致压缩（低比特）大模型设计的推理框架。它支持对 1-bit/1.58-bit 量化模型进行高效、低能耗的推理，兼容 BitNet、Llama3-8B-1.58、Falcon3 等模型，无需 GPU。

index - 自动化浏览器智能体

在做浏览器自动化脚本时，我们常常需要编写大量代码来处理复杂的网页交互，不仅耗时耗力，还难以调试和优化，要是出错更是难以精准定位问题所在。

bininote - 使用AI将视频转换了Markdown笔记

BiliNote 是一个开源的 AI 视频笔记助手，支持通过哔哩哔哩、YouTube 等视频链接，自动提取内容并生成结构清晰、重点明确的 Markdown 格式笔记。支持插入截图、原片跳转等功能。

更多...

小众AI