发现分享好用的AI工具、AI开源软件、AI模型、AI变现

STORM 是一个 LLM 系统，它基于 Internet 搜索从头开始编写类似 Wikipedia 的文章。Co-STORM 通过使人类协作 LLM 系统支持更一致和首选的信息搜索和知识管理，进一步增强了其功能。

Claude Code 是由 Anthropic 开发的一款智能编程工具 (agentic coding tool)，能够通过自然语言指令帮助开发者高效编写代码。它可以直接在终端中运行，理解代码库的内容，简化开发过程，无需复杂的配置或额外的服务器支持。

LocalAI - OpenAI、Claude 等的开源替代

AI 的查询引擎 - 用于构建 AI 的平台，可以回答大规模联合数据的问题。MindsDB 内置了 MCP 服务器，使您的 MCP 应用程序能够连接、统一和响应大规模联合数据（跨数据库、数据仓库和 SaaS 应用程序）的问题。

mindsDB - 通过数据库SQL即可利用AI做预测分析

qlib - 微软开源的量化平台

Qlib 是一个开源的、面向 AI 的量化投资平台，旨在利用 AI 技术在量化投资中发挥潜力、赋能研究、创造价值，从探索想法到实施产品。Qlib 支持多种机器学习建模范式，包括监督学习、市场动态建模和强化学习。

LeRobot - 让机械臂接入大模型

Hugging Face推出的开源项目LeRobot引发了业界广泛关注。这一项目通过整合最先进的机器学习算法和便捷的开发工具链，为开发者提供了一个高效、易用的机器人AI开发平台，堪称机器人领域的Transformer时刻。

LemonAI - 全球首个全栈开源通用 AI Agent

一个开源的通用 AI 代理，能够自动化从需求规划到结果交付的整个过程。它可以独立思考和系统规划，在虚拟环境中灵活调用各种工具，例如编写和执行代码、智能浏览 Web、作 Web 应用程序和执行命令。

mcp-agent - 简单的MCP代理框架

一个基于 Model Context Protocol (MCP) 的简单、可组合的框架，用于构建智能代理。它旨在通过 MCP 服务器来管理代理的生命周期，并提供构建生产就绪的 AI 代理的简单模式。

nndeploy - 易用、高性能、支持多端的AI推理部署框架

nndeploy是一个简单易用、高性能、支持多端的AI推理部署框架。主要解决以下模型部署中的痛点。

AgenticSeek - 100% 本地替代 Manus AI 的方案

一个 100% 本地替代 Manus AI 的方案，这款支持语音的 AI 助理能够自主浏览网页、编写代码和规划任务，同时将所有数据保留在您的设备上。专为本地推理模型量身打造，完全在您自己的硬件上运行，确保完全的隐私保护和零云端依赖。

agent-zero - 打造你的AI专属AI助理

Agent Zero 是一个与众不同的 AI 框架，它并非预先定义，而是随着你的使用而有机地成长和学习。它旨在成为一个透明、易读、可理解、可定制和交互式的工具，能够利用你的电脑来完成各项任务。它就像一个通用的个人助理，可以帮你搜集信息、执行命令和代码，与其他智能体协作，尽其所能地完成你给定的任务。

AI-Media2Doc - 视频一键转图文的 AI 工具

AI 视频图文创作助手是一款Web工具, 基于AI大模型, 将视频和音频转化为各种风格的文档, 无需登录注册, 前后端本地部署，以极低的成本体验 AI 视频/音频转风格文档服务。一键将视频和音频转化为小红书/公众号/知识笔记/思维导图/视频字幕等各种风格的文档。

Ableton-MCP - 让音乐制作更智能

AbletonMCP 通过模型上下文协议（MCP）将 Ableton Live 连接到 Claude AI，使 Claude 能够直接与 Ableton Live 交互和控制。此集成支持提示辅助音乐制作、音轨创建和 Live 会话作。

Agent-S - 操作计算机的智能代理框架

让 AI 像人一样操作电脑（如 macOS、Windows、Linux、Android），可自动完成复杂的 GUI 操作任务的 AI Agent 框架。它采用“通用体+专家体”组合架构，支持主动分层规划。

agent-service-toolkit - 轻量级的 AI 代理开发框架

帮助开发者用 Python 快速搭建和运行基于 LangGraph 框架的 AI 代理服务。它结合 FastAPI、Streamlit 和 Pydantic 等技术栈，提供了用户界面、自定义 Agent、流式传输等功能，并集成了内容审核（LlamaGuard）和用户反馈机制（LangSmith），极大地简化了 AI Agent 应用的开发和优化过程。

agent-zero - 打造你的AI专属AI助理

AgenticSeek - 100% 本地替代 Manus AI 的方案

agno - 轻量级的多模态智能代理库

一个高性能、开源的 Python 库，用于构建多模态智能代理。通过统一大语言模型的 API，并赋予它们记忆、知识、工具和推理等强大功能。该项目速度快、内存占用少，支持文本、图像、音频和视频等多种内容形式，以及多代理、结构化输出，兼容几乎任何模型和服务供应商。

AI Hedge Fund - 探索人工智能在交易中的决策

通过模拟多种投资策略的智能代理（agents），进行股票分析和交易决策。项目仅用于教育和研究目的，不适用于实际交易或投资。

ai-financial-agent - 为金融投资打造的AI代理

探索人工智能在投资研究中的应用。

AI-Media2Doc - 视频一键转图文的 AI 工具

AI-on-the-edge-device - 将“旧”设备接入智能世界

演示了使用 **ESP32**（一种低成本、支持 AI 的设备）进行边缘计算，以数字化您的模拟电表，无论是水表、燃气表还是电表。通过经济实惠的硬件和简单的说明，您可以将任何标准仪表变成智能设备。

aisuite - 一个接口调用多个大模型

`aisuite`使开发人员能够通过标准化接口轻松使用多个 LLM。使用类似于 OpenAI 的界面，可以轻松地与最流行的 LLM 进行交互并比较结果。它是 python 客户端库的精简包装器，允许创建者无缝交换和测试来自不同 LLM 提供程序的响应，而无需更改其代码。如今，该库主要专注于聊天完成。我们将在不久的将来将其扩展到更多使用案例。

anx-reader - 集成多种 AI 能力的阅读器

一款为图书爱好者精心打造的电子书阅读器。它具有强大的 AI 功能并支持各种电子书格式，使阅读更智能、更专注。凭借其现代的界面设计，我们致力于提供纯粹的阅读乐趣。

wdoc - 大量异构文档处理和总结

一个功能强大的 RAG（检索增强生成）系统，旨在汇总、搜索和查询各种文件类型的文档。

ai-financial-agent - 为金融投资打造的AI代理

探索人工智能在投资研究中的应用。

Meetily - AI 驱动的会议助手

一个 AI 驱动的会议助手，可捕获实时会议音频、实时转录并生成摘要，同时确保用户隐私。

Spark-TTS - 不依赖模型生成声学特征的TTS

Spark-TTS 完全基于Qwen2.5 构建，无需使用流匹配等额外生成模型。它无需依赖单独的模型来生成声学特征，而是直接从 [LLM]预测的代码中重建音频。这种方法简化了流程，提高了效率并降低了复杂性。

VoiceCanvas - 支持超过 50 种语言的文本转语音

VoiceCanvas 是一款开源的文本转语音系统，支持超过 50 种语言和多种音色选择，还具备声音克隆功能。

STORM - AI编写类似 Wikipedia 的文章

claude-code - 通过自然语言指令帮助开发

LocalAI - OpenAI、Claude 等的开源替代

mindsDB - 通过数据库SQL即可利用AI做预测分析

qlib - 微软开源的量化平台

LeRobot - 让机械臂接入大模型

LemonAI - 全球首个全栈开源通用 AI Agent

# Ai应用所有该分类开源>>

Manus

立刻使用

Manus AI Agent是一款由中国团队研发的全球首款通用型AI Agent产品。

360AI搜索

立刻使用

360推出的新一代答案引擎，全新的AI助手，绿色安全。

Bing Image Creator

立刻使用

Bing Image Creator是微软推出的一款基于深度学习的图片生成工具，能够根据用户的文字描述自动生成高质量的真实图画。

Bolt.New

立刻使用

Bolt 是由 StackBlitz 推出的基于浏览器的 AI 全栈 Web 开发工具，无需本地设置即可进行提示、运行、编辑和部署全栈应用程序，对中文支持很友好。

Bubble AI

立刻使用

Bubble AI是一款可以利用最新的技术包括OpenAI和ChatGPT构建、测试和扩展应用程序的平台。它提供了一种简单而强大的方式来创建功能丰富的网站，并可以自定义和集成各种功能。通过Bubble AI，用户可以使用无代码的方式快速开发应用程序，并利用内置的AI功能提供更智能、更交互式的用户体验。Bubble AI还提供了灵活的定价选项，以满足不同用户的需求。

Canva AI

立刻使用

Canva AI是Canva推出的一系列基于深度学习的创意设计工具，旨在通过自动化和智能化技术简化设计流程，让用户能够轻松创建高质量的图形和视频内容。

ChatGPT

立刻使用

ChatGPT是由OpenAI公司推出的火爆全球的聊天对话机器人，该AI聊天对话工具建立在OpenAI开发的GPT-4语言模型上，它可以执行各种自然语言处理（NLP）任务，如总结、分类、提问和回答，以及类似人类反应的错误纠正。ChatGPT是一项革命性的技术，通过将人们的工作效率提高到一个新的水平，使人们的生活更加轻松。

Claude

立刻使用

Claude是由Anthropic开发的一款强大的人工智能聊天机器人，专注于提供富有个性化的沟通交互体验。

Colorize.cc

立刻使用

Colorize.cc是一款使用深度学习技术为黑白照片和视频上色的人工智能服务。通过几个简单的步骤，您可以在几分钟内给数百张家庭照片上色。

ElevenLabs

立刻使用

ElevenLabs.io是一个基于人工智能技术的文字转语音配音合成平台。它通过先进的深度学习技术，能够生成高保真、高清晰度、高自然度的语音，为用户提供创新的AI语音合成体验。

Github Copilot

立刻使用

Github Copilot是一款由GitHub、OpenAI和Microsoft联合开发的AI辅助开发工具，旨在通过提供代码补全、错误修正、优化建议等功能，帮助开发者更高效地编写代码。

GPTZero - 检测文本是否由人工智能生成

立刻使用

GPTZero是由普林斯顿大学的华人学生Edward Tian开发的一款人工智能模型，它基于深度学习算法和统计特征，能够有效地区分人类书写的文本和由机器（如ChatGPT、GPT-4等）生成的文本。

# C++ 所有该分类开源>>

nndeploy - 易用、高性能、支持多端的AI推理部署框架

nndeploy是一个简单易用、高性能、支持多端的AI推理部署框架。主要解决以下模型部署中的痛点。

AI-on-the-edge-device - 将“旧”设备接入智能世界

Lite.Ai.ToolKit - 一个轻量级的 C++ 工具包

一个轻量级的 C++ 工具包，包含 100+ 个很棒的 AI 模型，例如对象检测、人脸检测、人脸识别、分割、遮罩等。请参阅 Model Zoo 和 ONNX Hub、MNN Hub、TNN Hub、NCNN Hub。

xiaozhi-esp32 - 基于 ESP32 的 AI 聊天机器人

xiaozhi-esp32是一款基于 ESP-IDF 开发框架的开源硬件项目，旨在利用低成本硬件打造个人专属的 AI 聊天机器人。它通过 WebSocket 或 UDP 协议与 LLM、TTS API 服务连接，实现实时语音交互功能，无需在设备上运行 LLM，支持中文在内的多国语言、语音识别用户身份、自定义提示词和音色等功能，兼容多款 ESP32 开发板。

miniMNIST-c - 一个最小的神经网络

在 C 语言中实现了一个最小的神经网络，用于对 MNIST 数据集中的手写数字进行分类。整个实现是 ~200 行代码，并且只使用标准 C 库。

# Golang 所有该分类开源>>

LocalAI - OpenAI、Claude 等的开源替代

one-api - 通过标准的 OpenAI API 格式访问所有的大模型

通过标准的 OpenAI API 格式访问所有的大模型，统一 API 适配，可用于 key 管理与二次分发。

new-api - 新一代大模型网关与AI资产管理系统

AI模型接口管理与分发系统，支持将多种大模型转为OpenAI格式调用、支持Midjourney Proxy、Suno、Rerank，兼容易支付协议，可供个人或者企业内部管理与分发渠道使用，本项目基于One API二次开发。

KrillinAI - 基于 AI 的视频翻译配音工具

简约而强大的工具可以处理从翻译、配音到语音克隆、格式化的所有内容——在横向和纵向模式之间无缝转换视频，以便在所有内容平台（YouTube、TikTok、Bilibili、抖音、微信频道、RedNote、快手）上实现最佳显示。

GeekAI - 基于 AI 大语言模型 API 的 AI 助手全套开源解决方案

GeekAI 基于 AI 大语言模型 API 实现的 AI 助手全套开源解决方案，自带运营管理后台，开箱即用。集成了 OpenAI, Azure, ChatGLM,讯飞星火，文心一言等多个平台的大语言模型。集成了 MidJourney 和 Stable Diffusion AI绘画功能。

ollama - 本地运行各种 LLM

用 Go 语言写的工具，用于在本地一条命令安装、启动和管理大型语言模型，支持 Llama 3、Gemma、Mistral 等大模型，适用于 Windows、macOS、Linux 操作系统。

# Java 所有该分类开源>>

Chat2DB - AI 驱动的数据库工具

AI 驱动的数据库工具和 SQL 客户端，最热门的 GUI 客户端，支持 MySQL、Oracle、PostgreSQL、DB2、SQL Server、DB2、SQLite、H2、ClickHouse 等。

midjourney-proxy - midjourney代理

midjourney-proxy为使用 MidJourney Discord 频道的用户提供了一个代理，使他们可以通过 API 调用 AI 绘图功能。这样的代理能够简化用户与 AI 绘图功能的交互，使得调用过程更加便捷。

# Javascript 所有该分类开源>>

claude-code - 通过自然语言指令帮助开发

LemonAI - 全球首个全栈开源通用 AI Agent

AI-Media2Doc - 视频一键转图文的 AI 工具

lobe-chat - 现代的 ChatGPT、LLMs、UI框架

Dify 是一个易用的 LLMOps 平台，旨在让更多人可以创建可持续运营的原生 AI 应用。Dify 提供多种类型应用的可视化编排，应用可开箱即用，也能以“后端即服务”的 API 提供服务。

NextChat - 构建个性化 AI 助手平台

NextChat，全称为ChatGPTNextWeb，是一款开源免费的私有ChatGPT网页应用部署工具。它适合所有人搭建Web聊天机器人，能够支持GPT3、GPT4、GeminiPro等人工智能大模型，已在Github上获得了显著的关注，这表明其在开发者和用户群体中相当受欢迎，并且该项目已被收购，这无疑预示着NextChat巨大的商业价值潜力。

codex - OpenAI 开源的轻量级编程助手

OpenAI 开源的命令行智能编码助手，旨在通过自然语言交互提升开发效率。它依赖 OpenAI 的 API 服务，仅需配置 OpenAI API Key 即可零门槛上手，支持代码生成、文件操作、版本控制和多模态（截图输入）等功能，适用于个人开发者、团队协作以及 CI/CD 流程。

HowToCook - 程序员在家做饭指南

做饭的时候，偶尔在网上找找菜谱和做法。但是这些菜谱往往写法千奇百怪，经常中间莫名出来一些材料。对于习惯了形式语言的程序员来说极其不友好。

cherry-studio - 多模型支持的跨平台 AI 桌面助手

支持多种大语言模型服务的跨平台桌面客户端，兼容 Windows、Linux 和 macOS 系统。

TrendPublish - 全自动 AI 内容生成与发布

实时追踪和发布人工智能领域的最新趋势。帮助开发者、技术爱好者和研究人员快速获取 AI 领域的动态信息，例如前沿技术、热门项目和行业新闻等。

anx-reader - 集成多种 AI 能力的阅读器

FoloUp - AI 驱动的语音招聘面试官

FoloUp 是一个开源平台，供公司对候选人进行 AI 驱动的招聘面试。

open-webui - 用户友好的 AI 界面

功能强大、用户友好的自托管 AI 平台，支持完全离线运行。它集成了多种大型语言模型运行器，如 Ollama 和 OpenAI 兼容的 API，支持网页搜索、本地 RAG 集成、权限管理、适配移动端、Markdown 和 LaTeX 等功能。

# Jupyter 所有该分类开源>>

Moondream - 小型的视觉语言模型

Moondream开源项目是一个拥有 16 亿参数的视觉AI模型，它采用了 SigLIP、Phi-1.5 技术和 LLaVa 训练数据集，能够在任何平台运行。它致力于通过深度学习和计算机视觉技术实现“看图说话”的神奇功能。

# Python 所有该分类开源>>

wdoc - 大量异构文档处理和总结

一个功能强大的 RAG（检索增强生成）系统，旨在汇总、搜索和查询各种文件类型的文档。

ai-financial-agent - 为金融投资打造的AI代理

探索人工智能在投资研究中的应用。

Meetily - AI 驱动的会议助手

一个 AI 驱动的会议助手，可捕获实时会议音频、实时转录并生成摘要，同时确保用户隐私。

Spark-TTS - 不依赖模型生成声学特征的TTS

VoiceCanvas - 支持超过 50 种语言的文本转语音

VoiceCanvas 是一款开源的文本转语音系统，支持超过 50 种语言和多种音色选择，还具备声音克隆功能。

STORM - AI编写类似 Wikipedia 的文章

mindsDB - 通过数据库SQL即可利用AI做预测分析

qlib - 微软开源的量化平台

LeRobot - 让机械臂接入大模型

mcp-agent - 简单的MCP代理框架

agent-zero - 打造你的AI专属AI助理

watermark-removal - 去除图片水印的AI工具

使用基于机器学习的图像修复方法从图像中去除水印，这与图像的真实版本完全没有区别。

# Rust 所有该分类开源>>

screenpipe - 全天候录制屏幕的 AI 助手

ScreenPipe是一款开箱即用、可离线的桌面 AI 应用。它可以录制屏幕内容、捕获截图和音频，并将数据存储至本地数据库，结合 LLMs 的能力，实现自动记录、上下文感知的 AI 助手，支持中文 OCR、集成 Ollama 和 Llama 等功能。

Tabby - 自托管 AI 编码助手

Tabby 是一个开源的自托管 AI 编码助手。使用 Tabby，每个团队都可以轻松设置自己的 LLM 驱动的代码完成服务器。独立式，无需 DBMS 或云服务。OpenAPI 接口，易于与现有基础设施（例如 Cloud IDE）集成。支持消费级 GPU。

# Typescript 所有该分类开源>>

Upscayl - 免费的 AI 图像放大工具

一款通过 AI 算法提高图像分辨率（超级分辨率，简称超分）的桌面工具，它免费、开源、无需联网、开箱即用，因为内置了模型，所以安装包大约 200+MB，运行要求兼容 Vulkan 的显卡，适用于 Windows、Linux 和 macOS 系统。

Farfalle - 开源的AI搜索引擎

FarFalle 是一款开源的AI搜索引擎项目，类似Perplexity AI。可使用本地或云 LLM 自托管。

Jan - 让你的电脑成为人工智能的电脑

这是一个支持在本地运行开源 LLMs 和连接 ChatGPT 服务的 AI 对话桌面应用，它开箱即用、界面清爽、不挑硬件，支持设置代理、接入 ChatGPT、一键下载/接入适配当前电脑配置的大模型、离线运行等功能，适用于 Windows、Linux、macOS 操作系统。

screenshot-to-code - 将截图转化为 HTML 代码的工具

可以将屏幕截图转化为 HTML/JS/Tailwind CSS 代码，它使用 GPT-4 Vision 生成代码、DALL-E 3 生成相似的图片。

# 内容检测所有该分类开源>>

GPTZero - 检测文本是否由人工智能生成

立刻使用

# 图像处理所有该分类开源>>

watermark-removal - 去除图片水印的AI工具

使用基于机器学习的图像修复方法从图像中去除水印，这与图像的真实版本完全没有区别。

ComfyUI - 不仅是一个用户界面

为Windows和macOS设计的桌面客户端，它提供了一键安装的便利性，并拥有全新的用户界面。用户可以通过加入等待名单来获得早期访问权限。这款软件的主要优点在于它的易用性和现代化的界面设计，旨在提高用户的工作效率。

Upscayl - 免费的 AI 图像放大工具

Facefusion - AI 换脸和增强工具

全新一代AI换脸工具，无需安装，一键运行，可以完成去遮挡，高清化，卡通脸一键替换，并且Nvidia/AMD等显卡全平台支持。FaceFusion 新版新增了很多模型和高清算法，大大提高了图片和视频的换脸效果，同时还增加了三种遮罩功能，解决了脸部有污涤遮挡时融合效果差和跳闪的问题。

FLUX.1 - SD创始团队开源的AI图像生成模型

FLUX.1是由Stable Diffusion创始团队推出的开源AI图像生成模型，拥有12B参数，是迄今为止最大的文生图模型。包含三种变体：顶级性能的FLUX.1 [pro]、开源非商业用途的FLUX.1 [dev] 和快速高效的FLUX.1[schnell]。FLUX.1以卓越的图像质量、高度逼真的人体解剖学表现和先进的提示词遵循能力脱颖而出，为AI图像生成设定了新的行业标准。

HivisionIDPhotos - 轻量级的 AI 证件照制作工具

这是一款简单易用的 AI 证件照制作工具，能够生成标准证件照和六寸排版照。它提供了简洁的 Web 界面和 API 服务，即使在没有 GPU 的电脑上也能够运行，支持抠图、尺寸调整和自定义底色等功能。

Bing Image Creator

立刻使用

Bing Image Creator是微软推出的一款基于深度学习的图片生成工具，能够根据用户的文字描述自动生成高质量的真实图画。

Canva AI

立刻使用

Canva AI是Canva推出的一系列基于深度学习的创意设计工具，旨在通过自动化和智能化技术简化设计流程，让用户能够轻松创建高质量的图形和视频内容。

Colorize.cc

立刻使用

Colorize.cc是一款使用深度学习技术为黑白照片和视频上色的人工智能服务。通过几个简单的步骤，您可以在几分钟内给数百张家庭照片上色。

Leonardo.ai

立刻使用

Leonardo.ai 是一个领先的AI绘画和图像生成工具和平台，致力于通过先进的人工智能技术，为广大用户打造一个免费、创新、互动的视觉艺术社区。

Luma AI

立刻使用

Luma AI是一家专注于AI的技术公司，通过其创新技术，用户可以利用手机快速生成所需的3D模型。公司由拥有丰富3D计算机视觉经验的团队成立，其技术基于Neural Radiance Fields，能够基于少量2D图像对3D场景进行建模。

Midjourney

立刻使用

Midjourney是一款由独立研究实验室和产品工作室开发的AI绘画工具，它能够通过用户输入的文本描述生成高质量的图像。

# 文档处理所有该分类开源>>

wdoc - 大量异构文档处理和总结

一个功能强大的 RAG（检索增强生成）系统，旨在汇总、搜索和查询各种文件类型的文档。

STORM - AI编写类似 Wikipedia 的文章

DevDocs - 抓取并整理技术文档的MCP服务

DevDocs 是一个完全免费的开源工具，由 CyberAGI 团队开发，托管在 GitHub 上。它专为程序员和软件开发者设计，能从技术文档的网址开始，自动爬取相关页面并整理成简洁的 Markdown 或 JSON 文件。

KrillinAI - 基于 AI 的视频翻译配音工具

DeepSearcher - 私有数据上智能搜索和分析

DeepSearcher 结合推理 LLM（OpenAI o1、o3-mini、DeepSeek、Grok 3、Claude 3.7 Sonnet 等）和向量数据库（Milvus、Zilliz Cloud 等），基于私有数据进行搜索、评估和推理，提供高度准确的答案和全面的报告。

MarkPDFDown - 使用 AI 将 PDF 转录为 Markdown

MarkPDFDown 旨在简化将 PDF 文档转换为干净、可编辑的 Markdown 文本的过程。通过利用先进的多模态 AI 模型，它可以准确提取文本、保留格式并处理复杂的文档结构，包括表格、公式和图表。

anx-reader - 集成多种 AI 能力的阅读器

pptx2md - 将PPT文件转换成Markdown

将 Powerpoint pptx 文件转换为 markdown 的工具。

zerox - 使用视觉模型将 PDF 转换为 Markdown

zerox基于视觉模型 API 服务，提供了将 PDF 文档转化为 Markdown 的功能。其原理是先将原文件（如 pdf、docx）转换为图片，然后把图片发给视觉模型处理，最后汇总所有结果生成完整的 Markdown 文件。

Quivr - 用 AI 构建你的第二大脑

该项目利用生成式 AI 的能力，成为你的第二大脑。你可以将多种格式的文本、数据、语言和视频上传给它，之后再和它对话时，它会学习你上传的内容后回答你的问题，支持接入多种 LLMs 和 Docker 一键部署，但目前对中文支持不是很好。

Paperpal

立刻使用

Paperpal是一款专为科研作者设计的AI写作工具，集语言编辑、文本改写与生成、投稿检查等功能于一体，旨在提升研究者的英语写作体验和效率。

创客贴AI

立刻使用

创客贴AI是一款集智能设计、图片编辑、文案创作等功能于一体的在线AI设计平台，旨在通过人工智能技术提升设计效率与创意。

# 智能助手所有该分类开源>>

LeRobot - 让机械臂接入大模型

LemonAI - 全球首个全栈开源通用 AI Agent

agent-zero - 打造你的AI专属AI助理

AutoAgent - 香港大学开源的AI智能体框架

由香港大学数据智能实验室（HKUDS）开发的一个开源AI智能体框架，托管于GitHub。它允许用户通过纯自然语言描述需求，快速创建和部署定制化的AI智能体，无需任何编程基础。

AgenticSeek - 100% 本地替代 Manus AI 的方案

Suna - 开源多面手 AI 代理

Suna 是一个完全开源的 AI 助手，可帮助您轻松完成实际任务。通过自然对话，Suna 成为您进行研究、数据分析和日常挑战的数字伴侣 — 将强大的功能与直观的界面相结合，了解您的需求并提供结果。

UI-TARS - 基于视觉语言模型的多模式代理

基于视觉语言模型（Vision-Language Model）的 GUI 代理应用，允许用户通过自然语言控制电脑操作。它结合了视觉识别和自然语言处理技术，能够理解用户的指令并执行相应的操作。

NextChat - 构建个性化 AI 助手平台

index - 自动化浏览器智能体

在做浏览器自动化脚本时，我们常常需要编写大量代码来处理复杂的网页交互，不仅耗时耗力，还难以调试和优化，要是出错更是难以精准定位问题所在。

n8n - 集成DeekSeek打造个人助理的工作流自动化

n8n 是一个开源的工作流自动化工具，类似于 IFTTT。它的优点是开源、可以自托管、下载安装方便、易于使用，可以互联的服务包括 Github、Google、RSS、Slack、Telegram、Gitlab、Redis、RabbitMq、数据库等等上百种服务。

Second-Me - 训练你的 AI 自我以连接世界

一个开源原型，您可以在其中打造自己的AI 自我 — 一种新的 AI 物种，可以保护您、提供您的背景并捍卫您的利益。

OWL - 优化劳动力学习的通用智能体

OWL 是一个前沿的多智能体协作框架，推动任务自动化的边界，构建在 CAMEL-AI Framework。愿景是彻底变革 AI 智能体协作解决现实任务的方式。通过利用动态智能体交互，OWL 实现了跨多领域更自然、高效且稳健的任务自动化。

# 智能搜索所有该分类开源>>

PaSa - 大型语言模型提供支持的高级论文搜索代理

一种由大型语言模型提供支持的高级 PaperSearch 代理。PaSa 可以自主做出一系列决策，包括调用搜索工具、阅读论文和选择相关参考文献，最终为复杂的学术查询获得全面准确的结果。

Farfalle - 开源的AI搜索引擎

FarFalle 是一款开源的AI搜索引擎项目，类似Perplexity AI。可使用本地或云 LLM 自托管。

Perplexica - AI 驱动的搜索引擎

Perplexica 是一个开源的 AI 驱动的搜索工具或 AI 驱动的搜索引擎，可以深入互联网寻找答案。受 Perplexity AI 的启发，它是一个开源选项，不仅可以搜索网络，还可以理解您的问题。它使用先进的机器学习算法（如相似性搜索和嵌入）来优化结果，并通过引用的来源提供明确的答案。

phidata - 具有记忆、知识、工具和推理能力的多模态代理

Phidata 是一个用于构建多模态代理的框架，使用 phidata 可以：使用内存、知识、工具和推理构建多模式代理。建立可以协同工作解决问题的代理团队。使用漂亮的 Agent UI 与您的代理聊天。

# 模型工具所有该分类开源>>

LocalAI - OpenAI、Claude 等的开源替代

mindsDB - 通过数据库SQL即可利用AI做预测分析

mcp-agent - 简单的MCP代理框架

nndeploy - 易用、高性能、支持多端的AI推理部署框架

nndeploy是一个简单易用、高性能、支持多端的AI推理部署框架。主要解决以下模型部署中的痛点。

one-api - 通过标准的 OpenAI API 格式访问所有的大模型

通过标准的 OpenAI API 格式访问所有的大模型，统一 API 适配，可用于 key 管理与二次分发。

new-api - 新一代大模型网关与AI资产管理系统

lobe-chat - 现代的 ChatGPT、LLMs、UI框架

magentic-ui - 在保持控制的同时自动执行 Web 任务

Magentic-UI 是一个以人为本的界面的研究原型，由多代理系统提供支持，可以在 Web 上浏览和执行作，生成和执行代码，以及生成和分析文件。 Magentic-UI 对于需要在 Web 上执行作（例如，填写表单、自定义食品订单）、在未被搜索引擎索引的网站中进行深度导航（例如，过滤航班、从个人站点查找链接）或需要 Web 导航和代码执行的任务（例如，从在线数据生成图表）的 Web 任务特别有用。

dify - 易用的 LLMOps 平台

Craw4AI - LLM友好的网页爬虫

Crawl4AI旨在让网页爬取和数据提取变得简单而高效。无论构建复杂的 AI 应用程序还是增强大语言模型，Crawl4AI 都能提供简化工作流程所需的工具。凭借完全的异步支持，Crawl4AI 可确保爬取任务快速、可靠且可扩展。

Opik - 评估、测试和监控 LLM 应用

Opik 是一个用于评估、测试和监控 LLM 应用程序的开源平台。由 Comet 建造。从 RAG 聊天机器人到代码助手，再到复杂的代理管道等等，通过跟踪、评估和仪表板构建运行得更好、更快、更便宜的 LLM 系统。

fastmcp - 更好用的 MCP Python 框架

用于构建 MCP（Model Context Protocol）服务器和客户端的 Python 框架，帮助开发者以更快速、简洁的方式向 LLM 暴露数据资源和工具。

# 行业应用所有该分类开源>>

ai-financial-agent - 为金融投资打造的AI代理

探索人工智能在投资研究中的应用。

Meetily - AI 驱动的会议助手

一个 AI 驱动的会议助手，可捕获实时会议音频、实时转录并生成摘要，同时确保用户隐私。

CHRONOS - 新闻时间线摘要

CHRONOS是一种新颖的基于检索的时间线摘要（TLS）方法，通过迭代提出有关主题和检索到的文档的问题来生成按时间顺序排列的摘要。

HowToCook - 程序员在家做饭指南

AI Hedge Fund - 探索人工智能在交易中的决策

通过模拟多种投资策略的智能代理（agents），进行股票分析和交易决策。项目仅用于教育和研究目的，不适用于实际交易或投资。

TrendPublish - 全自动 AI 内容生成与发布

实时追踪和发布人工智能领域的最新趋势。帮助开发者、技术爱好者和研究人员快速获取 AI 领域的动态信息，例如前沿技术、热门项目和行业新闻等。

FoloUp - AI 驱动的语音招聘面试官

FoloUp 是一个开源平台，供公司对候选人进行 AI 驱动的招聘面试。

stocks-insights-ai-agent - AI驱动的股票分析工具

使用 Agentic Retrieval-Augmented Generation （RAG）工作流程从与特定公司和更广泛的股票市场相关的新闻和财务数据中提取见解。它利用大型语言模型（LLM）、ChromaDB 作为向量数据库、LangChain、LangChain 表达式语言（LCEL）和 LangGraph 来提供全面的分析。

ElevenLabs

立刻使用

Kolors Virtual Try-On

立刻使用

Kolors Virtual Try-On是由快手可图团队开发的一项先进的AI试衣技术。这项技术利用大规模文本到图像生成模型，为用户提供了逼真的虚拟试衣体验。

MakeLogoAI

立刻使用

一个人工智能驱动的Logo生成器，用户可以在短时间内（不到24小时）为他们的企业创建独特的高清Logo。该平台使用先进的人工智能技术，能够根据用户的输入和需求生成多种创意方向的Logo设计，并允许用户通过Logo编辑器进行微调，以确保最终设计符合用户的愿景和品牌要求。

Runway

立刻使用

Runway 是一家应用人工智能研究公司，致力于塑造艺术、娱乐和人类创造力的下一个时代。

# 行业引用所有该分类开源>>

qlib - 微软开源的量化平台

# 视频处理所有该分类开源>>

AI-Media2Doc - 视频一键转图文的 AI 工具

bininote - 使用AI将视频转换了Markdown笔记

BiliNote 是一个开源的 AI 视频笔记助手，支持通过哔哩哔哩、YouTube 等视频链接，自动提取内容并生成结构清晰、重点明确的 Markdown 格式笔记。支持插入截图、原片跳转等功能。

story-flicks - AI大模型一键生成高清故事短视频

可以输入一个故事主题，使用大语言模型生成故事视频，视频中包含大模型生成的图片、故事内容，以及音频和字幕信息。

LivePortrait - 让肖像栩栩如生

通过输入静态肖像照片，LivePortrait 能够实时生成动态的肖像动画，使静态图像“活”起来。用户可以通过摄像头或手动输入来控制生成动画中的面部表情，如微笑、眨眼、皱眉等。

video-starter-kit - 浏览器中启用 AI 模型以进行视频制作

用于构建 AI 驱动的视频应用程序的强大入门套件。该工具包使用 Next.js、Remotion 和 fal.ai 构建，简化了在浏览器中使用 AI 视频模型的复杂性。

TRELLIS - 生成 3D 作品的开源模型

TRELLIS 是一个大型 3D 资产生成模型。它接收文本或图像提示，并生成各种格式的高质量 3D 资产，例如 Radiance Fields、3D Gaussians 和网格。

MagicMirror - 颠覆传统的AI换装神器

一键打造全新的自己！

supervision - 好用的计算机视觉 AI 工具库

Supervision库是一款出色的Python计算机视觉低代码工具，其设计初衷在于为用户提供一个便捷且高效的接口，用以处理数据集以及直观地展示检测结果。简化了对象检测、分类、标注、跟踪等计算机视觉的开发流程。开发者仅需加载数据集和模型，就能轻松实现对图像和视频进行检测、统计某区域的被检测数量等操作。