Python

AI开源软件 > Python

Genesis - 生成式物理引擎和模拟平台

Genesis 是一个专为通用*机器人/具身 AI/物理 AI* 应用程序设计的物理平台。

zerox - 使用视觉模型将 PDF 转换为 Markdown

zerox基于视觉模型 API 服务，提供了将 PDF 文档转化为 Markdown 的功能。其原理是先将原文件（如 pdf、docx）转换为图片，然后把图片发给视觉模型处理，最后汇总所有结果生成完整的 Markdown 文件。

letta-ai - 为 LLM 应用注入记忆能力的开发框架

该项目是用于构建具有记忆功能的 LLM 应用的 Python 框架，支持创建拥有长期记忆和持久状态的智能体（Agent），并能够集成多种 LLM API 服务。

VLLM - 快速且便宜的 LLM 服务

这是一个高效易用的大型语言模型推理引擎，专为解决推理速度慢、资源利用率低等问题而设计。它基于 PyTorch 和 CUDA，并结合内存优化算法（PagedAttention）、计算图优化和模型并行技术，大幅降低 GPU 内存占用，并充分利用多 GPU 资源提升推理性能。

TRELLIS - 生成 3D 作品的开源模型

TRELLIS 是一个大型 3D 资产生成模型。它接收文本或图像提示，并生成各种格式的高质量 3D 资产，例如 Radiance Fields、3D Gaussians 和网格。

garak - 开源的 LLMs 漏洞扫描工具

garak检查是否可以以我们不希望的方式使 LLM 失败。探测幻觉、数据泄漏、及时注射、错误信息、毒性产生、越狱和许多其他弱点。如果您知道 or / Metasploit Framework，garak 的功能与它们有些相似，但适用于 LLM。

MagicMirror - 颠覆传统的AI换装神器

一键打造全新的自己！

chatgpt-on-wechat - 基于大模型的智能对话机器人

chatgpt-on-wechat（简称CoW）项目是基于大模型的智能对话机器人，支持微信公众号、企业微信应用、飞书、钉钉接入。

Facefusion - AI 换脸和增强工具

全新一代AI换脸工具，无需安装，一键运行，可以完成去遮挡，高清化，卡通脸一键替换，并且Nvidia/AMD等显卡全平台支持。FaceFusion 新版新增了很多模型和高清算法，大大提高了图片和视频的换脸效果，同时还增加了三种遮罩功能，解决了脸部有污涤遮挡时融合效果差和跳闪的问题。

FLUX.1 - SD创始团队开源的AI图像生成模型

FLUX.1是由Stable Diffusion创始团队推出的开源AI图像生成模型，拥有12B参数，是迄今为止最大的文生图模型。包含三种变体：顶级性能的FLUX.1 [pro]、开源非商业用途的FLUX.1 [dev] 和快速高效的FLUX.1[schnell]。FLUX.1以卓越的图像质量、高度逼真的人体解剖学表现和先进的提示词遵循能力脱颖而出，为AI图像生成设定了新的行业标准。

GPT-SoVITS - 少样本语音转换和合成工具

强大的少样本语音转换和语音合成 WebUI 工具，输入 5 秒的声音样本就能体验文本到语音转换。支持少样本 TTS、英语、日语和中文，集成了声音伴奏分离、中文自动语音识别和文本标注等功能。

HivisionIDPhotos - 轻量级的 AI 证件照制作工具

这是一款简单易用的 AI 证件照制作工具，能够生成标准证件照和六寸排版照。它提供了简洁的 Web 界面和 API 服务，即使在没有 GPU 的电脑上也能够运行，支持抠图、尺寸调整和自定义底色等功能。

open-interpreter - 让 LLM 在你的计算机上运行代码

open-interpreter可以让大语言模型在本地运行代码，支持 Python、JavaScript、Shell 等编程语言。相当于大语言模型是一个解释器，它会理解你的意图，将自然语言转化成相应的代码脚本并运行。安装后，用户就可以在终端通过聊天的方式操作计算机，比如创建和编辑图片、视频和文件，控制 Chrome 浏览器进行搜索等。

Quivr - 用 AI 构建你的第二大脑

该项目利用生成式 AI 的能力，成为你的第二大脑。你可以将多种格式的文本、数据、语言和视频上传给它，之后再和它对话时，它会学习你上传的内容后回答你的问题，支持接入多种 LLMs 和 Docker 一键部署，但目前对中文支持不是很好。

supervision - 好用的计算机视觉 AI 工具库

Supervision库是一款出色的Python计算机视觉低代码工具，其设计初衷在于为用户提供一个便捷且高效的接口，用以处理数据集以及直观地展示检测结果。简化了对象检测、分类、标注、跟踪等计算机视觉的开发流程。开发者仅需加载数据集和模型，就能轻松实现对图像和视频进行检测、统计某区域的被检测数量等操作。

更多...

小众AI