Python

AI开源软件 > Python

VoiceCraft 能够复制或克隆或甚至编辑你从未听过的语音。

Writer AI Content Detector - 一款使用AI技术快速准确地检测内容抄袭和提供写作反馈的工具。

立刻使用

Writer AI Content Detector是由Writer平台推出的一款AI内容检测工具，它利用先进的算法和技术，能够快速分析文本内容，识别出从其他来源复制的文本或AI生成的内容，确保内容的原创性和质量。该工具不仅适用于学术作业、论文、博客文章等多种场景，还能在写作过程中提供实时反馈，帮助用户改进写作技能，提升内容质量。

AnyText - 轻松 DIY 图片文字，定制你的创意设计

AnyText提供了文字生成和文字编辑两种模式，它能够根据提示词生成图文融合的图片，并确保文字的准确性，还支持对上传图片中的文字进行编辑后，重新生成图片。支持中文、英语、日语、韩语等多语言，适用于海报设计、Logo 设计、创意涂鸦、表情包等场景。

Auralis - 高速文本转语音引擎

Auralis 是一种文本转语音引擎，使语音生成在现实世界中变得实用：在 10 分钟内将整本《哈利·波特》第一本书转换为语音。

AutoGen - 大模型多Agent对话框架

AutoGen 是一个框架，可以使用多个代理进行对话，解决任务，从而实现 LLM 应用的开发。AutoGen 代理是可定制、可对话的，并且可以无缝地允许人类参与。它们可以在使用 LLM、人类输入和工具的各种模式下运行。

Browser Use - 让 AI 像人类一样浏览网页

一个能让 AI 像真实用户一样自然操作浏览器的 Python 工具库，通过简单的代码配置就能实现网页自动化任务，如订票、求职申请、数据收集等实际应用场景。

Buzz - 可离线的实时语音转文字工具

Buzz 是一款基于 OpenAI Whisper 的开源、可离线的实时语音转文字工具，支持 Windows、macOS、Linux，它可以将麦克风的语音实时转换为文字，也支持将视频、音频文件转换为文字、字幕。

ChatTTS - 一款适用于日常对话的生成式语音模型

ChatTTS是专为对话场景设计的语音生成模型，特别适用于大型语言模型(LLM)助手的对话任务，以及诸如对话式音频和视频介绍等应用。它支持中文和英文，通过使用大约100,000小时的中文和英文数据进行训练，ChatTTS在语音合成中表现出高质量和自然度。

Co-op Translator - 使用单个命令本地化您的项目

Co-op Translator是一个 Python 包，旨在使用先进的大语言模型 ( LLM ) 技术和 Azure AI 服务自动为您的项目进行多语言翻译。该项目旨在简化将内容翻译成多种语言的过程，使开发人员可以轻松访问并提高效率。

Deep-Live-Cam - AI实时换脸工具

Deep-Live-Cam 是开源的AI实时换脸工具，用户仅需一张图片即可在视频中实现实时人脸交换。支持 CPU、NVIDIA CUDA、Apple Silicon、Core ML 等多种硬件平台，确保视频处理的流畅性。

docling - 将各类文档转化为适合生成式 AI

由 IBM 开源的 Python 工具，专门用于将各类文档转化为适合生成式 AI 使用的工具。它能够将 PDF、DOCX、PPTX、图片、HTML、Markdown 等多种流行文档格式，导出为 Markdown 和 JSON 格式，支持多种 OCR 引擎（PDF）、统一的文档对象（DoclingDocument），轻松集成检索增强生成（RAG）和问答应用，适用于需要将文档作为生成式 AI 模型输入的场景。