AI开源
AI实验室
AI期刊
关于
更多...
小众AI
AI开源
AI实验室
AI期刊
关于
Ai应用
C++
Golang
Java
Javascript
Jupyter
Python
Rust
Typescript
内容检测
图像处理
文档处理
智能助手
智能搜索
模型工具
行业应用
行业引用
视频处理
语言处理
辅助编程
音频处理
AI开源软件
Ai应用
C++
Golang
Java
Javascript
Jupyter
Python
Rust
Typescript
内容检测
图像处理
文档处理
智能助手
智能搜索
模型工具
行业应用
行业引用
视频处理
语言处理
辅助编程
音频处理
AI开源软件
>
Python
VoiceCraft - 文本生成任何人的语音技术
VoiceCraft 能够复制或克隆或甚至编辑你从未听过的语音。
Writer AI Content Detector - 一款使用AI技术快速准确地检测内容抄袭和提供写作反馈的工具。
立刻使用
Writer AI Content Detector是由Writer平台推出的一款AI内容检测工具,它利用先进的算法和技术,能够快速分析文本内容,识别出从其他来源复制的文本或AI生成的内容,确保内容的原创性和质量。该工具不仅适用于学术作业、论文、博客文章等多种场景,还能在写作过程中提供实时反馈,帮助用户改进写作技能,提升内容质量。
AnyText - 轻松 DIY 图片文字,定制你的创意设计
AnyText提供了文字生成和文字编辑两种模式,它能够根据提示词生成图文融合的图片,并确保文字的准确性,还支持对上传图片中的文字进行编辑后,重新生成图片。支持中文、英语、日语、韩语等多语言,适用于海报设计、Logo 设计、创意涂鸦、表情包等场景。
Auralis - 高速文本转语音引擎
Auralis 是一种文本转语音引擎,使语音生成在现实世界中变得实用:在 10 分钟内将整本《哈利·波特》第一本书转换为语音。
AutoGen - 大模型多Agent对话框架
AutoGen 是一个框架,可以使用多个代理进行对话,解决任务,从而实现 LLM 应用的开发。AutoGen 代理是可定制、可对话的,并且可以无缝地允许人类参与。它们可以在使用 LLM、人类输入和工具的各种模式下运行。
Browser Use - 让 AI 像人类一样浏览网页
一个能让 AI 像真实用户一样自然操作浏览器的 Python 工具库,通过简单的代码配置就能实现网页自动化任务,如订票、求职申请、数据收集等实际应用场景。
Buzz - 可离线的实时语音转文字工具
Buzz 是一款基于 OpenAI Whisper 的开源、可离线的实时语音转文字工具,支持 Windows、macOS、Linux,它可以将麦克风的语音实时转换为文字,也支持将视频、音频文件转换为文字、字幕。
ChatTTS - 一款适用于日常对话的生成式语音模型
ChatTTS是专为对话场景设计的语音生成模型,特别适用于大型语言模型(LLM)助手的对话任务,以及诸如对话式音频和视频介绍等应用。它支持中文和英文,通过使用大约100,000小时的中文和英文数据进行训练,ChatTTS在语音合成中表现出高质量和自然度。
Co-op Translator - 使用单个命令本地化您的项目
Co-op Translator是一个 Python 包,旨在使用先进的大语言模型 ( LLM ) 技术和 Azure AI 服务自动为您的项目进行多语言翻译。该项目旨在简化将内容翻译成多种语言的过程,使开发人员可以轻松访问并提高效率。
Deep-Live-Cam - AI实时换脸工具
Deep-Live-Cam 是开源的AI实时换脸工具,用户仅需一张图片即可在视频中实现实时人脸交换。支持 CPU、NVIDIA CUDA、Apple Silicon、Core ML 等多种硬件平台,确保视频处理的流畅性。
docling - 将各类文档转化为适合生成式 AI
由 IBM 开源的 Python 工具,专门用于将各类文档转化为适合生成式 AI 使用的工具。它能够将 PDF、DOCX、PPTX、图片、HTML、Markdown 等多种流行文档格式,导出为 Markdown 和 JSON 格式,支持多种 OCR 引擎(PDF)、统一的文档对象(DoclingDocument),轻松集成检索增强生成(RAG)和问答应用,适用于需要将文档作为生成式 AI 模型输入的场景。
Farfalle - 开源的AI搜索引擎
FarFalle 是一款开源的AI搜索引擎项目,类似Perplexity AI。 可使用本地或云 LLM 自托管。
FastChat - 训练和评估大型语言模型的开放平台
一个用于训练、部署和评估大型语言模型的平台,你可以用它在本地部署和评估各种大模型。除此之外,它还提供了一个在线评估大模型的平台,用户可以向两个不同的大模型,问同一个问题,然后根据回答选出你认为更好用的大模型。在此过程中,你可以免费使用 Claude、ChatGPT 等对话机器人。
GFPGAN - 腾讯开源的人脸修复算法
GFPGAN是腾讯开源的人脸修复算法,它利用预先训练好的面部修复算法,并且封装了各种丰富多样的先验因素进行盲脸(blind face) 修复,可以对老照片进行很好的修复。
gpt-computer-assistant - 极简的 GPT-4o 客户端
适用于 Windows、macOS 和 Ubuntu 的 GPT-4o 客户端,它拥有极简的用户界面,支持执行多种任务,包括读取屏幕、打开应用、系统音频和文本输入等。
««
«
4
5
6
7
8
»
»»