AI开源
AI实验室
AI期刊
关于
更多...
小众AI
AI开源
AI实验室
AI期刊
关于
Ai应用
C++
Golang
Java
Javascript
Jupyter
Python
Rust
Typescript
内容检测
图像处理
文档处理
智能助手
智能搜索
模型工具
行业应用
视频处理
语言处理
辅助编程
音频处理
AI开源软件
Ai应用
C++
Golang
Java
Javascript
Jupyter
Python
Rust
Typescript
内容检测
图像处理
文档处理
智能助手
智能搜索
模型工具
行业应用
视频处理
语言处理
辅助编程
音频处理
AI开源软件
>
Python
AutoGen - 大模型多Agent对话框架
AutoGen 是一个框架,可以使用多个代理进行对话,解决任务,从而实现 LLM 应用的开发。AutoGen 代理是可定制、可对话的,并且可以无缝地允许人类参与。它们可以在使用 LLM、人类输入和工具的各种模式下运行。
Browser Use - 让 AI 像人类一样浏览网页
一个能让 AI 像真实用户一样自然操作浏览器的 Python 工具库,通过简单的代码配置就能实现网页自动化任务,如订票、求职申请、数据收集等实际应用场景。
Buzz - 可离线的实时语音转文字工具
Buzz 是一款基于 OpenAI Whisper 的开源、可离线的实时语音转文字工具,支持 Windows、macOS、Linux,它可以将麦克风的语音实时转换为文字,也支持将视频、音频文件转换为文字、字幕。
ChatTTS - 一款适用于日常对话的生成式语音模型
ChatTTS是专为对话场景设计的语音生成模型,特别适用于大型语言模型(LLM)助手的对话任务,以及诸如对话式音频和视频介绍等应用。它支持中文和英文,通过使用大约100,000小时的中文和英文数据进行训练,ChatTTS在语音合成中表现出高质量和自然度。
Co-op Translator - 使用单个命令本地化您的项目
Co-op Translator是一个 Python 包,旨在使用先进的大语言模型 ( LLM ) 技术和 Azure AI 服务自动为您的项目进行多语言翻译。该项目旨在简化将内容翻译成多种语言的过程,使开发人员可以轻松访问并提高效率。
Deep-Live-Cam - AI实时换脸工具
Deep-Live-Cam 是开源的AI实时换脸工具,用户仅需一张图片即可在视频中实现实时人脸交换。支持 CPU、NVIDIA CUDA、Apple Silicon、Core ML 等多种硬件平台,确保视频处理的流畅性。
docling - 将各类文档转化为适合生成式 AI
由 IBM 开源的 Python 工具,专门用于将各类文档转化为适合生成式 AI 使用的工具。它能够将 PDF、DOCX、PPTX、图片、HTML、Markdown 等多种流行文档格式,导出为 Markdown 和 JSON 格式,支持多种 OCR 引擎(PDF)、统一的文档对象(DoclingDocument),轻松集成检索增强生成(RAG)和问答应用,适用于需要将文档作为生成式 AI 模型输入的场景。
Farfalle - 开源的AI搜索引擎
FarFalle 是一款开源的AI搜索引擎项目,类似Perplexity AI。 可使用本地或云 LLM 自托管。
FastChat - 训练和评估大型语言模型的开放平台
一个用于训练、部署和评估大型语言模型的平台,你可以用它在本地部署和评估各种大模型。除此之外,它还提供了一个在线评估大模型的平台,用户可以向两个不同的大模型,问同一个问题,然后根据回答选出你认为更好用的大模型。在此过程中,你可以免费使用 Claude、ChatGPT 等对话机器人。
GFPGAN - 腾讯开源的人脸修复算法
GFPGAN是腾讯开源的人脸修复算法,它利用预先训练好的面部修复算法,并且封装了各种丰富多样的先验因素进行盲脸(blind face) 修复,可以对老照片进行很好的修复。
gpt-computer-assistant - 极简的 GPT-4o 客户端
适用于 Windows、macOS 和 Ubuntu 的 GPT-4o 客户端,它拥有极简的用户界面,支持执行多种任务,包括读取屏幕、打开应用、系统音频和文本输入等。
GraphRAG - 使用 LLM 生成知识图谱
微软开源的一个项目,它利用图(Graph)来增强检索(Retrieval)和生成(Generation)的能力,通过结合知识图谱与图机器学习,提升大型语言模型在私有数据集上的推理和问答性能。
Hallo - 音频驱动的肖像动画生成
一个音频驱动的视觉合成系统,可以根据输入的音频和图像生成肖像动画。它可以让静态的肖像图像,根据音频中的声音变化动起来,就像真人说话一样。
Keep - AI驱动的告警管理平台
一个智能告警管理和 AIOps 平台,运用 AI 技术实现告警关联和分析。它提供了统一的操作界面,便于集中管理各种告警和事件,支持告警去重、过滤、相关性分析和自动化处理等功能,可与多种监控工具、数据库、通信平台和事件管理工具集成。
Khoj AI - 一个开源的个人 AI
Khoj 是一个开源的个人 AI,你可以和它聊任何事情。它将使用您与之共享的文件进行回复(如果相关)。它还可以从公共互联网访问信息,使用自然语言快速查找相关笔记和文档,它理解 pdf、纯文本、markdown、组织模式文件、概念页面和 github 存储库,从您的 Emacs、Obsidian、Khoj 桌面应用程序或任何 Web 浏览器访问它,使用我们的云实例随时随地访问您的 Khoj,在消费类硬件上自托管以保护隐私。
««
«
3
4
5
6
7
»
»»