AI开源
AI实验室
AI期刊
关于
更多...
小众AI
AI开源
AI实验室
AI期刊
关于
Ai应用
C++
Golang
Java
Javascript
Jupyter
Python
Rust
Typescript
内容检测
图像处理
文档处理
智能助手
智能搜索
模型工具
行业应用
视频处理
语言处理
辅助编程
音频处理
AI开源软件
Ai应用
C++
Golang
Java
Javascript
Jupyter
Python
Rust
Typescript
内容检测
图像处理
文档处理
智能助手
智能搜索
模型工具
行业应用
视频处理
语言处理
辅助编程
音频处理
AI开源软件
>
Python
PaSa - 大型语言模型提供支持的高级论文搜索代理
一种由大型语言模型提供支持的高级 PaperSearch 代理。PaSa 可以自主做出一系列决策,包括调用搜索工具、阅读论文和选择相关参考文献,最终为复杂的学术查询获得全面准确的结果。
Genesis - 生成式物理引擎和模拟平台
Genesis 是一个专为通用*机器人/具身 AI/物理 AI* 应用程序设计的物理平台。
zerox - 使用视觉模型将 PDF 转换为 Markdown
zerox基于视觉模型 API 服务,提供了将 PDF 文档转化为 Markdown 的功能。其原理是先将原文件(如 pdf、docx)转换为图片,然后把图片发给视觉模型处理,最后汇总所有结果生成完整的 Markdown 文件。
letta-ai - 为 LLM 应用注入记忆能力的开发框架
该项目是用于构建具有记忆功能的 LLM 应用的 Python 框架,支持创建拥有长期记忆和持久状态的智能体(Agent),并能够集成多种 LLM API 服务。
VLLM - 快速且便宜的 LLM 服务
这是一个高效易用的大型语言模型推理引擎,专为解决推理速度慢、资源利用率低等问题而设计。它基于 PyTorch 和 CUDA,并结合内存优化算法(PagedAttention)、计算图优化和模型并行技术,大幅降低 GPU 内存占用,并充分利用多 GPU 资源提升推理性能。
TRELLIS - 生成 3D 作品的开源模型
TRELLIS 是一个大型 3D 资产生成模型。它接收文本或图像提示,并生成各种格式的高质量 3D 资产,例如 Radiance Fields、3D Gaussians 和网格。
garak - 开源的 LLMs 漏洞扫描工具
garak检查是否可以以我们不希望的方式使 LLM 失败。 探测幻觉、数据泄漏、及时注射、错误信息、毒性产生、越狱和许多其他弱点。如果您知道 or / Metasploit Framework,garak 的功能与它们有些相似,但适用于 LLM。
MagicMirror - 颠覆传统的AI换装神器
一键打造全新的自己!
chatgpt-on-wechat - 基于大模型的智能对话机器人
chatgpt-on-wechat(简称CoW)项目是基于大模型的智能对话机器人,支持微信公众号、企业微信应用、飞书、钉钉接入。
Facefusion - AI 换脸和增强工具
全新一代AI换脸工具,无需安装,一键运行,可以完成去遮挡,高清化,卡通脸一键替换,并且Nvidia/AMD等显卡全平台支持。FaceFusion 新版新增了很多模型和高清算法,大大提高了图片和视频的换脸效果,同时还增加了三种遮罩功能,解决了脸部有污涤遮挡时融合效果差和跳闪的问题。
FLUX.1 - SD创始团队开源的AI图像生成模型
FLUX.1是由Stable Diffusion创始团队推出的开源AI图像生成模型,拥有12B参数,是迄今为止最大的文生图模型。包含三种变体:顶级性能的FLUX.1 [pro]、开源非商业用途的FLUX.1 [dev] 和 快速高效的FLUX.1[schnell]。FLUX.1以卓越的图像质量、高度逼真的人体解剖学表现和先进的提示词遵循能力脱颖而出,为AI图像生成设定了新的行业标准。
GPT-SoVITS - 少样本语音转换和合成工具
强大的少样本语音转换和语音合成 WebUI 工具,输入 5 秒的声音样本就能体验文本到语音转换。支持少样本 TTS、英语、日语和中文,集成了声音伴奏分离、中文自动语音识别和文本标注等功能。
HivisionIDPhotos - 轻量级的 AI 证件照制作工具
这是一款简单易用的 AI 证件照制作工具,能够生成标准证件照和六寸排版照。它提供了简洁的 Web 界面和 API 服务,即使在没有 GPU 的电脑上也能够运行,支持抠图、尺寸调整和自定义底色等功能。
open-interpreter - 让 LLM 在你的计算机上运行代码
open-interpreter可以让大语言模型在本地运行代码,支持 Python、JavaScript、Shell 等编程语言。相当于大语言模型是一个解释器,它会理解你的意图,将自然语言转化成相应的代码脚本并运行。安装后,用户就可以在终端通过聊天的方式操作计算机,比如创建和编辑图片、视频和文件,控制 Chrome 浏览器进行搜索等。
Quivr - 用 AI 构建你的第二大脑
该项目利用生成式 AI 的能力,成为你的第二大脑。你可以将多种格式的文本、数据、语言和视频上传给它,之后再和它对话时,它会学习你上传的内容后回答你的问题,支持接入多种 LLMs 和 Docker 一键部署,但目前对中文支持不是很好。
««
«
1
2
3
4
5
»
»»