TRELLIS
TRELLIS 是一个大型 3D 资产生成模型。它接收文本或图像提示,并生成各种格式的高质量 3D 资产,例如 Radiance Fields、3D Gaussians 和网格。
garak
garak检查是否可以以我们不希望的方式使 LLM 失败。 探测幻觉、数据泄漏、及时注射、错误信息、毒性产生、越狱和许多其他弱点。如果您知道 or / Metasploit Framework,garak 的功能与它们有些相似,但适用于 LLM。
MagicMirror
一键打造全新的自己!
chatgpt-on-wechat
chatgpt-on-wechat(简称CoW)项目是基于大模型的智能对话机器人,支持微信公众号、企业微信应用、飞书、钉钉接入。
Facefusion
全新一代AI换脸工具,无需安装,一键运行,可以完成去遮挡,高清化,卡通脸一键替换,并且Nvidia/AMD等显卡全平台支持。FaceFusion 新版新增了很多模型和高清算法,大大提高了图片和视频的换脸效果,同时还增加了三种遮罩功能,解决了脸部有污涤遮挡时融合效果差和跳闪的问题。
FLUX.1
FLUX.1是由Stable Diffusion创始团队推出的开源AI图像生成模型,拥有12B参数,是迄今为止最大的文生图模型。包含三种变体:顶级性能的FLUX.1 [pro]、开源非商业用途的FLUX.1 [dev] 和 快速高效的FLUX.1[schnell]。FLUX.1以卓越的图像质量、高度逼真的人体解剖学表现和先进的提示词遵循能力脱颖而出,为AI图像生成设定了新的行业标准。
GPT-SoVITS
强大的少样本语音转换和语音合成 WebUI 工具,输入 5 秒的声音样本就能体验文本到语音转换。支持少样本 TTS、英语、日语和中文,集成了声音伴奏分离、中文自动语音识别和文本标注等功能。
HivisionIDPhotos
这是一款简单易用的 AI 证件照制作工具,能够生成标准证件照和六寸排版照。它提供了简洁的 Web 界面和 API 服务,即使在没有 GPU 的电脑上也能够运行,支持抠图、尺寸调整和自定义底色等功能。
open-interpreter
open-interpreter可以让大语言模型在本地运行代码,支持 Python、JavaScript、Shell 等编程语言。相当于大语言模型是一个解释器,它会理解你的意图,将自然语言转化成相应的代码脚本并运行。安装后,用户就可以在终端通过聊天的方式操作计算机,比如创建和编辑图片、视频和文件,控制 Chrome 浏览器进行搜索等。
Quivr
该项目利用生成式 AI 的能力,成为你的第二大脑。你可以将多种格式的文本、数据、语言和视频上传给它,之后再和它对话时,它会学习你上传的内容后回答你的问题,支持接入多种 LLMs 和 Docker 一键部署,但目前对中文支持不是很好。
supervision
Supervision库是一款出色的Python计算机视觉低代码工具,其设计初衷在于为用户提供一个便捷且高效的接口,用以处理数据集以及直观地展示检测结果。简化了对象检测、分类、标注、跟踪等计算机视觉的开发流程。开发者仅需加载数据集和模型,就能轻松实现对图像和视频进行检测、统计某区域的被检测数量等操作。
VoiceCraft
VoiceCraft 能够复制或克隆或甚至编辑你从未听过的语音。
Writer AI Content Detector
Writer AI Content Detector是由Writer平台推出的一款AI内容检测工具,它利用先进的算法和技术,能够快速分析文本内容,识别出从其他来源复制的文本或AI生成的内容,确保内容的原创性和质量。该工具不仅适用于学术作业、论文、博客文章等多种场景,还能在写作过程中提供实时反馈,帮助用户改进写作技能,提升内容质量。
AnyText
AnyText提供了文字生成和文字编辑两种模式,它能够根据提示词生成图文融合的图片,并确保文字的准确性,还支持对上传图片中的文字进行编辑后,重新生成图片。支持中文、英语、日语、韩语等多语言,适用于海报设计、Logo 设计、创意涂鸦、表情包等场景。
Auralis
Auralis 是一种文本转语音引擎,使语音生成在现实世界中变得实用:在 10 分钟内将整本《哈利·波特》第一本书转换为语音。