wdoc
一个功能强大的 RAG(检索增强生成)系统,旨在汇总、搜索和查询各种文件类型的文档。
ai-financial-agent
探索人工智能在投资研究中的应用。
Meetily
一个 AI 驱动的会议助手,可捕获实时会议音频、实时转录并生成摘要,同时确保用户隐私。
Spark-TTS
Spark-TTS 完全基于Qwen2.5 构建,无需使用流匹配等额外生成模型。它无需依赖单独的模型来生成声学特征,而是直接从 [LLM]预测的代码中重建音频。这种方法简化了流程,提高了效率并降低了复杂性。
VoiceCanvas
VoiceCanvas 是一款开源的文本转语音系统,支持超过 50 种语言和多种音色选择,还具备声音克隆功能。
watermark-removal
使用基于机器学习的图像修复方法从图像中去除水印,这与图像的真实版本完全没有区别。
DevDocs
DevDocs 是一个完全免费的开源工具,由 CyberAGI 团队开发,托管在 GitHub 上。它专为程序员和软件开发者设计,能从技术文档的网址开始,自动爬取相关页面并整理成简洁的 Markdown 或 JSON 文件。
AutoAgent
由香港大学数据智能实验室(HKUDS)开发的一个开源AI智能体框架,托管于GitHub。它允许用户通过纯自然语言描述需求,快速创建和部署定制化的AI智能体,无需任何编程基础。
CHRONOS
CHRONOS是一种新颖的基于检索的时间线摘要 (TLS) 方法,通过迭代提出有关主题和检索到的文档的问题来生成按时间顺序排列的摘要。
index
在做浏览器自动化脚本时,我们常常需要编写大量代码来处理复杂的网页交互,不仅耗时耗力,还难以调试和优化,要是出错更是难以精准定位问题所在。
bininote
BiliNote 是一个开源的 AI 视频笔记助手,支持通过哔哩哔哩、YouTube 等视频链接,自动提取内容并生成结构清晰、重点明确的 Markdown 格式笔记。支持插入截图、原片跳转等功能。
AI Hedge Fund
通过模拟多种投资策略的智能代理(agents),进行股票分析和交易决策。项目仅用于教育和研究目的,不适用于实际交易或投资。
n8n
n8n 是一个开源的工作流自动化工具,类似于 IFTTT。它的优点是开源、可以自托管、下载安装方便、易于使用,可以互联的服务包括 Github、Google、RSS、Slack、Telegram、Gitlab、Redis、RabbitMq、数据库等等上百种服务。
agno
一个高性能、开源的 Python 库,用于构建多模态智能代理。通过统一大语言模型的 API,并赋予它们记忆、知识、工具和推理等强大功能。该项目速度快、内存占用少,支持文本、图像、音频和视频等多种内容形式,以及多代理、结构化输出,兼容几乎任何模型和服务供应商。
OmniParser
微软发布了革命性的视觉Agent框架OmniParser V2。这个能把DeepSeek-R1、GPT-4o等大模型变成计算机使用智能体的黑科技,让AI终于不再只是脑补屏幕内容——它现在能像人类一样精准识别UI元素,甚至能发现你都没注意到的隐藏按钮!