讯飞绘文
讯飞绘文是一款颇具创新性和实用性的工具,专为内容创作者设计,旨在提供全方位的支持,从而极大地提高创作效率。
docling
由 IBM 开源的 Python 工具,专门用于将各类文档转化为适合生成式 AI 使用的工具。它能够将 PDF、DOCX、PPTX、图片、HTML、Markdown 等多种流行文档格式,导出为 Markdown 和 JSON 格式,支持多种 OCR 引擎(PDF)、统一的文档对象(DoclingDocument),轻松集成检索增强生成(RAG)和问答应用,适用于需要将文档作为生成式 AI 模型输入的场景。
GraphRAG
微软开源的一个项目,它利用图(Graph)来增强检索(Retrieval)和生成(Generation)的能力,通过结合知识图谱与图机器学习,提升大型语言模型在私有数据集上的推理和问答性能。
Hoarder
Hoarder是一款开源的“全能书签管理器”,它不仅接收你的一切输入,更以智能的方式自动整理,即刻捕获链接、笔记与图片等内容,Hoarder可以作为数据囤积者的得力助手,也是一款稍后阅读的好工具。令人意外的是Hoarder还提供了免费的移动端App,现已支持Android和iOS平台。
markitdown
用于将文件和 Office 文档转换为 Markdown 的 Python 工具。使用大型语言模型进行图像描述。