PDF2Audio - 小众AI

PDF2Audio - 阅读 PDF 的新方式

[音频处理 Python]

PDF2Audio，它将彻底改变我们阅读和理解 PDF 文件的方式。我们不再需要盯着屏幕，而是让信息以声音的形式流淌进你的耳朵，无论是在通勤的路上、健身时，还是任何需要解放双手的场合。

代码仓

PDF2Audio，它将彻底改变我们阅读和理解 PDF 文件的方式。我们不再需要盯着屏幕，而是让信息以声音的形式流淌进你的耳朵，无论是在通勤的路上、健身时，还是任何需要解放双手的场合。

主要功能

支持处理多个 PDF 文件
支持选择不同的指令模板（播客、讲座、摘要等）
自定义文本生成和音频模型
支持为演讲者选择不同的声音
对文稿的编辑和对模型的具体反馈进行草稿迭代改进

快速使用

克隆仓库

git clone https://github.com/lamm-mit/PDF2Audio.git
cd PDF2Audio

创建 Conda 环境

conda create -n pdf2audio python=3.9

激活已创建的 Conda 环境

conda activate pdf2audio

安装依赖

pip install -r requirements.txt

创建 .env 文件，配置 OpenAI Key

OPENAI_API_KEY=your_api_key_here

运行 app.py 启动应用

python app.py

更多...

wdoc - 大量异构文档处理和总结

一个功能强大的 RAG（检索增强生成）系统，旨在汇总、搜索和查询各种文件类型的文档。

ai-financial-agent

ai-financial-agent - 为金融投资打造的AI代理

探索人工智能在投资研究中的应用。

Meetily - AI 驱动的会议助手

一个 AI 驱动的会议助手，可捕获实时会议音频、实时转录并生成摘要，同时确保用户隐私。