小众AI

PDF2Audio
PDF2Audio - 阅读 PDF 的新方式
PDF2Audio,它将彻底改变我们阅读和理解 PDF 文件的方式。我们不再需要盯着屏幕,而是让信息以声音的形式流淌进你的耳朵,无论是在通勤的路上、健身时,还是任何需要解放双手的场合。
  代码仓

PDF2Audio,它将彻底改变我们阅读和理解 PDF 文件的方式。我们不再需要盯着屏幕,而是让信息以声音的形式流淌进你的耳朵,无论是在通勤的路上、健身时,还是任何需要解放双手的场合。

PDF2Audio.webp

主要功能

  • 支持处理多个 PDF 文件
  • 支持选择不同的指令模板(播客、讲座、摘要等)
  • 自定义文本生成和音频模型
  • 支持为演讲者选择不同的声音
  • 对文稿的编辑和对模型的具体反馈进行草稿迭代改进

快速使用

  • 克隆仓库
git clone https://github.com/lamm-mit/PDF2Audio.git
cd PDF2Audio
  • 创建 Conda 环境
conda create -n pdf2audio python=3.9
  • 激活已创建的 Conda 环境
conda activate pdf2audio
  • 安装依赖
pip install -r requirements.txt
  • 创建 .env 文件,配置 OpenAI Key
OPENAI_API_KEY=your_api_key_here
  • 运行 app.py 启动应用
python app.py

更多...


wdoc
一个功能强大的 RAG(检索增强生成)系统,旨在汇总、搜索和查询各种文件类型的文档。
ai-financial-agent
探索人工智能在投资研究中的应用。
Meetily
一个 AI 驱动的会议助手,可捕获实时会议音频、实时转录并生成摘要,同时确保用户隐私。