小众AI

Buzz
Buzz - 可离线的实时语音转文字工具
Buzz 是一款基于 OpenAI Whisper 的开源、可离线的实时语音转文字工具,支持 Windows、macOS、Linux,它可以将麦克风的语音实时转换为文字,也支持将视频、音频文件转换为文字、字幕。
  官网   代码仓

Buzz是由Chidi Williams创建的一款开源软件,Buzz利用OpenAI的Whisper技术,能够进行离线音频转录和翻译。同时,它也基于Transformer模型的预训练语言模型(如BERT或GPT系列),提供文本生成与分析功能。

主要功能

  • 音频处理:自动识别语音为文本字幕,支持批量转换音频或视频内容为带有时间的字幕,速度快且准确率高。
  • 文本生成与分析:包括文本生成、情感分析、关键词提取和文本翻译等功能。

buzz-banner.jpg

安装部署

PyPI:

pip install buzz-captions
python -m buzz

macOS:

brew install --cask buzz

Windows:

直接下载可执行文件.

Linux:

sudo apt-get install libportaudio2 libcanberra-gtk-module libcanberra-gtk3-module
sudo snap install buzz
sudo snap connect buzz:audio-record
sudo snap connect buzz:password-manager-service
sudo snap connect buzz:pulseaudio
sudo snap connect buzz:removable-media

更多...


ai-financial-agent
探索人工智能在投资研究中的应用。
Meetily
一个 AI 驱动的会议助手,可捕获实时会议音频、实时转录并生成摘要,同时确保用户隐私。
CHRONOS
CHRONOS是一种新颖的基于检索的时间线摘要 (TLS) 方法,通过迭代提出有关主题和检索到的文档的问题来生成按时间顺序排列的摘要。