Buzz是由Chidi Williams创建的一款开源软件,Buzz利用OpenAI的Whisper技术,能够进行离线音频转录和翻译。同时,它也基于Transformer模型的预训练语言模型(如BERT或GPT系列),提供文本生成与分析功能。
主要功能
- 音频处理:自动识别语音为文本字幕,支持批量转换音频或视频内容为带有时间的字幕,速度快且准确率高。
- 文本生成与分析:包括文本生成、情感分析、关键词提取和文本翻译等功能。
安装部署
PyPI:
pip install buzz-captions
python -m buzz
macOS:
brew install --cask buzz
Windows:
直接下载可执行文件.
Linux:
sudo apt-get install libportaudio2 libcanberra-gtk-module libcanberra-gtk3-module
sudo snap install buzz
sudo snap connect buzz:audio-record
sudo snap connect buzz:password-manager-service
sudo snap connect buzz:pulseaudio
sudo snap connect buzz:removable-media