小众AI

MoneyPrinterTurbo
MoneyPrinterTurbo - 自动生成高清短视频
MoneyPrinterTurbo是一款基于AI大模型的开源软件,旨在通过一键操作帮助用户自动生成高清短视频。只需提供一个视频 主题 或 关键词 ,就可以全自动生成视频文案、视频素材、视频字幕、视频背景音乐,然后合成一个高清的短视频。
  代码仓

MoneyPrinterTurbo是一款基于AI大模型的开源软件,旨在通过一键操作帮助用户自动生成高清短视频。只需提供一个视频 主题关键词 ,就可以全自动生成视频文案、视频素材、视频字幕、视频背景音乐,然后合成一个高清的短视频。

主要功能 🎯

  • 完整的 MVC架构,代码 结构清晰,易于维护,支持 APIWeb界面
  • 支持视频文案 AI自动生成,也可以自定义文案
  • 支持多种 高清视频 尺寸:竖屏 9:16,1080x1920,横屏 16:9,1920x1080
  • 支持 批量视频生成,可以一次生成多个视频,然后选择一个最满意的
  • 支持 视频片段时长 设置,方便调节素材切换频率
  • 支持 中文英文 视频文案
  • 支持 多种语音 合成,可 实时试听 效果
  • 支持 字幕生成,可以调整 字体位置颜色大小,同时支持字幕描边设置
  • 支持 背景音乐,随机或者指定音乐文件,可设置背景音乐音量
  • 视频素材来源 高清,而且 无版权,也可以使用自己的 本地素材
  • 支持 OpenAIMoonshotAzuregpt4freeone-api通义千问Google GeminiOllamaDeepSeek文心一言 等多种模型接入

安装使用

配置要求 📦

  • 建议最低 CPU 4核或以上,内存 8G 或以上,显卡非必须
  • Windows 10 或 MacOS 11.0 以上系统

快速开始 🚀

下载一键启动包,解压直接使用(路径不要有 中文特殊字符空格

Windows

下载后,建议先双击执行 update.bat 更新到最新代码,然后双击 start.bat 启动

启动后,会自动打开浏览器(如果打开是空白,建议换成 Chrome 或者 Edge 打开)

其他系统

还没有制作一键启动包,看下面的 安装部署 部分,建议使用 docker 部署,更加方便。

安装部署 📥

前提条件
  • 尽量不要使用 中文路径,避免出现一些无法预料的问题
  • 请确保你的 网络 是正常的,VPN需要打开全局流量模式
① 克隆代码
git clone https://github.com/harry0703/MoneyPrinterTurbo.git
② 修改配置文件
  • config.example.toml 文件复制一份,命名为 config.toml
  • 按照 config.toml 文件中的说明,配置好 pexels_api_keysllm_provider,并根据 llm_provider 对应的服务商,配置相关的 API Key
Docker部署 🐳
① 启动Docker

如果未安装 Docker,请先安装 https://www.docker.com/products/docker-desktop/

如果是Windows系统,请参考微软的文档:

  1. https://learn.microsoft.com/zh-cn/windows/wsl/install
  2. https://learn.microsoft.com/zh-cn/windows/wsl/tutorials/wsl-containers
cd MoneyPrinterTurbo
docker-compose up
② 访问Web界面

打开浏览器,访问 http://0.0.0.0:8501

③ 访问API文档

打开浏览器,访问 http://0.0.0.0:8080/docs 或者 http://0.0.0.0:8080/redoc

手动部署 📦

视频教程

① 创建虚拟环境

建议使用 conda 创建 python 虚拟环境

git clone https://github.com/harry0703/MoneyPrinterTurbo.git
cd MoneyPrinterTurbo
conda create -n MoneyPrinterTurbo python=3.10
conda activate MoneyPrinterTurbo
pip install -r requirements.txt
② 安装好 ImageMagick
  • Windows:

    • 下载 https://imagemagick.org/script/download.php 选择Windows版本,切记一定要选择 静态库 版本,比如 ImageMagick-7.1.1-32-Q16-x64-static.exe
    • 安装下载好的 ImageMagick,注意不要修改安装路径
    • 修改 配置文件 config.toml 中的 imagemagick_path 为你的 实际安装路径
  • MacOS:

    brew install imagemagick
    
  • Ubuntu

    sudo apt-get install imagemagick
    
  • CentOS

    sudo yum install ImageMagick
    
③ 启动Web界面 🌐

注意需要到 MoneyPrinterTurbo 项目 根目录 下执行以下命令

Windows

conda activate MoneyPrinterTurbo
webui.bat

MacOS or Linux

conda activate MoneyPrinterTurbo
sh webui.sh

启动后,会自动打开浏览器(如果打开是空白,建议换成 Chrome 或者 Edge 打开)

④ 启动API服务 🚀
python main.py

启动后,可以查看 API文档 http://127.0.0.1:8080/docs 或者 http://127.0.0.1:8080/redoc 直接在线调试接口,快速体验。

语音合成 🗣

所有支持的声音列表,可以查看:声音列表

2024-04-16 v1.1.2 新增了9种Azure的语音合成声音,需要配置API KEY,该声音合成的更加真实。

字幕生成 📜

当前支持2种字幕生成方式:

  • edge: 生成速度快,性能更好,对电脑配置没有要求,但是质量可能不稳定
  • whisper: 生成速度慢,性能较差,对电脑配置有一定要求,但是质量更可靠

可以修改 config.toml 配置文件中的 subtitle_provider 进行切换

建议使用 edge 模式,如果生成的字幕质量不好,再切换到 whisper 模式

注意:

  1. whisper 模式下需要到 HuggingFace 下载一个模型文件,大约 3GB 左右,请确保网络通畅
  2. 如果留空,表示不生成字幕。

由于国内无法访问 HuggingFace,可以使用以下方法下载 whisper-large-v3 的模型文件

下载地址:

模型下载后解压,整个目录放到 .\MoneyPrinterTurbo\models 里面, 最终的文件路径应该是这样: .\MoneyPrinterTurbo\models\whisper-large-v3

MoneyPrinterTurbo  
  ├─models
  │   └─whisper-large-v3
  │          config.json
  │          model.bin
  │          preprocessor_config.json
  │          tokenizer.json
  │          vocabulary.json

背景音乐 🎵

用于视频的背景音乐,位于项目的 resource/songs 目录下。

当前项目里面放了一些默认的音乐,来自于 YouTube 视频,如有侵权,请删除。

字幕字体 🅰

用于视频字幕的渲染,位于项目的 resource/fonts 目录下,你也可以放进去自己的字体。


更多...


ai-financial-agent
探索人工智能在投资研究中的应用。
Meetily
一个 AI 驱动的会议助手,可捕获实时会议音频、实时转录并生成摘要,同时确保用户隐私。
CHRONOS
CHRONOS是一种新颖的基于检索的时间线摘要 (TLS) 方法,通过迭代提出有关主题和检索到的文档的问题来生成按时间顺序排列的摘要。