小众AI

FLUX.1
FLUX.1 - SD创始团队开源的AI图像生成模型
FLUX.1是由Stable Diffusion创始团队推出的开源AI图像生成模型,拥有12B参数,是迄今为止最大的文生图模型。包含三种变体:顶级性能的FLUX.1 [pro]、开源非商业用途的FLUX.1 [dev] 和 快速高效的FLUX.1[schnell]。FLUX.1以卓越的图像质量、高度逼真的人体解剖学表现和先进的提示词遵循能力脱颖而出,为AI图像生成设定了新的行业标准。
  官网   代码仓

FLUX.1是由Stable Diffusion创始团队推出的开源AI图像生成模型,拥有12B参数,是迄今为止最大的文生图模型。包含三种变体:顶级性能的FLUX.1 [pro]、开源非商业用途的FLUX.1 [dev] 和 快速高效的FLUX.1[schnell]。FLUX.1以卓越的图像质量、高度逼真的人体解剖学表现和先进的提示词遵循能力脱颖而出,为AI图像生成设定了新的行业标准。

flux.1.webp

主要特性

  • 大规模参数:拥有12B(120亿)参数,是迄今为止最大的开源文本到图像模型之-
  • 多模态架构:基于多模态和并行扩散Transformer块的混合架构,提供强大的图像生成能力。
  • 高性能变体:提供三种不同性能和用途的模型变体,包括专业版(FLUX.1[pro])、开发版(FLUX.1 [dev])和快速版(FLUX.1 [schnell])。
  • 图像质量:在视觉质量、提示词遵循、大小/纵横比可变性、字体和输出多样性等方面超越了其他流行的模型。
  • 开源和可访问性:部分模型变体如
  • FLUX.1 [dev]和FLUX.1 [schnell]是开源的,易于研究和非商业应用。
  • 技术创新:引入了流匹配训练方法、旋转位置嵌入和并行注意力层,提高了模型性能和硬件效率。

开始使用 🚀

选择合适的模型变体:

  • FLUX.1 [pro]:适合需要顶级性能的商业应用,需要通过API访问。
  • FLUX.1 [dev]:适用于非商业用途,是一个开源的、经过指导蒸馏的模型,可以在HuggingFace上获取。
  • FLUX.1 [schnell]:适合本地开发和个人使用,是最快的模型,同样在HuggingFace上可以获取。
  • 设置环境:如果是本地部署,需要设置Python环境并安装必要的依赖库。
  • 安装FLUX.1:可以通过Git克隆官方GitHub仓库到本地环境,并按照指南安装所需的Python包。
  • 使用API:对于FLUX.1 [pro],需要注册并获取API密钥来访问模型。
  • 编写代码:根据官方文档或示例代码,编写脚本来与模型交互,生成图像。
  • 生成图像:使用模型提供的接口,输入文本提示(prompt),模型将根据文本生成图像。
# 克隆FLUX.1 GitHub仓库
git clone https://github.com/black-forest-labs/flux

# 进入仓库目录
cd flux
# 创建并激活Python虚拟环境
python3.10 -m venv .venv
source .venv/bin/activate
# 安装依赖
pip install -e '.[all]'
# 根据需要设置环境变量,例如指定模型权重路径
export FLUX_SCHNELL=path_to_flux_schnell_sft_file
# 使用提供的脚本进行图像生成
python -m flux --name 'FLUX.1 [schnell]' --loop

图片

flux.1main.png


更多...


wdoc
一个功能强大的 RAG(检索增强生成)系统,旨在汇总、搜索和查询各种文件类型的文档。
ai-financial-agent
探索人工智能在投资研究中的应用。
Meetily
一个 AI 驱动的会议助手,可捕获实时会议音频、实时转录并生成摘要,同时确保用户隐私。