小众AI

AnyText
AnyText - 轻松 DIY 图片文字,定制你的创意设计
AnyText提供了文字生成和文字编辑两种模式,它能够根据提示词生成图文融合的图片,并确保文字的准确性,还支持对上传图片中的文字进行编辑后,重新生成图片。支持中文、英语、日语、韩语等多语言,适用于海报设计、Logo 设计、创意涂鸦、表情包等场景。
  官网   代码仓

AnyText提供了文字生成和文字编辑两种模式,它能够根据提示词生成图文融合的图片,并确保文字的准确性,还支持对上传图片中的文字进行编辑后,重新生成图片。支持中文、英语、日语、韩语等多语言,适用于海报设计、Logo 设计、创意涂鸦、表情包等场景。

AnyText.webp

主要特性

  • 多语言支持:AnyText能够生成多种语言的文本,包括中文、英文、日文、韩文等。
  • 多行文本生成:用户可以指定在图像的多个位置生成文本。
  • 变形区域书写:AnyText能够生成水平、垂直甚至曲线或不规则区域内的文本。
  • 文本编辑能力:AnyText提供了修改图像中指定位置文本内容的功能,同时保持与周围文本风格的一致性。
  • 即插即用:AnyText可以无缝集成到现有的扩散模型中,提供生成文本的能力。

开始使用 🚀

安装

# Install git (skip if already done)
conda install -c anaconda git
# Clone anytext code
git clone https://github.com/tyxsspa/AnyText.git
cd AnyText
# Prepare a font file; Arial Unicode MS is recommended, **you need to download it on your own**
mv your/path/to/arialuni.ttf ./font/Arial_Unicode.ttf
# Create a new environment and install packages as follows:
conda env create -f environment.yaml
conda activate anytext

推理

[推荐]:AnyText 在ModelScope和HuggingFace上发布了一个demo!您也可以通过我们的 API 服务试用 AnyText。

AnyText 包括两种模式:文本生成和文本编辑。运行下面的简单代码以在两种模式下执行推理,并验证环境是否已正确安装。

python inference.py

如果您有高级 GPU(至少 8G 内存),建议部署我们的 Demo,如下所示,其中包括使用说明、用户界面和丰富的示例。

export CUDA_VISIBLE_DEVICES=0 && python demo.py

默认使用 FP16 推理,并加载中英文翻译模型直接输入中文提示符(占用 ~4GB GPU 内存)。可以修改默认行为,因为以下命令会启用 FP32 推理并禁用翻译模型:

export CUDA_VISIBLE_DEVICES=0 && python demo.py --use_fp32 --no_translator

如果使用 FP16 且未使用翻译模型(或将其加载到 CPU 上,请参阅此处),则生成单个 512x512 图像将占用 ~7.5GB 的 GPU 内存。 此外,其他字体文件也可以使用(尽管结果可能不是最佳的):

export CUDA_VISIBLE_DEVICES=0 && python demo.py --font_path your/path/to/font/file.ttf

您还可以加载指定的 AnyText 检查点:

export CUDA_VISIBLE_DEVICES=0 && python demo.py --model_path your/path/to/your/own/anytext.ckpt

更多...


ai-financial-agent
探索人工智能在投资研究中的应用。
Meetily
一个 AI 驱动的会议助手,可捕获实时会议音频、实时转录并生成摘要,同时确保用户隐私。
CHRONOS
CHRONOS是一种新颖的基于检索的时间线摘要 (TLS) 方法,通过迭代提出有关主题和检索到的文档的问题来生成按时间顺序排列的摘要。