紧张特性多措辞支持:AnyText能够天生多种措辞的文本,包括中文、英文、日文、韩文等。多行文本天生:用户可以指定在图像的多个位置天生文本。变形区域书写:AnyText能够天生水平、垂直乃至曲线或不规则区域内的文本。文本编辑能力:AnyText供应了修正图像中指定位置文本内容的功能,同时保持与周围文本风格的同等性。即插即用:AnyText可以无缝集成到现有的扩散模型中,供应天生文本的能力。开始利用 安装
# Install git (skip if already done)conda install -c anaconda git# Clone anytext codegit clone https://github.com/tyxsspa/AnyText.gitcd AnyText# Prepare a font file; Arial Unicode MS is recommended, you need to download it on your ownmv your/path/to/arialuni.ttf ./font/Arial_Unicode.ttf# Create a new environment and install packages as follows:conda env create -f environment.yamlconda activate anytext
推理
[推举]:AnyText 在ModelScope和HuggingFace上发布了一个demo!
您也可以通过我们的 API 做事试用 AnyText。
AnyText 包括两种模式:文本天生和文本编辑。运行下面的大略代码以在两种模式下实行推理,并验证环境是否已精确安装。
python inference.py
如果您有高等 GPU(至少 8G 内存),建议支配我们的 Demo,如下所示,个中包括利用解释、用户界面和丰富的示例。
export CUDA_VISIBLE_DEVICES=0 && python demo.py
默认利用 FP16 推理,并加载中英文翻译模型直接输入中文提示符(占用 ~4GB GPU 内存)。可以修正默认行为,由于以下命令会启用 FP32 推理并禁用翻译模型:
export CUDA_VISIBLE_DEVICES=0 && python demo.py --use_fp32 --no_translator
如果利用 FP16 且未利用翻译模型(或将其加载到 CPU 上,请参阅此处),则天生单个 512x512 图像将占用 ~7.5GB 的 GPU 内存。 此外,其他字体文件也可以利用(只管结果可能不是最佳的):
export CUDA_VISIBLE_DEVICES=0 && python demo.py --font_path your/path/to/font/file.ttf
您还可以加载指定的 AnyText 检讨点:
export CUDA_VISIBLE_DEVICES=0 && python demo.py --model_path your/path/to/your/own/anytext.ckpt