人工智能文生图技术介绍
简介
传统的绘图方式是由设计师手绘或者通过软件绘制图片,中间需要使用到类似于PS这样的工具。所谓文生图,就是指直接通过一些描述性文字生成对应的图片的技术。
以前,完成各种设计,是离不开设计师的参与的。但是通过文生图技术,可以直接将对于图片的需求发送给程序,让程序生成。
文生图实现方式
文成图有两种实现方式:
“代码式”文生图 | PlantUML/Mermaid/Reveal.js |
AI文生图 | MidJourney、文心一言 |
代码式文生图
顾名思义,其实就是通过编写符合工具语法规范的代码、或者markdown文本,去生成对应格式的图片。以下是几个代码式文生图的示例。
PLANTUML
PlantUML是一个开源工具,用于通过简单的文本描述来创建各种类型的图形,包括类图、时序图、用例图、组件图、活动图等。
不过它具有一定的学习成本,通常都是开发团队和架构师进行使用。
MERMAID
Mermaid(美人鱼)是一个用于创建流程图、时序图、甘特图、类图等图形的开源标记语言和JavaScript库。
Mermaid 受到开发人员和文档作者的欢迎,因为它使创建图形变得简单且易于维护。
REVEAL.JS
Reveal.js 是一个开源的HTML和JavaScript框架,用于创建演示文稿和幻灯片。它允许用户使用HTML、CSS和JavaScript来制作交互式和美观的演示,而不需要依赖于传统的演示软件。
除此之外,还可以使用 Markdown 插件编写PPT。不过Reveal.js同样也是具有一定的学习成本,所以更适合开发者进行学习与使用。
AI 文生图
MIDJOURNEY
Midjourney是一个由同名研究实验室开发的人工智能程序,可根据文本生成图像[1][2],于2022年7月12日进入公开测试阶段[3],用户可透过Discord的机器人指令进行操作[4]。该研究实验室由Leap Motion的创办人大卫·霍尔兹(David Holz)负责领导[5]。——来自维基百科
新版Midjourney,用户使用风格化命令,就能轻而易举地生成大师级作品。Midjourney 由于其良好的体验、惊艳的产品效果,目前还是文生图领域的“领跑者”。
文心一言
文心一言(英语:ERNIE Bot)是由百度公司开发的聊天机器人,能够与人交互、回答问题及协作创作。该产品被传媒称为国际著名聊天机器人ChatGPT的中国版及其竞争对手[1][2]。目前已开放用户申请加入体验,但现仅支持百度帐号绑定中国大陆电话号码的企业级用户和个人用户[3]。——来自维基百科
文心一言同样也具备文生图功能,不过目前还不够成熟,相信给到一定的时间,一定能发展成为一个优秀的大语言模型产品。
总结
文生图现在的工具以及使用体验逐渐越来越强大,不论是代码式文生图还是AI 文生图,都可以选择适合自己工作场景的工具进行使用。