主题 : OpenAI 祭出 120 亿参数魔法模型:从文本合成图像栩栩如生,仿佛拥有人类的语言想象力
千山同一月 万户尽皆春 千江有水千江月 万里无云万里天
级别: 总版主

UID: 998
精华: 0
发帖: 605067
威望: 529787 点
无痕币: 28 WHB
贡献值: 0 点
在线时间: 62755(时)
注册时间: 2008-12-25
最后登录: 2024-05-27

0 OpenAI 祭出 120 亿参数魔法模型:从文本合成图像栩栩如生,仿佛拥有人类的语言想象力

2021 刚刚开启,OpenAI 又来放大招了!
能写小说、哲学语录的 GPT-3 已经不足为奇?那就来一个多模态『图像版 GPT-3』。
今天,OpenAI 重磅推出了最新语言模型—DALL·E,它是 GPT-3 的 120 亿参数版本,可以魔法一般按照自然语言文字描述直接生成对应图片!
比如,在 DALL·E 模型中输入 “穿芭蕾舞短裙、正在遛狗的萝卜宝宝”,它就可以生成这样一张图片:

输入 “鳄梨形状的扶手椅”,就是这样:

甚至输入 “含 OpenAI 字样的店铺”,它也能成生成多种设计图

DALL·E 这项神技能冲上了各大社交平台的热搜。
Keras 创始人 François Chollet 特意发文称:
这看起来非常酷,尤其是 “图像生成”的部分。从原理上来看,它应该就是 GPT-3 在文本合成图像方向上的扩展版本。
AI 大神吴恩达也第一时间转推点赞,还顺带挑选了一张满意的蓝色衬衫 + 黑色长裤的 AI 生成图。

OpenAI 联合创始人、首席科学家 Ilya Sutskever 在推特上发文表道:人工智能的长期目标是构建多模态神经网络,即 AI 能够学习不同模态之间的概念(文本和视觉领域为主),从而更好地理解世界。而 DALL·E 和 CLIP 使我们更接近 “多模态 AI 系统”这一目标。

值得一提的是,DALL·E 的命名也很特别。这个善于绘画创作的模型名称来源于人类艺术家萨尔瓦多 · 达利(Salvador Dalí)和皮克斯(Pixar)机器人 WALL·E 名称的结合。

接下来,我们来详细介绍一下它还有哪些硬核能力。
级别: 十方秋水

UID: 88
精华: 0
发帖: 130120
威望: 221902 点
无痕币: 107420 WHB
贡献值: 0 点
在线时间: 51973(时)
注册时间: 2008-03-18
最后登录: 2024-04-25

又一精品。谢谢楼主分享。
Total 0.041939(s) query 5, Time now is:05-27 07:00, Gzip enabled 粤ICP备07514325号-1
Powered by PHPWind v7.3.2 Certificate Code © 2003-13 秋无痕论坛