刚刚!OpenAI 推出 Dalle-3
作者:阿法兔研究笔记
欢迎大家转发到朋友圈~~这样兔儿就更有动力发更多好内容了~
关于 DALL-E 3
现代文本到图像系统往往会忽略文字或描述,迫使用户学习提示工程。DALL-E 3 代表着 OpenAI 在生成与您提供的文本完全一致的图像能力方面的一次飞跃 (Modern text-to-image systems have a tendency to ignore words or descriptions, forcing users to learn prompt engineering. DALL·E 3 represents a leap forward in our ability to generate images that exactly adhere to the text you provide.)
即使相同的提示词,DALL-E 3 也比 DALL-E 2 有显著改进,如下: 提示词 “An expressive oil painting of a basketball player dunking, depicted as an explosion of a nebula.”
左图是 DALL-E 2,右图的 DALL-E 3
DALL-E 3 DALL-E 3 是在 ChatGPT 的基础上开发的,它可以让用户把 ChatGPT 作为你的头脑风暴伙伴和提示的提炼者。从简单的句子到详细的段落,你都可以向 ChatGPT 提出自己的需求。
ChatGPT 中的 DALL-E 3 当你提出一个想法时,ChatGPT 会自动为 DALL-E 3 生成量身定制的详细提示,让你的想法栩栩如生。如果你喜欢某个图像,但它不太合适,你可以要求 ChatGPT 进行调整,只需几个字即可。
DALL-E 3 将于 10 月初向 ChatGPT Plus 和企业客户推出。与 DALL-E 2 一样,
用户使用 DALL-E 3 创建的图片归自己所有,无需获得 OpenAI 的许可即可对其进行转载、销售或商品化。
其它示例
和 ChatGPT 的集成:让 ChatGPT 制作一个有趣的漫画,ChatGPT 可以为 DALL-E 3 提出了概念,并编写了详细的提示词。
再举个例子,跟 ChatGPT 说:"制作有趣的表情包:make a funny meme. should be unlike anything seen before."; it prompted DALL·E with: "A penguin in a desert with a suitcase, looking confused, with a text caption that says 'I think I booked the wrong flight'." Not cherry-picked:
还可以使用 DALL-E 3 制作一些非常漂亮和有趣的可视化效果:
还有海报:
卡通图片:
Sam 展示的视频:
原理:
上述原理参考自:知乎 DALL·E 原理通俗理解 -Mr.RottenPeach的文章
你对 DALL·E 3 怎么看?可以试用一下:)对比一下和 Midjourney
* 转载本文,请附上所有参考文献链接
关于 DALL-E 3
*本文 1000 字左右
https://openai.com/dall-e-3
- DALL-E 3 目前处于研究和试用预览阶段,将于 10 月份向 ChatGPT Plus 和企业客户提供。
DALL-E 3 :能够理解微妙的细微差别,并根据包含大量细节的提示词出图
- 根据 OpenAI 官网,DALL-E 3 主要是针对 ChatGPT Plus 和企业版用户都将可以使用。
现代文本到图像系统往往会忽略文字或描述,迫使用户学习提示工程。DALL-E 3 代表着 OpenAI 在生成与您提供的文本完全一致的图像能力方面的一次飞跃 (Modern text-to-image systems have a tendency to ignore words or descriptions, forcing users to learn prompt engineering. DALL·E 3 represents a leap forward in our ability to generate images that exactly adhere to the text you provide.)
即使相同的提示词,DALL-E 3 也比 DALL-E 2 有显著改进,如下: 提示词 “An expressive oil painting of a basketball player dunking, depicted as an explosion of a nebula.”

DALL-E 3 DALL-E 3 是在 ChatGPT 的基础上开发的,它可以让用户把 ChatGPT 作为你的头脑风暴伙伴和提示的提炼者。从简单的句子到详细的段落,你都可以向 ChatGPT 提出自己的需求。
ChatGPT 中的 DALL-E 3 当你提出一个想法时,ChatGPT 会自动为 DALL-E 3 生成量身定制的详细提示,让你的想法栩栩如生。如果你喜欢某个图像,但它不太合适,你可以要求 ChatGPT 进行调整,只需几个字即可。

其它示例
和 ChatGPT 的集成:让 ChatGPT 制作一个有趣的漫画,ChatGPT 可以为 DALL-E 3 提出了概念,并编写了详细的提示词。

再举个例子,跟 ChatGPT 说:"制作有趣的表情包:make a funny meme. should be unlike anything seen before."; it prompted DALL·E with: "A penguin in a desert with a suitcase, looking confused, with a text caption that says 'I think I booked the wrong flight'." Not cherry-picked:

还可以使用 DALL-E 3 制作一些非常漂亮和有趣的可视化效果:

还有海报:

卡通图片:

Sam 展示的视频:

原理:
- 早的 DALL·E 是 OpenAI 的多模态预训练模型,通过 120 亿参数的模型,在 2.5 亿图像文本对上训练完成
- DALL-E 是一个两阶段的模型:它的第一个阶段是离散变分自编码器(Discrete Variance Auto-Encoder,dVAE),用于生成图像的 token。它的第二个阶段是混合了图像和文本特征的,以 Transformer 为基础的生成模型

上述原理参考自:知乎 DALL·E 原理通俗理解 -Mr.RottenPeach的文章
你对 DALL·E 3 怎么看?可以试用一下:)对比一下和 Midjourney
参考资料:
1.知乎:DALL·E 原理通俗理解 -Mr.RottenPeach
2.Greg 的推特
3.https://openai.com/dall-e-3
4.https://zhuanlan.zhihu.com/p/506778898
【阅读更多】
刚刚!OpenAI 推出 ChatGPT Plugins 的解读
OpenAI 创始团队:超级智能发展无法阻挡
最新!彻底颠覆 Office,微软发布 Copil
生成式 AI 颠覆前端,你该何去何从?
重磅突发!OpenAI 正式推出多模态 GPT-4
0
0
免责声明:文章中的所有内容仅代表作者的观点,与本平台无关。用户不应以本文作为投资决策的参考。
PoolX:锁仓获得新代币空投
不要错过热门新币,且APR 高达 10%+
立即参与!
你也可能喜欢
美中冲突降温,美欧贸易紧张局势加剧
正当持续已久的美中贸易战似乎有所缓和之际,美国与欧盟之间的新紧张局势正在浮现。随着特朗普称欧洲“比中国更恶劣”,我们是否即将见证一场新的跨大西洋贸易冲突?
Cryptoticker•2025/05/13 17:00
如果黄金达到5000美元,比特币(BTC)价格会是多少?
AICoin•2025/05/13 16:22
LONGITUDE专家组:机构买入比特币(BTC)或将很快使散户难以入场
AICoin•2025/05/13 16:22
原因解析:为何特朗普宣布美中关税协议后比特币(BTC)价格下跌
AICoin•2025/05/13 16:22
加密货币价格
更多
Bitcoin
BTC
$104,238.66
+1.29%

Ethereum
ETH
$2,691.47
+7.85%

XRP
XRP
$2.58
+1.14%

Tether USDt
USDT
$1
+0.01%

Solana
SOL
$183.02
+5.19%

BNB
BNB
$665.55
+0.38%

USDC
USDC
$1.0000
+0.00%

Dogecoin
DOGE
$0.2398
+3.57%

Cardano
ADA
$0.8321
+1.10%

TRON
TRX
$0.2713
-0.06%
交易热门币种
新用户可获得价值 6200 USDT 的迎新大礼包
立即交易
立即成为交易者?新用户可获得价值 6200 USDT 的迎新大礼包
立即注册