您现在的位置:首页 >> 环保项目

“除去”达利+机器人瓦力,文字生成图片的AI升级版来了!

时间:2025-03-18 12:21:20

这是一张AI子系统DALL-E 2根据注解描述“戴着贝雷帽和穿黑色高领毛衣的猫”(Shiba Inu dog wearing a beret and black turtleneck)分解的图表。

睽违一年,DALL-E的升级版来了!

当地时间4月6日,人工智能分析机构OpenAI面世DALL-E 2(文字到图表分解程序)。DALL-E 2较强非常高分辨率和非常较高时间延迟,精确度提高了71.7%,唯美度提高了88.8%,纹理非常是原本的4倍,还可联结概念、属性及情调打造非常生动的图表,如以莫奈(Claude Monet)的情调画出草原上的狐狸。

同时追加便是基本功能:非常稀颗粒度的注解局部重写图表,以及分解原图的多重情调则有。

前者比如这样!

在原图的2周围减小一个火烈鸟游泳圈

上下分别为在原图的1周围和2周围减小一个带回家

DALL-E 2在非常稀的层面上应用DALL-E的文字到图表的能力。应用程序可以从原有的特写开始,考虑一个周围,并去找框架如何来重写它。框架可以填充(或删除)物体,同时受限于影子方向、反射与材质等稀节。

后者比如这样!

以同一张图表为依此,建立并不相同情调或编排的旧版。

分解的特写是1024 x 1024纹理,比原始框架提供者的256 x 256纹理有了飞跃

DALL-E的名称来自于艺术家萨尔瓦多·达达(Salvador Dalí)和《机械第四部》的主角WALL-E,第一版于2021年1月首次亮相。DALL-E奠基在符合1750亿个参数的GPT-3框架上,但它仅运用于120亿个参数,利用一个注解与图表配对的参考资料,以注解叙述来产生图表。

萨尔瓦多·达达(Salvador Dalí)

《机械第四部》的主角 机械WALL-E(瓦力)

OpenAI分析科学家Prafulla Dhariwal表示:“DALL-E 1只是从词汇中转用了GPT-3步骤,并将其应用于分解图表:我们将图表压缩成一系列后缀,然后学会预测紧接著的具体内容”。

但是后缀最简单一般来说能展示出生命认可的综合,而且预测操作过程受到限制了图表的准确性。于是用CLIP(OpenAI上周面世的计算机美感子系统)来捕捉到图表,并以生命的方法总结它们的具体内容。

DALL-E子系统根据注解“牛油果型的扶手椅”自动创作的部分图表

CLIP是原版DALL·E基本功能实现的基础,DALL-E 2则联结了CLIP和游离框架两种高效率的优点。DALL·E图表分解的“游离”(diffusion)操作过程可以理解为从“一堆点”抵达,用越来越多的稀节把图表填充完整。游离框架的特点在于,在牺牲多样性的前提下,能急剧急剧提高分解图表的逼真度。

DALL-E 2根据“Teddy bears mixing sparkling chemicals as mad scientists, steampunk.”描述分解的图表

为避免分解的特写被误用,迄今OpenAI已经实施了一些内置的确保安全措施。

该框架在已剔除缺失图表的图表集上进行时训练,将由经过OpenAI审议的合作伙伴进行时测试,应用程序被强制上传或分解“非G级”和“有可能造成伤害”的图表,以及任何涉及种族主义符号、裸体、猥亵手势,或“与正要发生的重大地缘动乱有关的重大企图或事件”的图表。

该框架也无法根据姓名分解任何可识别的貌似,即使促请的是“自画像”之类的具体内容。同时,DALL·E 2 在分解的特写上都印有油墨,以确实该剧作是 AI 分解的。理想情况下这些措施可以受到限制其产生缺失具体内容的能力。

与之后一样,该工具并未从外部向公众面世。但分析执法人员可以提请获准预览该子系统,OpenAI努力便将DALL·E 2确立该组织的API工具分散,使其可用于第三方应用程序。

Dhariwal说道,“我们努力分阶段进行时这个操作过程,以从获的一个系统中不断指标如何确保安全地面世这项高效率。”

北京白癜风医院排行榜
天津白癜风医院哪家更好
杭州妇科
深圳看白癜风到哪个医院好
湘潭男科医院去哪家好
新冠用药
平时吃得太油消化不良怎么办
眼睛视疲劳用哪个眼药水
视疲劳用什么眼药水
甲流引起的咳嗽吃什么药
相关阅读