凌晨三点用完豆包Seedream 4.0后,我打算和NanoBanana说再见了

IP归属:北京

文章AI导读

一键萃取文章精髓,核心观点即刻呈现

作者|鱼丸

编辑|星奈

媒体|AI大模型工场

 

最近朋友圈被豆包Seedream 4.0刷屏了,一开始刚看那图片,我以为又是朋友们在炫耀他们的3D模型,结果点进去放大一看水印不对啊,怎么变成豆包AI生成了呢。

立马去搜了一下,好家伙,作为字节跳动9月9日刚发布的图像创作模型,它号称是“国内版NanoBanana",也不知道真有那么好玩吗,说到这立马上传一张了图片,谁说心中的白月光一定是人呢,也可以是一碗螺蛳粉。

这图片的色泽看着想流口水了,看来Seedream 4.0不简单呢。

据了解这是Seedream 4.0首次支持4K多模态生图,实现多图融合创作,什么意思呢,就是之前上传单一参考图片的时代已经过去了,可以满足更多样更丰富的创作要求,并且能更准确的读取和理解图片文字要求,不仅如此在一致性上更是有很大提升,不论是搞笑创作还是进行商业用途,Seedream 4.0直接全包了。

现在Seedream 4.0已经上线豆包APP,大家可以玩起来了。

01

实测豆包Seedream 4.0,真正的六边形战士诞生了

 

1、创意周边,从草稿到实体只需要一步

 

AI创作的一致性一直都是一个难题,其对于大模型的识别能力非常具有考验性,但是这又是贯彻整个设计的重要要求,毕竟谁也不想生成图片后发现可以应用的图片为零。

表情包组合大家应该用的不少,但是有没有想过设计一套属于自己的表情包,上传一张可爱起司猫的图片,输入要求:帮我创作一张图片,图片内包含表情、姿势不同的九宫格表情包,原比例。

我的天!怎么可以这么可爱,萌化了,这我不得不要夸夸Seedream 4.0,每个图片的表情都对应了不同的情绪,开心的,生气的,无语的,图片中的小猫脸也没有改变画风或是变成稀奇古怪的模样。

这就是升级后的一致性,只需要上传喜欢的图片,一句话就能生成,而且每张图片的形象基本上完全一致,在细节上小猫头上的刘海的花纹都大差不差,刚开始测就已经想说豆包你是我的神!

再随手画一个猫咪涂鸦(忽略我的画画水平),看看豆包可以理解吗,输入”转换成毛绒玩偶,放在真实的沙发上”。

这确定不是一个模子刻出来的吗,画风如此抽象怎么让豆包生成之后怎么也变得可爱起来了。

不仅如此,随手画的胡子的长度和嘴巴的微笑弧度,完美复刻,并且把下方画的很模糊的腿部也给补充完整,连布制沙发的纹理,小猫的影子都生成的一点都不突兀,看来豆包可以拯救我之前的废画了~

2、多图合成,创意合照的神操作

 

除了上述可以传一张图外,还能上传多张图。单张参考图的时代慢慢的被淘汰,多图参考才是趋势,多一张图就代表多一种想法,就可以多完成一个任务,不过这并不是说单图的参考生成就要敷衍,而且说不论是单图还是多图都能把握。

上传两张小狗的图片输入“让图1的狗和图2的狗在草地上散步,原比例。”

挺好,两只狗在肩并肩走路,金毛脖子上的铁链子和小狗的蓝眼睛都很写实。

那让我们再弄点抽象的,上传李白和李荣浩的照片,想没想过让他俩同台创作呢,输入生成照片为写实风,图一的李白和图二的李荣浩一起在演唱会舞台上唱歌,李白在左边拿着话筒,李荣浩在右边唱歌,原比例。

好家伙,Seedream 4.0直接把李白的衣服给补全了,还带有古装的褶皱,和环境融合的一点违和感都没有,就是有点怀疑豆包是不是把李荣浩的眼睛给偷偷变大了。

这都没难倒豆包,再上点难度,再上传一张手动操作的比耶的火柴人图片,输入“把右边的人物动作换成图二的动作其余不变,原比例。”

整体来说很不错,非常准确的捕捉了抽象图画中的动作,并且除了动作改变外还保证了其它的特征不变,也没有什么错位混乱的问题和违和感。

不过有一点实锤,豆包真的把李荣浩眼睛变大了,豆包的另一个身份不会是李荣浩粉丝吧~

3、理解文字,风格转变,小白也能秒变艺术大师

 

除了一致性外,理解能力也非常重要,提升自然语言的理解的准确度才可以满足对应的需求。

听说这次豆包Seedream 4.0不仅能听懂字面意思还能自己推断思考,用一个很简单的方法。上传一张冰块的图片,输入半小时后会是什么样子。

我们看到豆包Seedream4.0理解了半小时的时间概念,也知道半小时后冰块会融化,虽说水确实有一些多,但是效果已经超出预料了。

再输入“把这些冰块放到一杯桃子汽水里,用透明杯子盛着。”

我们看到下方还有水汽融化的水渍,非常细节,最后再让其转变成卡通风,上面写着桃子汽水。

太像电视里动画片的小饮品,文字读取也没有差错,几句话豆包就把冰块的一生都解决了,豆包Seedream 4.0已经是Next level了。

我们在让豆包设计个签名,上传一张卡通女孩的图片,输入给鱼丸设计一个签名,并把签名印到图片右下方上,签名潇洒飘逸,原比例。

我们看到豆包的设计了一个金色渐变的笔迹,有点自己的想法,下方还有一些签字的笔渍,非常细节了好像刚签上的一样。

4、商业实操,实用性才是第一要义

 

除了上述的一些创作,能够在生产使用场景中得到运用也是很重要的,毕竟满足生活创作和产业使用都是大模型不断升级的推动因素,在各种领域都离不开创作。

下面让我们设计一个城市宣传图,输入用晶莹剔透的3D创意字体设计,插画海报,白色背景,文字“上海”,“上”字内笔画嵌入上海的特色物品,“海”字内笔画于海,特色建筑,体现了上海在城中、城在海中,高品质,2k。原比例。

不得不说,豆包是有审美的,并且在没有明确指示的情况下还可以理解生成东方明珠,总体来说这个海报大气美观有特点。

我们再看看用一张图片能不能解决商家的小问题,上传一张小孩都喜欢的小兰姐姐的图片,输入“根据这个图片设计一套文具”。

从左到右依次是,本,笔,铅笔盒,封皮,我们发现在头饰上有些出入还有铅笔盒上裙子上的细节,别的都没有问题,小学生看到估计直接爱了。

然后我们来看看房屋设计图,我们上传三张平面设计图,输入要求“根据这三层参考图,生成完整的房屋结构图。原比例。”

看看最后效果:

整体三层楼,每个楼的数值和布局都完好的拼凑在一起,展现豆包Seedream 4.0了强大的场景重构能力。

最后看一下对于动漫的续写和绘画,上传一张女孩停下自行车看小猫的图片。

输入根据这个图片,续画一下这个女孩骑车走向后面的树林,比例 3:4。

我们发现豆包重新绘画了骑车女孩的背影,以及把后面的背景换成树林,把原图背景被改变了,有些偏离了题意可能没有深度理解“续画”的意思。

 

02

豆包Seedream 4.0正在刷新AI设计新方向

 

总体来说,这次豆包Seedream 4.0给我很大的惊喜,如果只是单纯被国产NanoBanana的名号吸引,那可能真的就错过了太多好玩的功能。

即使在一些人物的细节和服装还有要求理解上的精准度上有些欠缺,不过这恰恰也是未来努力的方向。并且在这次体验中发现每次响应要求的速度很快,而且生成的图片画质高,在多模态理解能力上还有推断能力,主体的一致性在不断进步。

在操作上也没有什么门槛,只要表明具体要求,豆包基本上都能理解。Seedream 4.0 模型已经在豆包、即梦上线,并通过火山引擎开放给企业客户进行体验。

豆包4.0也正在成为一个在不论是单图参考还是多图融合基于在语言图片生成输出的一一站式创作平台,不断提升创作的自由度。

不仅如此,从豆包Seedream4.0的提升上也不难发现,豆包在不断的听取用户真实的声音,在大模型设计这个行业里做真正的产品,不断缩小国产AI和国外大厂的差距。

但是只要身处AI设计行业的竞争中,不断的进行技术迭代升级,不断的贴合真正的需求才能站稳脚跟。可能这就是豆包的初心,用技术激发更多的设计潜力,让普通人也能完成属于自己的创作灵感,这也是技术普惠的意义。

陀螺科技现已开放专栏入驻,详情请见入驻指南: https://www.tuoluo.cn/article/detail-27547.html

AI大模型工场专栏: https://www.tuoluo.cn/columns/author1911862/

本文网址: https://www.tuoluo.cn/article/detail-10125313.html

免责声明:
1、本文版权归原作者所有,仅代表作者本人观点,不代表陀螺科技观点或立场。
2、如发现文章、图片等侵权行为,侵权责任将由作者本人承担。

相关文章