“香蕉”剛火,“種子”又來。國際知名評測機(jī)構(gòu)Artificial Analysis剛發(fā)布消息稱,字節(jié)跳動Seedream 4.0已登頂文生圖及圖像編輯排行榜榜首,在兩個領(lǐng)域都超越了谷歌的Gemini 2.5 Flash(Nano-Banana)。
Seedream 4.0是字節(jié)跳動最新發(fā)布的豆包圖像創(chuàng)作模型。該模型集成了文生圖、圖像編輯、多圖融合、組圖生成等多種能力,最高支持4K分辨率圖像生成,已在豆包App、即夢AI、扣子等產(chǎn)品上線,并通過火山引擎開放給企業(yè)客戶。
Seedream 4.0具備多圖輸出輸出、超強(qiáng)主體一致性和直出4K高清圖。其中,它是全球首個支持4K高清直出的多模態(tài)生圖工具。Nano banana出圈的3D手辦功能,Seedream4.0的表現(xiàn)也非常好。
在對中文、日文的識別方面,Seedream 4.0的使用體感大幅度領(lǐng)先于Nano banana。比如一位日本用戶用它生成了一個茄子的手繪風(fēng)格料理食圖譜,畫風(fēng)非常細(xì)膩可愛。
日本用戶用Seedream4.0生成圖。
上海溫哥華電影學(xué)院3D動畫與視覺特效專業(yè)系主任徐一然馬上跟進(jìn)使用了Seedream 4.0,給出的評價是超越Nano banana。“理解力和還原度都大大增強(qiáng)了,能夠比較準(zhǔn)確地還原原畫細(xì)節(jié),在想象力上也有針對性地提高。”他說。他認(rèn)為這這是實用性非常強(qiáng)的工具,對于是否會對自己產(chǎn)生威脅,他說有擔(dān)心,但其實它對美術(shù)特別是設(shè)計的重要性沒有減少。
徐一然將自己設(shè)計的圖畫轉(zhuǎn)化為手辦。
除了多圖輸入創(chuàng)作,即將幾張圖有邏輯地合并在一張圖上,Seedream 4.0還支持多圖連續(xù)輸出。B站UP主檀東東Tango給AI兩個角色形象圖,要求它一次性生成8個分鏡圖,然后再基于分鏡直接圖生視頻。結(jié)果顯示,視頻的一致性非常好。那么,以后只要有人寫文本,用AI配音+AI動畫,AI短劇將會大量涌現(xiàn)。
一張線稿可以轉(zhuǎn)化為一段視頻。徐一然提供
你想和自己的偶像來一段視頻也不在話下,只要輸入你和偶像的照片,一鍵即可搞定。
檀東東Tango又讓AI生成一張圖一的劉亦菲打著圖二的傘給圖三的美國隊長遮雨的圖,結(jié)果顯示,Seedream的效果顯著好于Nano banana。具體表現(xiàn)為衣服色彩上,Seedream更還原,場景表現(xiàn)上,Seedream無論是雨滴打在傘上還是在盾牌上的細(xì)節(jié)都惟妙惟肖。
B站UP主檀東東Tango視頻截圖。
據(jù)悉,4.0相較于3.0計算效率提升了10倍以上,4.0支持秒級生成2K圖片,也就是說用幾毛錢就能搞定一張高清商用圖。目前看來,圖像、視頻、音頻領(lǐng)域的紅利才剛開始激活。