原文來源:新智元
圖片來源:由無界 AI生成
Midjourney V6,正在緊急RLHF中。上線倒計(jì)時(shí),已經(jīng)開始!
今天早上,Midjourney V6開啟了第二次社區(qū)評(píng)價(jià)。用戶需要做標(biāo)注,標(biāo)注200張送1小時(shí)時(shí)長(zhǎng)。
網(wǎng)友們紛紛甩出神圖,圖片細(xì)節(jié)逼真,效果驚人:張張都是大片。
這次V6的出圖效果怎么評(píng)價(jià)呢,簡(jiǎn)單來說就是——圖像和照片之間的差別已經(jīng)消失。
果然,能超越昨天的Midjourney的,只有今天的Midjourney。
這些神圖再次證明:在AI生圖領(lǐng)域,目前沒有誰能撼動(dòng)Midjourney的地位。
要知道,Midjourney V5的發(fā)布,是在2023年3月,網(wǎng)友們已經(jīng)整整等待9個(gè)月了。
咱們啥時(shí)候能用?
好消息:Midjourney V6正在進(jìn)行最后一輪RLHF。風(fēng)格微調(diào)完成后,會(huì)趕在圣誕節(jié)前發(fā)布。
據(jù)官方消息,V6很可能在今明兩天就上線!
這個(gè)圣誕節(jié)禮物也太棒了。
這真不是真人?
龍媽的皮膚紋理、臉部肌肉走向,已經(jīng)非常接近電影的真實(shí)感。
經(jīng)過史詩級(jí)增強(qiáng)的皮膚質(zhì)感讓人驚嘆。
就說下面這些圖,哪張不像真人?
要不是人騎著這么大的貓,馬斯克出現(xiàn)在瓶子里,絕對(duì)看不出這是一張AI圖。
Cybertruck渲染圖也很逼真。
光影效果也是一絕,很難找到不自然的地方。
對(duì)光線和反射的處理,找不出破綻。
隨便出圖一張,就是電影大片的質(zhì)感。
圖中人物的血管、護(hù)臂的細(xì)節(jié)、皮膚的紋理,都自然得沒有AI感。
無論是Groot還是動(dòng)物,細(xì)節(jié)上都沒有失真。
貓咪、狗狗的毛發(fā)和胡須,效果都畫得太贊了。
Midjourney V6畫起食物來,也是無比逼真,相同的分辨率下,增加了許多細(xì)節(jié)。
圖中一切配色,都是按照梵高的《向日葵》。
畫起自然風(fēng)景,也很寫實(shí)。
V6的畫風(fēng)也進(jìn)一步擴(kuò)展了,國(guó)畫也畫得更好了。
網(wǎng)友:我真的害怕了
有網(wǎng)友表示,我是真的有點(diǎn)害怕Midjourney V6了。
得到下面這樣的圖,是用我以往的提示風(fēng)格就可以,還是必須學(xué)習(xí)一門新語言?
沒啥可說的,這就是real life。
有人說,我們從此再?zèng)]有理由為素材付費(fèi)了。
保真度和質(zhì)量都很棒,分辨率和DPI讓人印象深刻。
V6已經(jīng)把我們帶入了一個(gè)全新的領(lǐng)域,普通的消費(fèi)者,就可以做出專家級(jí)的內(nèi)容。
全新的提示結(jié)構(gòu)
作為AI生圖工具數(shù)一數(shù)二的神器,Midjourney之所以偶爾被DALL-E和Adobe Firefly的光芒蓋過,就是一個(gè)因?yàn)橐粋€(gè)致命的問題:無法很好地理解自然語言提示。
畢竟,要寫出專業(yè)prompt,還是有一定門檻的。
但現(xiàn)在,隨著V6的推出,狀況很可能被改變。
根據(jù)設(shè)計(jì)師「Tatiana Tsiguleva」的分析,Midjourney V6可以更精準(zhǔn)地理解用戶的提示指令,而這也意味著我們不再需要輸入那些奇怪的短語或單詞。
以下是一個(gè)基于典型語言框架設(shè)計(jì)的簡(jiǎn)單結(jié)構(gòu):
風(fēng)格
目的:為作品提供具體的審美或藝術(shù)風(fēng)格。
需要包含的細(xì)節(jié):偏好的風(fēng)格或歷史時(shí)期。
主題
目的:明確圖片的核心焦點(diǎn)。
需要包含的細(xì)節(jié):主要對(duì)象的特征,如人物、物體、動(dòng)物等,包括其外觀、顏色等。
環(huán)境
目的:營(yíng)造適合主題的環(huán)境或背景。
需要包含的細(xì)節(jié):地點(diǎn)(如室內(nèi)、戶外、虛構(gòu)場(chǎng)景),環(huán)境元素(比如自然景觀或城市景象),一天中的具體時(shí)間和天氣狀況。
構(gòu)圖
目的:規(guī)劃主題及其元素的展示方式和視角。
需要包含的細(xì)節(jié):觀看角度(如特寫、全景、鳥瞰),拍攝角度,以及特定的構(gòu)圖偏好。
光線
目的:營(yíng)造圖像的氛圍和視覺效果。
需要包含的細(xì)節(jié):光線類型(明亮、昏暗、自然光),所傳達(dá)的情緒(如歡快、神秘),以及氛圍效果。
額外信息
目的:豐富圖像的層次感和深度。
需要包含的細(xì)節(jié):次要元素、角色、動(dòng)物,以及它們與主要對(duì)象的關(guān)系或位置布局。
顯然,這種類似DALL-E 3的prompt方式,會(huì)讓V6變得更確定,可以讓我們更好地控制想要的圖像內(nèi)容。
接下來,就是搓手期待V6的正式上線了。
有網(wǎng)友表示,自己已經(jīng)準(zhǔn)備就緒。
不眠不休激動(dòng)等待中。
參考資料:
https://twitter.com/op7418/status/1737445886165451227
https://twitter.com/op7418/status/1737445353002344532
https://twitter.com/ciguleva/status/1737573077633085584
https://twitter.com/BeezyManzell/status/1737516209988604289
https://twitter.com/doganuraldesign/status/1737398934073385346
https://twitter.com/giffboake/status/1737533263671853462
https://twitter.com/ai_artworkgen/status/1737588573778432406
https://twitter.com/dnaijatechguy/status/1737617371454701950
https://twitter.com/Anima_Labs/status/1737592798390460567
https://twitter.com/PhotoGarrido/status/1737479363476525377