以假亂真的AI生成式圖片,AI自己分辨不出來了。
這張馬斯克和機(jī)器人女友的照片,5個(gè)鑒別器里有2個(gè)都覺得是真的:
還有這張人類和3米巨人的合照,居然5個(gè)鑒別器一致判斷為真:
(資料圖片)
啊這,AI鑒別器似乎不太靠譜的亞子。
這就是《紐約時(shí)報(bào)》最近做的一項(xiàng)測試,他們找來了市面上五個(gè)常見的AI鑒別器,分別喂給它們100多張照片做測試。
結(jié)果發(fā)現(xiàn),AI鑒別器不僅會(huì)把AI照片錯(cuò)認(rèn)成真的,也會(huì)把真實(shí)照片劃定為AI生成的。
而且不同鑒別器之間的水平差距也不小。
具體表現(xiàn)如何?一起來看
加點(diǎn)顆粒(Grain)就能騙過鑒別器
在這項(xiàng)測試中一共使用了5個(gè)AI鑒別器,分別是:
Umm-maybeIlluminartyA.I or NotHiveSensity
測試的內(nèi)容包括AI和人類創(chuàng)作的圖片,分別喂給每個(gè)鑒別器,看它們會(huì)怎樣判斷。
使用的AI創(chuàng)作工具包括Midjourney、Stable Diffusion、Dall-e等。
《紐約時(shí)報(bào)》主要展示了這樣幾個(gè)例子。包含5張AI創(chuàng)作的圖片,以及2張真人拍的照片。
從統(tǒng)計(jì)結(jié)果來看,五個(gè)鑒別器中只有Hive全部判斷正確。
Umm-maybe的表現(xiàn)最差,只判斷對了兩張圖。
舉例來看,這張照片是AI生成的,聽說還在2月的一場攝影比賽中拿下大獎(jiǎng),這道題就難倒了大部分鑒別器。
但這張純AI生成的照片,就沒有逃過大部分鑒別器的法眼。
對于人類創(chuàng)作的照片,AI鑒別器的正確率比較高,兩張照片都只有Umm-maybe鑒別器判斷錯(cuò)誤。
此外他們還專門測試了藝術(shù)畫,發(fā)現(xiàn)大部分AI鑒別器能判斷出這是真人畫的。
對比另一幅AI創(chuàng)作的,同樣也是四個(gè)鑒別器判斷正確。
(Umm-maybe啊……是真的不太行)
值得一提的是,如果對AI圖像進(jìn)行一些加工處理,AI鑒別器會(huì)失效。
比如這張Nike男的照片,一開始有4個(gè)鑒別器判斷它是AI生成的。
但如果給圖片加一些顆粒,AI鑒別器就會(huì)將這張圖片的AI含量從99%,判斷為僅有3.3%。
最后,我們也測試了一些能上手實(shí)測的鑒別器(Umm-maybe、Illuminarty、A.I or Not)。
結(jié)果顯示,對于“馬斯克在蘇聯(lián)”這張圖,Umm-maybe覺得它有85%的概率是人類創(chuàng)作的。
Illuminarty覺得它是AI創(chuàng)作的概率僅有5.4%。
只有A.I or Not確定了它是AI生成的。
AI鑒別的判斷標(biāo)準(zhǔn)是啥?那么AI到底是怎么鑒別真?zhèn)蔚模?/p>
普遍來說,它們和人類的判斷標(biāo)準(zhǔn)不太一樣,人類一般以圖像內(nèi)容的合理性為依據(jù),而AI更多是從圖像的參數(shù)入手,比如像素的排列方式、清晰度、對比度等。
所以這就解釋了開頭那張巨人照片,為啥所有鑒別器都覺得很真。
在AI畫畫大火一年多以后,如今市面上已經(jīng)出現(xiàn)了非常多鑒別器。
有的就是直接放在Hugging Face上供大家免費(fèi)使用,有的則是已經(jīng)成立公司,只提供API接口形式。
比如Hive就是一家提供商業(yè)解決方案的公司,從如上的測試結(jié)果可以看到,Hive的表現(xiàn)效果也是最好的,幾乎都能判斷正確。
而在這之前他們的主要業(yè)務(wù)是為平臺網(wǎng)站提供數(shù)據(jù)審核服務(wù),圖像視頻文字都支持,服務(wù)的平臺有Reddit、Quora等。
關(guān)鍵詞:

營業(yè)執(zhí)照公示信息