AI“照片”,到底多真才算真

360影视 日韩动漫 2025-04-24 15:20 3

摘要:一幅近乎完美的画面闯入我的视线:北京标志性矮板楼的窗扇外,绿意盎然的树枝上,两只喜鹊相对,窗框充当了这幅美景的画框。它构图精妙、色彩和谐,超出了一张社交网络上的生活分享类图片的普遍水准。作者声称这一画面是在自家窗外“偶然拍到”。

几张AI生成的“无心快照”

中青报·中青网记者 曲俊燕 写文

4月,正是春和景明的时节,记录大好春光的照片在社交网络上更迭不绝。

一幅近乎完美的画面闯入我的视线:北京标志性矮板楼的窗扇外,绿意盎然的树枝上,两只喜鹊相对,窗框充当了这幅美景的画框。它构图精妙、色彩和谐,超出了一张社交网络上的生活分享类图片的普遍水准。作者声称这一画面是在自家窗外“偶然拍到”。

双击,点赞。接着滑向评论区,清一色的感叹和赞誉。我试图在评论区发现更有趣的信息,直到看到这样一组对话:“美得像AI一样。” “就是AI。”

脑中顿时警铃大作,我急忙再次审视那幅画面:窗户把手出现在了不可能的位置;背景中的楼房虽像北京的“老破小”,房顶却是从未见过的样式。

也许算法猜透了我对美好春景的偏好,将这张“照片”纳入我的信息流;也许我太愿意相信这世界上有抓拍能力出众的摄影师……总之,在点赞的0.5秒里,我上当了。跟我一起被骗的,还有点赞的那1万多人。

隔天再看那张“照片”,它的AI感忽然变得极易辨认。但过万的点赞数,评论区一片倒的叫好声,似乎成了它的某种背书,让人不加思考地轻信。

高度疑似AI生成的“喜鹊图”。图片来源:社交媒体截图

自从图像世界进入AI时代,作为图片编辑,我始终保持着警惕。以为阅图无数,却未曾想,当一张随机的AI图迎合了我某个时刻的心理需求时,我也有可能被欺骗。

这件小事让我不得不思考,人们为什么执着于将AI图片做得越来越真实?

多数情况下,对真实的追求指向一定的目的性。例如,在上述“喜鹊图”事件中,经过对该博主主页内容的考察可以发现,通过生成符合大众预期的AI美景图,同时筛选评论,制造一种图片由本人亲自拍摄的假象,其目的是想获取流量和关注。

灾难事件是我们更熟悉的AI图应用场景。2022年重庆北碚山火时冲锋陷阵的摩托车队,2023年土耳其大地震时抱着小孩的消防员,许多类似的灾难事件都成了AI混淆视听的重灾区。发图者通过欺骗性的图像,以博眼球获取心理满足,与谣言的传播心理类似。

AI图像对摄影的模仿,让人联想到绘画流派中的“照相写实主义”(photorealism)。照相写实主义流行于20世纪六七十年代的欧美国家,以相机摄影图像为蓝本,追求画面的客观真实再现,代表画家有查克·克洛斯(Chuck Close)、奥黛丽·弗拉克(Audrey Flack)、理查德·埃斯特斯(Richard Estes)等。20世纪90年代,随着数字成像技术的进步,图像分辨率提高,这一注重记录平凡现实世界的艺术风格再度流行起来。如今,最拙劣的AI图也能大致达到照相写实主义画作的逼真度。

广场(The Plaza),1995。理查德·埃斯特斯(Richard Estes)作品。其画作基于多张合成的原始照片。图片来源:madmuseum.org

玛丽莲·虚空 [Marilyn (Vanitas)],1977。奥黛丽·弗拉克(Audrey Flack)作品。图片来源:艺术家个人网站

但照相写实主义终究只是一种美学风格,很难真正模仿摄影的呈现效果。无论是照相写实主义绘画,还是后来的CG游戏、电影特效等模拟现实的画面,其真实感都在人们可辨认的范围内。如今,AI生成的照片级图像超越了这一水准。某种程度上,人们对AI的逼真度抱有期待,有一种“我倒要看看能有多真”的不屑一顾。一旦AI真的做到了,人又会产生抗拒。

最近,社交媒体上兴起让AI生成“无心快照”(careless snapshot)的流行趋势,侧面验证了这种心理。在生图指令中,除了描述画面外,加入“极其平庸”“毫无构图美感”“画面缺少主题”“动态模糊”“真实而混乱”等词汇进行强调,可以生成一张类似误触手机而拍错的照片。这一次,AI的能力令人瞠目结舌,因为生成的图像太像那种人类拍完就删掉的废片,有的甚至还模仿了手指挡住一部分镜头的效果。因为模糊,细节更加不可辨认,也就更难找到把柄。

惊讶背后,还是有人发现了一些局限性。例如,用ChatGPT-4o生成的“车停在路边”这一画面,被指出图中露出的车辆款式和颜色总是相似,道牙石和石板路的样式一看就是来自欧美国家等等。有网友加入中国城市的关键词进行这一风格的尝试,略显模糊的画面效果,乍一看氛围确实很像我们都曾走过的城市街道,但当我们拿着“显微镜”观察,会发现车牌的颜色不对,楼的外立面出现不符合建筑逻辑的线条,广告招牌上的汉字也不像真字。

ChatGPT-4o生成的“车停在路边”的画面。指令关键词包括“极其平庸”“无明确主体和构图”“像从兜里掏出手机时不小心拍到的”等。

更以假乱真的,是一些模糊的自拍照。画面的生活感十足,仿佛就是人没拿稳手机产生的真实虚焦效果。如果是在自媒体吸粉、网络约会、亲友对话等场景中,这样的自拍完全有可能蒙混过关。

如果这些照片不被作为单独的帖子发出来,只是流落在任意的网络空间中,可能会骗过大多数人的眼睛。有网友将一张AI生成的“无心快照”反喂给AI,让其辨别图片是否由AI生成,这次,连AI自己都没认出来。另一方面,这一尝试的技术道德问题也令人“细思恐极”:通常,拍错的废片是很少被发到网上的,既然数据样本十分有限,那么,AI是如何做到如此逼真的?

如今,已经有很多手段可以让AI照片真一点、再真一点。普通用户最容易做到的,就是在文字指令上下功夫。据PetaPixel报道,4月初,AI生图工具Midjourney V7发布后,有网友尝试在指令中加入照片文件名后缀,如一个典型的佳能相机文件名“IMG_7249.CR2”。无需输入其他文字,Midjourney就会生成随机画面,如果加入详细的画面描述,用户就会得到一张逼真的“照片”。

同理,如果我们提供胶片相机和胶卷型号的名称,更具体的修图数值,或是关于角度、光线、画幅等的摄影修辞,就将为生成的“照片”加入更多难以甄别的风格滤镜。显然,在目前的技术模式下,用AI生成假照片的能力与用户的文字表达能力息息相关,也需要对摄影知识有所了解。

AI图像的“假”,似乎也不是那么绝对。挪威奥斯陆大学教授丽芙·豪斯肯(Liv Hausken)在2024年的一篇论文中分析了“视觉虚假信息时代的人工智能描绘”。她认为,人们常常忽略了摄影也有主观意识和视觉修辞,而简单粗暴地将AI生成图像定义为“假图像”,这种针对AI的危机导向型讨论不利于艺术、新闻业,也不利于摄影。换言之,人们对相机摄影和AI图像真实标准的认知是存在“双标”的,即对传统相机摄影更信任,对AI这一“无中生有”的新技术更苛刻。摄影虽然是相机对真实光线的物理记录,但仍可以通过导演、裁剪、修图等方式来操控,不是绝对真实的图像。一张重度PS的照片,和一张完全符合现实规律的AI图像,如何评判谁更真呢?这是一场新旧技术语言之间的交战。

仔细想来,人类依赖写实照片的历史并没有多久。尤其是在近几十年后期修图、滤镜、美颜技术的发展中,我们已然对经过修饰的真实习以为常。我们质疑AI图像,矛盾的核心,或许就在于AI不经过对现实的物理记录这一特点。再失真的美颜,也有照片作为底本,而AI通过数据建模得到的人脸,就是“恐怖谷”。

也许对AI图像的真与伪的讨论,需要建立在其不同功能和应用意图之上。我们持续制造如此逼真的AI图像,最直观的目的,就是探索技术进步的边界,看看AI究竟可以多么趋近人类的观看方式。在这个过程中,人们也能够享受创造的乐趣,用逼真的形象搭配超现实的画面,拓宽自我表达的路径,为人生添加更多想象中的可能性。但在网络社交、新闻信息获取等场景下,我们仍需在AI图像的包围中建立对真实的判断。只是日常的随机一瞥,社交媒体上的轻松浏览,也不要放弃抵抗具有明显欺骗意图的AI图像。

“有图有真相”的时代很短暂,且早已过去,如今的网络图像世界已然是传统图像与AI图像的杂糅体。说到底,我们需要的不仅是辨别AI图像的能力,更是在纷繁复杂的信息中重建真实的能力。至少在当下,社交媒体已成为主要信息来源、AI图像技术刚起步就频繁地被滥用的背景下,我们对AI图像“双标”一点,或许也不为过。

这些识别AI图像的建议,也许可以作为一份参考:

参考资料:

https://www.tandfonline.com/doi/full/10.1080/20004214.2024.2340787#abstract

来源:朋磊在努力vlog

相关推荐