文字能力超越换脸技术
自DeepFake技术问世以来,它常常被视为一种潜在的“坏AI”。无论是轰动一时的“加朵换头色情片”,还是利用DeepFake变声进行的银行转账诈骗,围绕DeepFake的讨论似乎总是与负面事件相伴。
然而,麻省理工学院(MIT)的最新研究指出,伪造文本信息的破坏性远超伪造的图像或视频。这一发现与传播领域的传统观点相悖,以往学界普遍认为,当同一内容以视频形式呈现时,人们更容易被假消息所欺骗。
DeepFake仍然显得“年轻”
随着超现实视觉效果技术的不断进步,公众对于政治演讲的DeepFake视频与真实视频之间的视觉差异日渐担忧。然而,关于视听信息如何影响人们对假消息敏感性的实证研究依然稀缺。最近,MIT媒体实验室的科学家对5727名参与者展示了16段真实的政治演讲和16段经过DeepFake处理的演讲片段,声音片段以文本、视频和音频多种形式呈现,例如带字幕的视频。
受试者被告知其中一半的内容是伪造的,并被询问他们认为哪些片段是假的。在仅展示文本的情况下,受访者识别谎言的能力仅比随机猜测稍好。当提供带字幕的视频时,受访者的判断更加准确,而在同时显示视频和音频时,表现最佳。这表明,参与者在观看视频或听音频时,比阅读文本记录时更能识别出事件的真实性。
研究还显示,普通人有时能够察觉到DeepFake技术所带来的视觉失真效果。论文作者解释称,受试者的判断更多依赖于内容表达的方式,而非内容本身。受试者在观看有声视频时的判断率高于无声视频,而无声视频的判断率又高于文字记录。这是因为视频和音频不仅包含内容本身,还包括说话者的微表情、动作和语音模式等细微差异。
如果旁观者无法观察到这些细微差别,仅凭书面文字来判断演讲的真实性,其准确率往往只能与抛硬币的结果持平。论文作者指出:“伪造的政治演讲视频比伪造的文字记录更容易被识别,这一发现强调了重新唤起人们‘眼见为实’这一格言的重要性。”
然而,这项研究也存在局限。研究者生成的DeepFake材料并未达到极高的真实度,他们警告称:“真正危险的伪造视频,可能并不是普通算法生成的DeepFake,而是经过精心制作、极具迷惑性的单一视频。”
在当前的局势中,这一警告显得尤为重要。公众对于在东欧冲突中,某一方可能制作出另一方总统宣布投降的DeepFake视频充满疑虑。尽管这些担忧可以理解,但目前流传的假消息中,几乎没有应用DeepFake技术。正如本研究所揭示的,DeepFake可能影响公众事件的结果,但彻底的谎言和简单的剪辑编辑则是传播假消息的更为常见形式。
当然,这并不意味着DeepFake没有潜在的危险,只是更原始的欺骗技术可能构成更大的威胁。
补充实验
与不同演讲和模式条件下的准确性差异相比,受试者的确信程度变化相对较小。在文字记录中,受试者的平均确信度为81%。在视频和音频呈现的演讲中,确信度分别提高了6%和9%。如果所有内容同时呈现,确信度则提升12%。这表明,当受试者通过视频和音频接收到更多信息时,他们的判断准确性和确信度都有所提高。
不过,研究人员发现,字幕似乎对结果的影响不明显。受试者的反应时间中位数为24秒,比视频的平均长度多出3秒。无声的、有字幕的视频反应时间中位数为31秒,略高于其他模式条件。在所有7种模式条件下,受试者对伪造内容的反应时间普遍短于真实内容。其中,文字、视频和音频的反应时间分别为3.8秒、2.5秒和3.7秒。
此外,研究人员发现,受试者在识别文字记录的真实性时,偏差较大。下图a显示,受试者对文字稿的准确度通常低于无声字幕视频;而c则显示受试者对有声视频的准确率始终高于无声字幕视频。相反,b则揭示了受试者在有字幕和无字幕情况下的表现差异。
总体来看,信息载体确实会影响辨别准确性。受试者在判断有音频的视频时的准确率高于无声视频,而无声视频的准确率又高于文本记录。同时,研究发现,受试者往往更多依赖于说话者的语言风格、微表情、动作等视听信息,而非内容本身来进行判断。
这种在判断伪造和非伪造演讲时的难度不对称,加剧了“说谎者的红利”,即消息被伪造的普遍可能性,会让公众对于所有消息产生怀疑,从而使撒谎者能够逃避对真实负面新闻的责任。
研究还发现,当演讲与公众对政治家的固有印象不符时,参与者对视觉线索的依赖会降低。这种情况被研究者称为“期望违反启发式”。同时,研究发现,反思性推理会影响受试者对于视觉信息的依赖程度:受试者在“认知反思测试”中的低分数与对视觉线索的依赖不足、对内容的过度依赖呈正相关。换句话说,思维较为简单的人更容易单纯相信政客的演讲内容,而忽视其表情与动作。
如何辨别
MIT的研究团队从100,000个DeepFake视频和19,154个公开的Kaggle竞赛中,训练了一系列神经网络来检测DeepFake。根据机器学习模型的表现,研究人员筛选出了3000个最容易被误判的视频。这些视频不仅对机器学习模型难以辨别,对许多人来说也很难判断真假。
研究人员认为,增加接触被DeepFake编辑视频的机会可以提升人们的判断力。因此,他们建立了“Detect FAkes”网站,公开展示了数千个高质量的DeepFake和真实视频。
虽然无法仅依靠单一线索来辨别真假,但可以关注以下8个要点:
- 注意面部:DeepFake几乎都是面部改造。观察脸颊和额头的皮肤是否过于光滑或皱纹过多?皮肤的老化程度是否与头发和眼睛的老化程度一致?DeepFake在某些方面常常显得不协调。
- 注意眼睛和眉毛:阴影是否自然?DeepFake通常难以真实再现物理现象。
- 注意眼镜:眩光是否正常,移动时眩光的角度是否变化?DeepFake在物理表现上常常存在弱点。
- 注意面部毛发:看起来是否真实?DeepFake可能会添加或去掉鬓角或胡须,但通常会显得不自然。
- 注意面部的痣:看起来是否真实?
- 注意眨眼:眨眼频率是否正常?
- 注意嘴唇的大小和颜色:是否与面部其他部分一致?
通过这些观察,可以提高识别DeepFake的能力。
[[[IMG_1]]]
[[[IMG_2]]]
[[[IMG_3]]]
