文字能力超越换脸技术

自DeepFake技术问世以来，它常常被视为一种潜在的“坏AI”。无论是轰动一时的“加朵换头色情片”，还是利用DeepFake变声进行的银行转账诈骗，围绕DeepFake的讨论似乎总是与负面事件相伴。

然而，麻省理工学院（MIT）的最新研究指出，伪造文本信息的破坏性远超伪造的图像或视频。这一发现与传播领域的传统观点相悖，以往学界普遍认为，当同一内容以视频形式呈现时，人们更容易被假消息所欺骗。

DeepFake仍然显得“年轻”

随着超现实视觉效果技术的不断进步，公众对于政治演讲的DeepFake视频与真实视频之间的视觉差异日渐担忧。然而，关于视听信息如何影响人们对假消息敏感性的实证研究依然稀缺。最近，MIT媒体实验室的科学家对5727名参与者展示了16段真实的政治演讲和16段经过DeepFake处理的演讲片段，声音片段以文本、视频和音频多种形式呈现，例如带字幕的视频。

受试者被告知其中一半的内容是伪造的，并被询问他们认为哪些片段是假的。在仅展示文本的情况下，受访者识别谎言的能力仅比随机猜测稍好。当提供带字幕的视频时，受访者的判断更加准确，而在同时显示视频和音频时，表现最佳。这表明，参与者在观看视频或听音频时，比阅读文本记录时更能识别出事件的真实性。

研究还显示，普通人有时能够察觉到DeepFake技术所带来的视觉失真效果。论文作者解释称，受试者的判断更多依赖于内容表达的方式，而非内容本身。受试者在观看有声视频时的判断率高于无声视频，而无声视频的判断率又高于文字记录。这是因为视频和音频不仅包含内容本身，还包括说话者的微表情、动作和语音模式等细微差异。

如果旁观者无法观察到这些细微差别，仅凭书面文字来判断演讲的真实性，其准确率往往只能与抛硬币的结果持平。论文作者指出：“伪造的政治演讲视频比伪造的文字记录更容易被识别，这一发现强调了重新唤起人们‘眼见为实’这一格言的重要性。”

然而，这项研究也存在局限。研究者生成的DeepFake材料并未达到极高的真实度，他们警告称：“真正危险的伪造视频，可能并不是普通算法生成的DeepFake，而是经过精心制作、极具迷惑性的单一视频。”

在当前的局势中，这一警告显得尤为重要。公众对于在东欧冲突中，某一方可能制作出另一方总统宣布投降的DeepFake视频充满疑虑。尽管这些担忧可以理解，但目前流传的假消息中，几乎没有应用DeepFake技术。正如本研究所揭示的，DeepFake可能影响公众事件的结果，但彻底的谎言和简单的剪辑编辑则是传播假消息的更为常见形式。

当然，这并不意味着DeepFake没有潜在的危险，只是更原始的欺骗技术可能构成更大的威胁。

补充实验

与不同演讲和模式条件下的准确性差异相比，受试者的确信程度变化相对较小。在文字记录中，受试者的平均确信度为81%。在视频和音频呈现的演讲中，确信度分别提高了6%和9%。如果所有内容同时呈现，确信度则提升12%。这表明，当受试者通过视频和音频接收到更多信息时，他们的判断准确性和确信度都有所提高。

不过，研究人员发现，字幕似乎对结果的影响不明显。受试者的反应时间中位数为24秒，比视频的平均长度多出3秒。无声的、有字幕的视频反应时间中位数为31秒，略高于其他模式条件。在所有7种模式条件下，受试者对伪造内容的反应时间普遍短于真实内容。其中，文字、视频和音频的反应时间分别为3.8秒、2.5秒和3.7秒。

此外，研究人员发现，受试者在识别文字记录的真实性时，偏差较大。下图a显示，受试者对文字稿的准确度通常低于无声字幕视频；而c则显示受试者对有声视频的准确率始终高于无声字幕视频。相反，b则揭示了受试者在有字幕和无字幕情况下的表现差异。

总体来看，信息载体确实会影响辨别准确性。受试者在判断有音频的视频时的准确率高于无声视频，而无声视频的准确率又高于文本记录。同时，研究发现，受试者往往更多依赖于说话者的语言风格、微表情、动作等视听信息，而非内容本身来进行判断。

这种在判断伪造和非伪造演讲时的难度不对称，加剧了“说谎者的红利”，即消息被伪造的普遍可能性，会让公众对于所有消息产生怀疑，从而使撒谎者能够逃避对真实负面新闻的责任。

研究还发现，当演讲与公众对政治家的固有印象不符时，参与者对视觉线索的依赖会降低。这种情况被研究者称为“期望违反启发式”。同时，研究发现，反思性推理会影响受试者对于视觉信息的依赖程度：受试者在“认知反思测试”中的低分数与对视觉线索的依赖不足、对内容的过度依赖呈正相关。换句话说，思维较为简单的人更容易单纯相信政客的演讲内容，而忽视其表情与动作。

如何辨别

MIT的研究团队从100,000个DeepFake视频和19,154个公开的Kaggle竞赛中，训练了一系列神经网络来检测DeepFake。根据机器学习模型的表现，研究人员筛选出了3000个最容易被误判的视频。这些视频不仅对机器学习模型难以辨别，对许多人来说也很难判断真假。

研究人员认为，增加接触被DeepFake编辑视频的机会可以提升人们的判断力。因此，他们建立了“Detect FAkes”网站，公开展示了数千个高质量的DeepFake和真实视频。

虽然无法仅依靠单一线索来辨别真假，但可以关注以下8个要点：

注意面部：DeepFake几乎都是面部改造。观察脸颊和额头的皮肤是否过于光滑或皱纹过多？皮肤的老化程度是否与头发和眼睛的老化程度一致？DeepFake在某些方面常常显得不协调。
注意眼睛和眉毛：阴影是否自然？DeepFake通常难以真实再现物理现象。
注意眼镜：眩光是否正常，移动时眩光的角度是否变化？DeepFake在物理表现上常常存在弱点。
注意面部毛发：看起来是否真实？DeepFake可能会添加或去掉鬓角或胡须，但通常会显得不自然。
注意面部的痣：看起来是否真实？
注意眨眼：眨眼频率是否正常？
注意嘴唇的大小和颜色：是否与面部其他部分一致？

通过这些观察，可以提高识别DeepFake的能力。

[[[IMG_1]]]

[[[IMG_2]]]

[[[IMG_3]]]

ad

近期文章

互联网资讯 / 人工智能 · 2024年1月3日

文字能力超越换脸技术