机器可以利用人工智能创造出看起来或听起来非常真实的照片或语音记录。波鸿鲁尔大学Horst Görtz信息技术安全研究所的Joel Frank和Lea Schönherr对如何将这种人工生成的数据(深度伪造数据)与真实数据区分开来很感兴趣,他们在神经信息处理系统会议上介绍了他们的成果。
作为第一步,Joel Frank和Lea Schönherr汇编了一个大型数据集,其中包括大约118000个人工生成的语音记录,总共大约196小时的英语和日语材料。
研究员说:以前没有这样的音频深度伪造的数据集,但为了改进检测虚假音频的方法,研究员需要所有这些材料。为了确保数据集尽可能的多样化,该团队在生成音频片段时使用了六种不同的人工智能算法。
然后,研究人员将人造音频与真实对话的录音进行了比较。他们将这些文件绘制成频谱图,让频率分布可视化。比较结果显示,真假文件之间的高频存在着微妙的差异。
基于这些发现,Frank和Schönherr开发了能够区分深层造假对话和真实讲话的算法。这些算法是一个起点,可供其他研究人员开发新的检测方法。
前瞻经济学人APP资讯组
本文来源前瞻网,转载请注明来源。本文内容仅代表作者个人观点,本站只提供参考并不构成任何投资及应用建议。(若存在内容、版权或其它问题,请联系)