
换脸前后视频对比(图源网络视频教程)

淘宝上搜索“换脸”会出现大量相关商品链接
N海都记者
梁展豪 文/图
近日,福州一企业负责人郭先生遇“AI换脸”诈骗,10分钟被骗走430万元。不久后,安徽警方也披露了一起类似案件,诈骗分子使用了一段9秒钟的视频,佯装“熟人”,导致何先生被诈骗245万。不仅如此,女装品牌SDEER的直播间及八马茶叶的直播间也出现了疑似换脸女明星的情况。
那么,AI换脸和拟声技术是怎么实现的?遇AI骗局又要如何防范?记者进行了一番调查了解。
调查
网购平台上 可轻易买到相关教程
在搜索平台及社交媒体上,充斥着各类“AI换脸”的教程,有的仅需一张照片就可以完成换脸操作。但是该类型的换脸存在一定的局限性,例如部分五官在替换后无法“动弹”,无法做到丰富的面部表情等,较容易发现破绽,PS痕迹明显。
而既然需要骗过认识的人,并且更加自然,一定需要更为真实的换脸技术,那是否有呢?答案是肯定的。
记者在淘宝上输入“换脸”后,便看到了多家正在售卖“技术”的店铺,店铺均表示可以提供电脑换脸软件及教程,还能传授如何实现直播变脸。下单后,记者收到了一个链接,里面包含了软件及视频教程。
“与许多照片换脸不同,这个软件的换脸效果可以做到无破绽,甚至用到商业影视上。比如有的明星被封杀了,公司需要换脸,用的软件就是这个。”点开一段名为“软件介绍”的视频,便能听到一名男子介绍软件的声音。据其介绍,该软件是通过训练模型的方式来完成换脸的,训练得越久越能达到以假乱真,观众无法辨别的程度,但相对的对电脑的硬件要求也较高。
不到20分钟 就完成一段换脸视频
经过一番了解,记者得知,该软件主要是通过训练机器学习人脸模型来完成换脸的。换脸前需要有替换及被替换的两个视频片段,视频里要包括脸的各个角度、各种表情以及确保面部充分光源。之后再将视频切换成一帧一帧图片,然后把脸部位置提取出来,用于训练。训练时还需要通过遮罩等形式,让系统仅采集五官信息,进行针对性的学习。
最后,可以对换好脸的模型进行微调,调整画面边缘的过渡效果及面部受光情况,就能得到一个逼真的换脸视频。
记者观看相关视频发现,演示者从头到尾仅花费了不足20分钟的时间,就完成了一段47秒的换脸视频,并且其还在视频中表示:“训练时间越长,脸部细节越明显越真实。”
声音也能“克隆” “虚拟人”可用于视频聊天或直播
脸部替换完成后,声音模拟又该如何实现呢?同样,记者也找寻到了“声音克隆”的教程。据了解,与脸部替换相同,声音模拟需要使用大量的声音素材来训练声音模型。
据教程发布者描述,其将孙燕姿100多首歌曲切成几千个片段,最终筛选出2000余个,共计6个多小时的素材。经过预处理,提出人声部分后,便可进行训练,训练完成后即可修改声音的音色。
在准备好视频及音频后,如何将一个“虚拟人”呈现出来呢?在此前记者购买的教程中,就包含了这么两个介绍视频——《直播换脸教程》及《在微信中的应用》。
记者点击该教程了解到,该技术需要在此前训练模型的基础上进行,通过人脸信息采集的方式,将摄像头里的人脸信息替换成模型的样子,输出到直播端口或是视频聊天窗口。
专家
AI换脸怎么防?
多渠道验证身份 比肉眼分辨可靠
“大家不用过分恐慌及妖魔化AI换脸。”网络安全服务企业奇安信的首席反诈骗专家裴智勇表示,以目前技术来看,想要盗取微信账号、劫持微信镜头并在实时视频聊天中运用AI实时换脸和变声技术,难度和成本都极高。“骗子通常都是用很低的成本博取很高的收益,不太可能花费高昂代价去批量寻找受害者。”
“没有经过训练的普通人想要用肉眼识别视频是否为AI合成,难度极高。如果换的脸部细节较差,骗子甚至不会给你详细判断的机会,几秒就挂断。”裴智勇认为,公众与其花费大量精力去分辨骗子发来视频的真假,不如在有怀疑时直接换一种渠道去验证对方身份,业内称为“双因子身份验证”。“比如好友视频聊天后要求转账,你就拨打对方电话号码再次确认;对方使用微信谈论交易,不妨用支付宝再一次验证。多渠道验证要比肉眼分辨视频容易得多,也可靠得多。”
5月24日,中国互联网协会发布公告,面对利用AI技术的新型骗局,广大公众需提高警惕。中国互联网协会表示,在AI时代,文字、声音、图像和视频都有可能是深度合成的。在转账汇款、资金往来这样的典型场景,要通过回拨对方手机号等额外通信方式来核实确认,不要仅凭单一沟通渠道未经核实就直接转账汇款。