N新京报 央视新闻
上观新闻
中国艺人“讲”流利英文、外国人“说”地道中文……近日,这类AI生成的视频屡屡刷屏。不少网友感叹:“嘴型、手势都对得上,加上动作和语速配合,让人信以为真。”一方面,AI换脸及换声技术日渐成熟,有助于提高工作效率,但另一方面,也有不法分子利用AI诈骗。此外,用AI技术为他人更换声音、做“翻译”并发布视频,还可能涉嫌侵权。如何对AI技术加强监管?
不仅能模仿原声、腔调
甚至口型也对得上
“差点以为相声演员要去外国演出,特地加练了外语呢。”近日一段郭德纲、于谦用外语说相声的视频在网上热传,该视频实际由AI合成,不仅能模仿演员原声、腔调,甚至口型也对得上,让不少观众觉得惊讶。
还有人用AI模拟美国歌手泰勒·斯威夫特、演员艾玛·沃森,以及特朗普、马斯克等外国名人说地道的中文,中国演员蔡明说流利英文的短视频发布在网上,语种切换后,音色和讲母语时的音色类似,甚至连口型都能对上。
这一系列视频的火爆首先来源于B站UP主“johnhuu”的视频《这才是没有译制片腔调的翻译!》,该视频发布于10月17日,截至11月3日已有254.5万的播放量。后来被各类短视频账号广泛引用的“憨豆先生讲中文”“蔡明讲英文”等视频正是来源于该视频。
在这一视频中,johnhuu表示,要达到此类效果必须同时符合三个条件:“第一,地道的口语翻译;第二,克隆说话者的声音;第三,把嘴型换了。”
而实际上,上述三个条件均可以通过AI技术实现。
而对于克隆说话者的声音,今年上半年AI孙燕姿爆火时就早已有成熟的技术路径:创造出AI孙燕姿的AI音色替换技术,其来源为so-vits-svc模型,一款由中国歌声合成爱好者Rcell开发的AI语音转换项目,其技术原理是使用孙燕姿的声音“替换”其他歌手的干声,达到以假乱真的效果。
在口型替换方面,早在2015年《功夫熊猫3》引入中国时,该片的主创团队就透露,该片的中文版本按照中文台词,给每个角色都重新做了口型和表情,“所以,观众会觉得阿宝本来说的就是中文。”2019年,包括斯坦福大学、普林斯顿大学在内的多个研究团队也推出了能够编辑头部特写对话视频的机器算法,该算法会从其他视频中寻找人物讲话时的嘴部动作,生成新的视频。
AI技术是把“双刃剑”
近年来,AI技术被广泛应用于短视频的二次创作,可以说,AI技术是把“双刃剑”。
一方面,AI换脸及换声技术对于工作效率的提高具有非常强的作用。清华大学新闻与传播学院教授司若举例说,AI换脸及换声技术让已故的演员、历史人物可以通过换脸技术重现在屏幕上,在不同国家的语言转译上也可以通过AI的换声技术进行实时转译。
另一方面,近年来,有不法分子为了牟利,利用AI技术进行诈骗。比如利用AI换脸冒充熟人诈骗,甚至将“魔爪”伸向儿童,或者制作发布假新闻混淆视听、赚取流量等。
值得警惕的是,AI换声带来的风险距普通人的生活并不遥远,记者发现,当前已发生了多起由AI换脸换声导致的诈骗案件。
今年9月,徐州警方公布一则AI换声诈骗案件细节:高中生晶晶突然收到“好友”的转账求助,由于担心被骗,晶晶要求对方发了一段语音,在确认是她熟悉的高中同学后,晶晶通过QQ转给对方2000元,但收到钱后,对方便消失了,随后晶晶才反应过来自己被骗。
多地警方已对AI诈骗常用手段进行揭秘,其中就有“声音合成”方面的AI深度造假:骗子通过骚扰电话录音等来提取某人声音,获取素材后进行声音合成,从而可以用伪造的声音骗过对方。
10月13日,国家金融监督管理总局在《关于警惕利用AI新型技术实施诈骗的风险提示》中指出,利用AI新型技术实施诈骗主要有“拟声”“换脸”两种手段,即通过模拟他人声音或形象骗取信任,进而诈骗钱财。国家金融监督管理总局提醒广大金融消费者:第一,网络渠道“眼见”不一定为实;第二,转账汇款务必核验对方身份;第三,保护好照片、声音等个人信息。
AI换脸、AI换声
有哪些法律风险
福建格一律师事务所合伙人律师曾明泉告诉记者,这一类用AI合成的方式去生成名人、影星或相声演员说外语的视频,与早前流行的“AI换脸”涉及的法律问题相差不大,主要还是人格权的问题。“如果这种声源获得明星个人的许可,那不存在侵犯其声音权的问题,如果没有获得授权,这种近乎一致的声音,大概率侵犯声音权、肖像权,而且如果合成声音本身内容带有歪曲、诋毁等信息,还可能侵犯名誉权以及他人的财产权。”
北京岳成律师事务所高级合伙人岳屾山律师表示,用AI技术为他人更换声音、做“翻译”并发布视频,可能涉嫌侵权,主要有三个方面:
一是著作权,例如相声、小品等都属于《中华人民共和国著作权法》保护的“作品”。网友用AI软件将相声、小品等“翻译”成其他语言,需经过著作权人授权,否则就存在侵权问题。
二是肖像权,根据《中华人民共和国民法典》,任何组织或者个人不得以丑化、污损,或者利用信息技术手段伪造等方式侵害他人的肖像权。未经肖像权人同意,不得制作、使用、公开肖像权人的肖像,但是法律另有规定的除外。网友用他人形象制作视频,并在网站发布,需要取得肖像权人的同意,否则涉嫌侵权。
三是声音权,根据《中华人民共和国民法典》规定,对自然人声音的保护,参照适用肖像权保护的有关规定。也就是说,需要取得声音权人的同意,才能够使用他人的声音。
岳屾山律师强调,技术滥用,可能会侵犯他人权益,“AI技术本身不是问题,关键是我们要怎么用它。”
□声音
如何对AI技术加强监管?
AI技术发展,需要多层面约束规范——
在源头端,需要进一步加强公民个人信息保护。专家建议,加强公民信息尤其是生物特征等隐私信息的技术、司法保护力度。
在技术层面,数字水印鉴伪等技术有待进一步普及利用。比如AI生成的视频需带有不可消除的“AI生成”水印字样。
在法律制度层面,进一步完善人工智能等领域相关法律法规。今年8月15日,《生成式人工智能服务管理暂行办法》正式施行。《办法》规定,提供和使用生成式人工智能服务,应当尊重他人合法权益,不得危害他人身心健康,不得侵害他人肖像权、名誉权、荣誉权、隐私权和个人信息权益。
中国科学技术大学公共事务学院、网络空间安全学院教授左晓栋表示,总体而言,生成式人工智能仍处于发展的初期阶段,风险没有完全暴露,应用前景难以估量,所以应当采取包容审慎的态度,坚持发展和安全并重、促进创新和依法治理相结合,要采取有效措施鼓励生成式人工智能创新发展。
据了解,目前我国人工智能产业蓬勃发展,核心产业规模达到5000亿元,企业数量超过4300家。随着各项措施规范出台,我们期待未来人工智能发展更加健康规范,从多方面助力人们的工作和生活。