加入收藏 | 设为首页 |

说说-换脸已不算事儿 能换整个身体的AI假造技能立刻就来了

海外新闻 时间: 浏览:159 次

在俄罗斯小说家维克多佩雷温(Victor Pelevin)的网络科幻小说《智人》(Homo Zapiens)中,名叫巴比伦塔塔斯基(Babylen Tatarsky)的诗人被大学老友招募,前往莫斯科担任广告撰稿人。凭仗其在文字方面的聪明天分,塔塔斯基敏捷爬上了公司高层,他在那里发现,其时有许多作业实际上都是虚拟仿照的成果。而跟着越来越杂乱的深休假造(Deepfake)运用呈现,让人不由觉得佩雷温的想象好像正在渐渐变成实际。

在深休假造范畴,或许研讨人员所谓的“组成媒体”范畴,大部分注意力都会集在或许对实际形成严重破坏的换脸以及其他深度学习算法带来的危害上,例如仿照或人的写作风格和声响。可是组成媒体技能的另一个分支正取得快速行进,即人体深休假造。

2018年8月,美国加州大学伯克利分校的研讨人员发布了名为《人人皆为舞王》(Everybody Dance Now)的论文和视频,展现了深度学习算法怎么将专业舞者的动作转移到业余爱好者身上的场景。虽然这种技能仍然处于前期阶段,但它标明机器学习研讨人员正在应对更困难的使命,即创立全身深休假造视频。

同样在2018年,由德国海德堡大学图画处理协作实验室(HCI)和科学核算跨学科中心(IWR)的核算机视觉教授比约恩奥默尔(Bj?rn Ommer)博士领导的研讨小组,宣布了一篇关于教授机器以传神形状烘托人类身体运动的论文。本年4月,日本人工智能(AI)公司Data Grid开发了一种AI运用,它能够主动生成不存在的人的全身模型,并能够将其运用到时髦和服装职业。

虽然很明显,全身深休假造技能具有风趣的商业运用潜力,如在深休假造舞蹈视频或体育和生物医学研讨等范畴,但在当今社会中,歹意运用事例越来越令人担忧。现在,全身深休假造技能还不能彻底捉弄人类的眼睛,但就像任何深度学习技能相同,它正渐渐取得行进。全身深休假造还需求多久就能变得与实际无法区别?这或许仅仅时刻问题。

组成整个人体

为了发明深休假造视频,核算机科学家需求运用生成性对立网络(GANS)。这是由两个神经网络组成的,分别是组成器或称为生成网络,以及检测器或称辨别网络,这些神经网络在精粹的反响回路中作业,以创立传神的组成图画和视频。组成器运用数据库创立图画,而后者从运用其他的数据库,确认组成器给出的图画是否精确和可信。

第一次歹意运用深休假造技能呈现在Reddit上,像斯嘉丽约翰逊(Scarlett Johansson)这样的女艺人的脸被换到色情艺人身上。Fast.AI说说-换脸已不算事儿 能换整个身体的AI假造技能立刻就来了公司的雷切尔托马斯(Rachel Thomas)标明,当时95%的深休假造旨在用组成色情行为图画打扰某些人。他说:“这些深休假造视频中,有些并不一定运用了十分杂乱的技能。可是,这种状况正逐渐发作改动。”

达特茅斯大学核算机科学系主席、专门研讨冲击视频假造的图画取证专家哈尼法里德(Hany Farid)指出,深休假造运用Zao说明晰这项技能在不到两年的时刻里开展的速度有多快。法里德说:“从Zao身上,我发现这种技能现已变得十分好,并且抹掉了许多人工痕迹,比方电影版别中的脸部闪耀问题。虽然状况正在改进,但将其大规模运转,下载给数百万人,仍然很难。这也正是深休假造技能老练的标志。”

海德堡大学的奥默尔教授领导着一个研讨和开发全身组成媒体的团队。与该范畴的大多数研讨人员相同,该团队的总体方针是了解图画,并教授机器怎么了解图画和视频。终究,他期望团队能够更好地了解人类是怎么了解图画的。

组成面部和整个身体的进程之间存在着关键性差异。奥默尔说,对人脸组成现已进行了许多研讨,这其间有几个原因:首要,任何数码相机或智能手机都有内置的面部检测技能,这项技能可用于浅笑检测等使命,或用于辨认观众正在看的人的身份。这样的用例能够发作收入,以支撑更多的研讨。可是,正如奥默尔所说,它们也导致了“很多的数据集拼装、数据收拾和获取面部图画,这些都是深度学习研讨的根底。”

其次,也是奥默尔更感兴趣的,虽然每个人的脸看起来都不同,但当把脸与整个人体进行比较时,它的改动或许更小。奥默尔解说称:“这便是为何对脸部的研讨现已到了瓶颈阶段的原因,与整个人体比较,脸部研讨现已十分透彻,但身体有更多的可变性,处理起来也更杂乱。假如你执政那个方向研讨,你会学到更多的东西。”

奥默尔不确认何时彻底组成的身体将具有他和研讨人员想要的质量。可是,从歹意深休假造技能的日益老练来看,奥默尔注意到,即便没有深度学习核算机视觉智能、AI或其他技能创立的虚伪图画或视频,人类十分简略遭到诈骗。美国众议院议长南希佩洛西(Nancy Pelosi)怠慢速度的视频让她看起来像是喝醉了酒。这段视频向奥默尔标明,这种简略歪曲的深休假造技能行将呈现,并或许会被某些人所运用。

奥默尔说:“可是,假如你想让它发作更大的吸引力,或许还需求几年的时刻,那时全身和其他深休假造技能将变得更廉价,更遍及。研讨社区自身现已朝着这个方向行进,他们需求为咱们看到的这种安稳行进担任,算法很简略取得,比方在Github上等等。所以,你能够从某些论文中找到能够下载的最新代码,然后在没有太多常识的状况下,运用它即可。”

改动事实真相

并不是每个人都能发明出深休假造职业的“重磅炸弹”。可是若给予更多的时刻,金钱将不再是约束核算资源的问题,软件的适用性也将变得更简略。法里德称,有了全身深休假造技能,歹意的创作者将能够运用深休假造技能的典型静态人物直接对着摄像头说话,指示方针去做他们永久不会去做的作业,或说他们不或许说的话。

跟着2017年深休假造技能的兴起,查询记者、佛兰芒广播公司驻外记者汤姆范德韦格(Tom Van De Weghe)开端研讨组成媒体。2018年夏天,他开端在斯坦福大学树立研讨奖学金,以研讨冲击歹意运用深休假造技能的办法。他说:“受要挟最大的不是大角色,而是像你、我、女记者这样的普通人,以及某种程度上的边际集体,他们或许成为或现已成为深休假造的受害者。”

两周前,荷兰新闻主播迪翁斯塔克斯(Dionne Stax)的相关视频被上传到某不合法网站并在互联网上发布,她的脸被“深休假造”到了一位色情女艺人的身体上。虽然该不合法网站敏捷删除了视频,但范德韦格标明,斯塔克斯的名誉现已遭到危害。

要想了解全身深休假造技能的作用,范德韦格提到了2018年CNN驻白宫首席记者吉姆阿科斯塔(Jim Acosta)的视频。在Infowars的修改保罗约瑟夫沃森(Paul Joseph Watson)上传的一段视频片段中,阿科斯塔好像在猛推企图拿走其麦克风的白宫作业人员。

但由C-SPAN播映的原始视频与沃森上传的视频内容天壤之别。沃森宣称,他没有篡改视频片段,并将这种差异归因于人为的“视频压缩”所形成的。可是,正如《独立报》在修改时刻线中对视频进行并排剖析中所展现的那样,沃森的视频与原始视频比较缺失了几帧。全身的深休假造就像修改视频帧相同,能够改动工作的实在性。

Deeptrace实验室树立于2018年,是一家网络安全公司,它正在构建根据核算机视觉和深度学习的东西,以剖析和了解视频,特别是那些能够被任何类型AI操作或组成的视频。公司创始人乔治帕特里尼(Giorgio Patrini)曾是阿姆斯特丹大学三角洲实验室(Delta Lab)深度学习的博士后研讨员。他说,几年前他开端研讨避免或防备未来对组成媒体乱用的技能。

帕特里尼信赖,歹意的深休假造视频由组成的全身、面部和音频组成,很快就会被用来进犯记者和政客。他指着一段深休假造的色情视频称,视频中印度记者拉娜阿尤布(Rana Ayyub)的脸被换到了一名色情女艺人的身体上,这是一场诋毁运动的一部分,意图是诋毁她的查询性报导。

《华尔街日报》最近报导称,一家英国动力公司的首席执行官上圈套将24.3万美元资金转到了匈牙利供货商的账户上。这位高管说,他以为自己是在老板对话,后者好像现已同意了这笔买卖。现在,这位首席执行官以为,他是一场音频深休假造圈套的受害者。法里德以为,其他欺诈性的深休假造违法呈现仅仅时刻问题,或许包含全身深休假造。

法里德说:“我能够制作一段杰夫贝索斯(Jeff Bezos)的深休假造视频,他说亚马逊的股票正在跌落,想想做空亚马逊股票能够赚到多少钱。当你控制住它传达的时分,危害现已形成了。”

法里德以为,交际媒体和深休假造技能的结合,无论是面部仍是全身假造,都很简略形成严重破坏。交际媒体公司在很大程度上不能或不愿意检查他们的渠道和内容,所以深休假造内容或许会像野火相同传达。他说:“当你将发明深休假造内容的才能与在全球范围内分发和消费它们的才能结合起来时,这会形成巨大影响。”

正如隐私学者丹妮尔西特龙(Danielle Citron)所指出的那样,当深休假造视频被戳穿时,它能够向那些购买谎话的人暗示,这样做是值得的。西特龙称其为“骗子的盈利”。法里德以为,全身深休假造技能的行进将使这种凶恶深休假造的全体问题变得更糟。这项技能开展敏捷,它遭到大学研讨“人人皆为舞王”以及比方Zao等深休假造运用货币化的推进。

法里德说:“一旦你能假造悉数人体都作业,就不会满意再仿照面部了,你能够仿照人们不同场景下发作的活动。这样的场景行将成为实际吗?或许不会在近期呈现。但终究,在一两年内,人们将能够完成全身深休假造,并且它将具有令人难以置信的强壮功用。”职业反响

现在,在科技职业中还没有找到铲除深休假造的一致办成都人事考试网法,许多不同的技能正在研讨和测验中。例如,范德韦格的研讨团队发明晰各种探究深休假造视频办法的内部应战。一个团队查询镜头的数字水印,以辨认深休假造内容。另一个团队运用区块链技能来树立信赖,这是它的优势之一。还有一个团队经过运用最草创假造视频的相同深度学习技能来辨认它们。

范德韦格标明:“有些斯坦福大学的辍学生发明晰AI神探夏洛克,这是一种深休假造视频主动检测东西。他们取样了某些卷积模型,然后在视频中寻觅反常。这是一种被其他深休假造勘探器运用的程序,比方Deeptrace实验室。他们运用名为FaceForensics+的数据集,然后对其进行测验。这种技能的辨认精确率高达97%,并且更拿手辨认换脸。”

Deeptrace实验室根据API的监控体系能够看到深休假造视频的创立、上传和同享。自2018年树立以来,该公司现已在互联网上发现了超越1.4万个假视频。Deeptrace实验室的体系搜集的信息能够奉告公司及其客户,假造者正在制作什么样的深休假视频,假视频来自哪里,他们正在运用什么算法,以及这些东西的可拜访性怎么。

帕特里尼说,他的研讨小组发现,95%的深休假造视频是色情类别中的换脸,其间大多数是名人被换脸。到现在为止,Deeptrace实验室还没有看到任何全身组成技能呈现。帕特里尼指出:“你不能用一个算法或主意来总结这些问题的处理方案,这需求构建几个能够告知你关于组成媒体全体不同信息的东西。”

范德韦格以为,勘探深休假造技能的下一件大事将是“软”生物特征签名。每个人都有自己共同的面部特征,比方扬起的眉毛、嘴唇的动作以及手部动作等,这些都是绝无仅有的。加州大学伯克利分校的研讨员舒迪阿加瓦尔(Shruti Agarwal)运用这类软生物辨认模型,来确认这种面部抽搐是否是为视频人工创立的。

阿加瓦尔本年6月承受说说-换脸已不算事儿 能换整个身体的AI假造技能立刻就来了采访时标明:“根本主意是,咱们能够为一些人树立软生物辨认模型,然后当视频开端疯传时,咱们能够剖析它们,尽力确认它们是否是实在的。”

虽然阿加瓦尔的模型不是彻底牢靠,由于不同状况下的人们或许运用不同的面部抽搐,但范德韦格以为,公司能够在未来供给用于身份验证意图软生物特征签名。这样的签名能够是众所周知的眼睛扫描或全身扫描。他说:“我以为这是未来技能行进的方向:与学者和大型科技公司协作创立更大的数据集。作为新闻修改部,咱们应该测验练习人员,并树立关于深休假造视频的媒体素质。”

最近,Facebook和微软正与大学协作推出“深休假造视频勘探应战赛”。另一项值得注意的尽力是美国国防高档研讨方案局(DARPA)的项目,即经过语义取证来处理深休假造问题,该组织寻觅算法过错,例如在深休假造视频中发现某个人佩带的耳环不匹配。2018年9月,AI基金会筹集了1000万美元资金,用于创立一个东西,经过机器学习和人类版主辨认深层假造和其他歹意内容。为何深休假造难监管

Fast.AI的托马斯说:“在短期内,推行虚伪信息和其他有毒、煽动性内容对首要渠道来说是有利可图的,所以咱们的激励机制彻底不一致。我不以为这些渠道应该对它们保管的内容担任,但我的确以为它们应该对它们活跃宣扬的内容担任。例如,YouTube向那些乃至没有寻觅的人引荐了160亿次亚历克斯琼斯(Alex Jones)的视频。”

Deeptrace实验室的帕特里尼说,对组成媒体的监管或许证明是杂乱的。可是,他信赖某些现行的法令,比方那些包括诋毁和版权的法令,能够用来监管歹意的深休假造行为。帕特里尼说,阻挠深休假造的全面法令将会被误导。相反,他以为应该支撑谋福社会的组成媒体运用,一起赞助研讨开发东西来检测深休假造内容,并鼓舞草创企业和其他公司也这样做。

帕特里尼说:“咱们还能够告知群众,这项技能现已存在,咱们需求从头练习咱们的耳朵和眼睛,不要信赖咱们在互联网上看到和听到的全部。咱们需求为人和社会接种‘疫苗’,而不是在两年内修正东西,由于乱用这项技能或许会引发许多灾难性或有争议的作业。”

奥默尔称:“咱们都看到了图画了解的运用及其潜在的优点,但这触及十分重要的职责问题,谁将为此承当职责?公司很或许为了股东的利益考虑也需说说-换脸已不算事儿 能换整个身体的AI假造技能立刻就来了求清晰自己的职责。可是,咱们都知道他们到现在为止是怎么处理这一职责的。这是个十分扎手的问题,它们仅仅期望深休假造视频自可是然地消失,但这显然是不实际的。”