专栏首页AI科技大本营的专栏AI假新闻满天飞,打假神器GROVER帮你看清一切

AI假新闻满天飞,打假神器GROVER帮你看清一切

最近AI换脸术与AI假新闻叠加在一起,造成了不少乌龙事件,比如最近美国的议长南希·佩洛西就的一段醉酒视频就在Facebook上流传甚广,视频中的议长明显是状态晕沉,醉意十足,不过这后来被证明是一段是由deepfake生成的假视频。

后来Facebook创始人马克.扎克伯格的一段视频也开始疯传,在其中小扎说“让我们快速地想象一下,一个人手握偷窃来的数十亿人的隐私信息,他们的所有秘密、生活和未来等等 ”,不过这也是deepfake的杰作。

无独有偶,一名叫做Katie Jones的女政治家,似乎正在美国政坛冉冉升起,她在顶级智库工作,拥有由一批专家和权威人士组成的关系网。她与一名助理国务卿、一名参议员的高级助理以及经济学家 Paul Winfree 都有联系,而且搜索引擎上也能查到相应的新闻报道,不过这位女士其实并不存在,对此美联社已经作出确认,其面部信息是合成的,其相关新闻都是AI捉刀写的。

打假神器 GROVER 横空出世

在OpenAI 推出文本生成模型 GPT-2 后,其文稿所中流畅自然的文笔引发各界广泛的关注,尤其是最近《权力的游戏》烂尾,硬核程序员用GPT-2重写了比电视剧更好的结局,这也让GPT-2算法名声大噪,不过由于这个模型内置 15 亿个参数(你没看错15亿个),其算力门槛让我们这些普通玩家望而却步。不过一种简化的GP2-2-SIMPLE模型已经在 GITHUB 上开源,有机会笔者也会向读者们分享一下这个项目的使用心得。

那么面对这些假新闻包装出来的假人、假事,华盛顿大学和艾伦人工智能研究所的研究者提出了一种名为Grover 的鉴定模型,这个模型本身并没有什么特别值得一提的创新,其思路就是把AI写的文章与人工写的文章分为两组,喂给GPU进行模型训练。论文中最重要的一段如下:“Training Grover-Mega is relatively inexpensive: at a cost of $0.30 per TPU v3 core-hour and two weeks of training, the total cost is $25k”也就是人家为了训练Grover花了20万人民币。所以这又是一次算力上的碾压。

不过虽然Grover的作者并没有开源模型,不过读者还是可以通过他们提供的网页,来感受Grover的强大,

在GENERATE的标签下,随便输入一个标题,点击generate,一会AI就能给你一篇完整的文章,我输入的标题是why china will win the trade war而且写的有理,有据,甚至比很多大V的观点更有见识。所以打假能手,本身也是个造假能手,大家也可以去感受一下。

地址: https://grover.allenai.org/

GENERAT旁边的标签DETECT则可以发现假新闻。随便把我们刚刚让GROVER写的假新闻拷进去,点击“DETECT FAKE NEW"就能得到结果

GROVER的打假原理

由于Grover是使用典型深度学习模型,开发者也并不能了解其工作的具体机制,其原文是这么说的“Why does Grover perform best at detecting its own fake news? We hypothesize that the reason may be due in part to exposure bias”.也就是本文的作者认为Grover是通过检测exposure bias来预测文章是否是由AI生成。

其实到底是不是exposure bias并不重要,我们上次说的VP-VAE-2当中VP其实就是一种压缩算法,而每种机器学习算法中几乎都存在池化或者非全链接层,以此来减低计算量,这样的存在也就给AI赋予了风格,而Grover其实就是通过海量的训练,来感知AI的风格(style)并以此给出自己的预测概率。

参考阅读: https://blog.csdn.net/BEYONDMA/article/details/92143438 https://blog.csdn.net/BEYONDMA/article/details/91129700

(*本文为 AI科技大本营转载文章,转载请联系原作者)

本文分享自微信公众号 - AI科技大本营(rgznai100),作者:马超

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-06-17

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 跨界 | 隐形AI与设计

    作者 | 卢智雄 作为一个设计师,我对现在的AI浪潮的态度起初是:听起来很棒,但跟我这个设计师有什么关系呢? 我对所有的趋势保持谨慎态度,何况现在媒体鼓吹的人工...

    AI科技大本营
  • IBM编程大赛冠军出炉:清华大学黎建成、滴滴出行顾阳夺冠(附大赛详细采访)

    记者 | 张明明 2017年12月16日,由IBM与CSDN共同举办的第四季 "Power AI 人工智能马拉松编程大赛"在北京马哥孛罗酒店开幕。此次赛季围绕...

    AI科技大本营
  • 00后当道,今秋开学的AI专业的本科生究竟学什么?

    500万AI人才缺口,必须从本科抓起!正值开学季,不少同学在刚刚过去的夏天,选择了心仪的专业,即将迈入大学校门。上个月,清华、南大、西交大等26所高校联合申请设...

    AI科技大本营
  • 百度推出了无需编程经验的AI模型训练平台EZDL

    如果没有技术诀窍和正确的工具,训练机器学习算法可能会令人沮丧。对于那些没有足够的资金来处理这些术语的人,百度本周推出了一个测试版的在线工具EZDL,几乎任何人都...

    AiTechYun
  • Eta Compute - 推出超低功耗边缘侧AI芯片

    AI芯片初创公司Eta Compute推出首款量产的边缘AI芯片ECM3532,以仅100µW的功率可实现物联网中的在线图像处理和传感器应用,号称能效是其竞品的...

    用户6026865
  • 分布式作业 Elastic-Job-Lite 源码分析 —— 作业分片

    1. 概述2. 作业分片条件3. 分配作业分片项4. 获取作业分片上下文集合666. 彩----

    芋道源码
  • 不服SOLO:腾讯绝悟AI击败王者荣耀顶尖职业玩家,论文入选AAAI,未来将开源

    围棋被攻克之后,多人在线战术竞技游戏(MOBA)已经成为测试检验前沿人工智能的动作决策和预测能力的重要平台。基于腾讯天美工作室开发的热门 MOBA 类手游《王者...

    机器之心
  • 人脸对齐--Face Alignment at 3000 FPS via Regressing Local Binary Features

    版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/zhangjunhit/article/de...

    用户1148525
  • GitHub官宣:面向所有人,全部核心功能完全免费开放

    4月14日,GitHub宣布,将为所有的GitHub用户提供不受协作者限制的私有存储库,并且GitHub的核心功能现在对所有人免费开放。

    大数据文摘
  • 如何用免费GPU学习AI算法?这篇算法资源大集锦别错过

    上一次写了篇薅GPU百度AI Studio计算资源的文章,收到很多AI算法初学者私信,问我能不能补充一些AI Studio的学习资源。有求必应向来是我的风格,于...

    用户1386409

扫码关注云+社区

领取腾讯云代金券