这家大数据公司 竟是英国脱欧与特朗普当选的背后功臣

投稿人/来源: | 2017-02-16 10:17 |

钛媒体注:原文是一篇深度调查,首发于有德语世界《纽约客》之称的瑞士德语杂志Das Magazin,由新媒体VICE旗下科技和文化频道Motherboard转载。本文编译自Motherboard转载的英文版。

钛媒体注:原文是一篇深度调查,首发于有德语世界《纽约客》之称的瑞士德语杂志Das Magazin,由新媒体VICE旗下科技和文化频道Motherboard转载。本文编译自Motherboard转载的英文版。

2016年8月18日,特朗普在Twitter上发了一条口气神秘的帖子:很快你们就会管我叫“退欧先生”。彼时,观察人士已经注意到他的竞选历程和赢得公投胜利的英国退欧运动有惊人的相似之处,可很少有人想到,这些相似和他的助选团队有什么必然联系。

参选以来,特朗普的言论明显前后矛盾,他的变化无常饱受批评,也传递了一系列争议不断的信息,可一夜之间,这些都变成他的巨大优势:他给选民传递了令人耳目一新的讯息。

在特朗普发帖自封“退欧先生”当月,《数学杀伤性武器》的作者、数学家凯西·奥尼尔评价,特朗普的行为与追踪观众反应的计算机程式完全合拍,一举一动好像都是由这类投机的程式设定。

特朗普真有那么神?谜底在2016年9月悄然揭晓:距美国大选正式拉开帷幕一个月,在纽约君悦酒店举行了一场堪称小型世界经济论坛的康科迪亚峰会。Cambridge Analytica公司的首席执行官亚历山大·尼克斯(Alexander Nix)上台后,一时间全场鸦雀无声,此人正是特朗普的新任数字策略负责人。

特朗普去年6月聘请了 Cambridge Analytica来帮助他竞选,这家公司擅长的就是大数据分析人的心理和性格。

Cambridge Analytica公司CEO亚历山大·尼克斯。图片来源/spectator.co.uk。

Cambridge Analytica公司CEO亚历山大·尼克斯。图片来源/spectator.co.uk。

背后功臣尼克斯与他的秘密武器

在携手Cambridge Analytica以前,利用数字技术为特朗普造势的实际上只有曾创业失败的数字广告业人士布拉德·帕斯凯(Brad Parscale),他花了1500美元搭建了一个简陋的特朗普竞选网站。特朗普的个人助理透露,古稀之年的特朗普不了解数字领域,他平时不收发电邮,用上智能手机也是助理苦劝之后的事,现在他就用那只手机不停发推。

相较之下,希拉里当时已经相当依仗美国史上首位“社交媒体总统”奥巴马遗留的宝贵财富。同为民主党人的希拉里接掌了他驰骋社交媒体的所有资源。竞选期间,她不仅与奥巴马麾下数据分析团队资深成员创立的 BlueLabs Analytics, Inc. 公司的一流大数据分析师合作,还得到了谷歌和梦工厂的支持。

当特朗普2016年6月宣布聘请 Cambridge Analytica时,设在华盛顿的 BlueLabs还嗤之以鼻。他们的第一反应可能是:真的假的?一帮穿着定制西装的外国佬能了解美国、懂得美国人的心理吗?

事实上,为特朗普助阵并不是Cambridge Analytica登陆美国的处女秀。这家公司两年之前就试水美国大选,在得到特朗普垂青以前,它曾先后担任另外两位共和党参选人卡尔森和克鲁兹的顾问。

Cambridge Analytica的大金主是低调的美国软件业富豪、对冲基金文艺复兴基金的联席执行官罗伯特·默瑟尔( Robert Mercer)和他的女儿。据报道,默瑟尔是该公司最大的投资者。

更何况,早在2015年11月,前英国独立党领导人奈杰尔·法拉奇支持的激进退欧组织“离开欧盟”就请Cambridge Analytica协助线上宣传。这家公司擅长创新的政治推广方式,基于OCEAN(五大类性格——开放型、严谨型、外向型、亲和型、神经质型的简称)模型,通过人们留在数字领域的足迹测量其个性,细分目标受众。

(钛媒体注:所谓的OCEAN就是:Openness to experience——经验开放性,好奇和对新体验的接受程度;Conscientiousness——尽责性,是否容易被传统的目标驱动而专注工作;Extraversion——外向性,是否更倾向于活跃于社交场合;Agreeableness——亲和性,是否倾向于与群体达成一致和合作;Neuroticism——情绪不稳定性,对未知和压力环境的反应是否稳定。)

尼克斯在康科迪亚峰会上做了一场精彩的演讲。他在会上开门见山地谈了谈“大数据和心理测量学在大选中的威力”。他先举了泰德·克鲁兹的例子。他说克鲁兹一年半前人气不高,知道他的美国选民人数不到40%。2016年4月,克鲁兹的民调支持率已经和特朗普难分高下。

尼克斯解释,其他助选机构都依靠性别、种族等人口统计学的要素,想当然地觉得只要是女性、或者只要是非裔美国人,对候选人的印象应该都是一样的,而他的公司运用心理测量将选民划分为五种性格的人,利用OCEAN模型预测所有美国成年人分属哪种性格,然后有针对性地向不同每种性格的人展开尽可能符合他们口味的宣传。

Cambridge Analytica公司。图片来源/firstpost.com。

Cambridge Analytica公司。图片来源/firstpost.com。

简单解释OCEAN模型的操作方式。首先,从多种多样的来源购买个人数据,比如土地登记、汽车数据、购物数据、积分卡和俱乐部会员信息,了解他们读哪些杂志,去哪些教堂做礼拜。在美国,几乎所有个人数据都可以待价而沽,Acxiom、Experian等经纪商都面向全球踊跃出售数据。

综合这些购买的数据和共和党的选民名单,以及网上的数据,Cambridge Analytica就能测算一个选民属于五大类中的哪种性格。至此,零乱的数字足迹突然之间就可以呈现现实生活中人们的担忧、需求、兴趣和住址。

接下来,尼克斯在PPT中演示了他们为克鲁兹竞选准备的数据分析图表集合。尼克斯缩小了地图展示的数据范围,随着他逐步取消“共和党人”、“尚未确定者”“男性”等显示标准,最后,地图上只留下了人名的信息,包括年龄、地址、兴趣、个性和政治倾向。

尼克斯以美国宪法第二修正案的枪支使用权为例,展示了Cambridge Analytica如何对特定的选民提供适当的政治讯息:如果是神经质型和严谨型观众,就要突出入室抢劫的威胁,显示政策应该保证业主持枪,所以可以让他们看看这种画面:抢劫者一只砸窗户的手;另一边,要是封闭的亲和型人,他们关心传统、习惯和家庭,不妨给他们看类似大人带着孩子站在夕阳下举枪打野鸭的画面。

尼克斯在演讲中坦言:“特朗普发的几乎所有Twitter帖子都背后都有数据支持”。他透露,在特朗普和希拉里进行第三场总统辩论那天,特朗普的助选团队通过Facebook这个平台测试了17.5万条宣传特朗普观点的不同广告,以便找到其中适合的版本。

为了从心理学角度尽可能地找准目标观众,这些接受测试的广告大多只是在微小的细节方面有差别,比如图片或者视频的标题、用色、字体有所不同。尼克斯说,经过这种细微的调整,特朗普的广告能覆盖哪怕最小的受众群体。他在Das Magazin的采访中透露:“我们可以有针对地搞定小到村镇或者公寓区,甚至具体个人。”

狙击希拉里:消灭她的潜在支持票

以迈阿密市一个叫“小海地”的海地裔黑人聚居区为例。为了阻止该地区的选民投票支持希拉里,特朗普的团队就在当地散布消息,曝光海地发生地震后希拉里与丈夫创办的克林顿基金会滥用救灾款等恶劣行径。一位助选的高官在大选日几周前告诉彭博新闻社,这么做是为了阻止非裔美国人、年轻女性、摇摆的左翼人士等希拉里的潜在支持者为她投票。

这些抹黑希拉里的帖子会出现在Facebook的时间轴广告中,只有符合某些性格特征的选民才能看到,比如非裔美国网民会看到希拉里称黑人为“捕食者”的视频。

演讲结尾,尼克斯说,铺天盖地打广告的传统模式已经寿终正寝,没有人能再忽略具体的受众。

事实上,即使尼克斯主动揭开了神秘的面纱,人们也无法确切了解特朗普的助选团队瞄准了哪些美国选民,因为他们主攻社交媒体或者数字电视的个人化讯息,重心并没有放在主流电视频道上。虽然当时希拉里的团队根据人口统计预测己方领先,但彭博记者萨莎·伊森博格在参观美国人口第七大城市圣安东尼奥后发现,这个特朗普团队做数字领域推广的基地已成为特朗普助选的“第二个大本营”。

别看Cambridge Analytica为特朗普效力的只有12人,从2016年7月到9月,他们得到的酬劳已经完成了三级跳,分别拿到10万美元、25万美元和500万美元。尼克斯介绍,仅特朗普这个客户就为公司带来超过1500万美元收入。

重赏之下必有回报,特朗普的团队引进了前卫的测量指标:从2016年7月起,他们给助选拉票的工作人员配备了一款能辨识住户政治观点和性格类型的应用。英国退欧的支持者也曾用过这种应用。

如此一来,拉票者便能有的放矢,只需拜访那些被归类为会接受特朗普观点的人。登门以前,拉票者会带上根据受访者性格类型事先准备的对话提纲,实际交流以后,他们会将受访者的反应输入应用,特朗普的团队就会得到新的反馈数据,更新相关的数据综合图表。

虽然民主党也搞上门拉票,但没有证据显示他们依靠心理测写有针对性地展开攻势。

传统的传媒策略和手段往往陷入了仅从地理和人口学的分类出发的陷阱,而Cambridge Analytica的独门绝技在于,他们注重心理档案建立,根据性格,对选民进行行为精准投放(Behavioral Microtargeting)。

个人的人口统计类别可能一致,但性格不一样。图片来源/cambridgeanalytica.org。

个人的人口统计类别可能一致,但性格不一样。图片来源/cambridgeanalytica.org。

两个人口统计学分类一致的个人,由于性格区别很大,同样的信息投放,对他们起到的效果可能会有天壤之别。Cambridge Analytica公司将美国国民分为32种不同性格的人,而且锁定人群仅限17个州。他们发现,偏好买国产车的美国民众可能就是特朗普的选民。

除了这种指向性很强的信号,他们还利用发现摸索出特朗普发哪种帖子最有效、对哪些地域的人最有效,并且根据数据分析做出决定,在大选冲刺阶段着重做密歇根州和威斯康星州的工作。堂堂美国元首的候选人就这样成为让大数据模型得到现实应用的工具。

OCEAN五型人格之父的警戒

政界人士对Cambridge Analytica的作用还将信将疑,但OCEAN模型之父——心理学家迈克·科金斯基(Michal Kosinski)对大数据的潜在危险及这家公司的巨大潜能就再清楚不过了。

科金斯基和Cambridge Analytica颇有渊源。

2009年,在剑桥大学心理测试中心攻读博士一年后,科金斯基和同学大卫·史迪威联手开发了一款应用 MyPersonality,当时Facebook还没有成气候,这款应用让用户接受不同的心理测验提问,包括五类性格相关问卷的一些心理问题,然后,用户就能得到一份个人性格综述,并且可选择与研究人员共享自己的Facebook数据。

通过这种方式,科金斯基不久得到了几百万人共享的数据,意外地掌握了全球最庞大的Facebook个人简介及心理测试评估数据集。

此后几年,科金斯基和同事进一步简化了方法。首先,他们请测试对象在网上完成一份调查问卷。根据问卷回答,这些心理学家测算受试者分别属于五大类性格(开放型、严谨型、外向型、亲和型、神经质型)中哪一种类型,然后用测算结果和这些受试者在互联网留下的其他各类数据做对比,比如在Facebook上分享点赞的内容或者发的帖子,他们自述的性别、年纪、所在地。通过这种比较,研究者可以将分散的信息联系起来,找出相关性。

通过观察一个人在网上的活动,可能推测出非常靠谱的结论。比如为彩妆品牌M.A.C点赞的男士较有可能是同性恋,关注Lady Gaga的人很可能是外向型人,而那些为哲学话题点过赞的人往往性格内向。虽然单一信息说服力太低,不足以进行可靠的推断,但要是把成千上万的单个数据点汇集到一起,就可以得到正确推测。

2012年,经过不懈努力,改进模型,科金斯基证明,根据一名用户平均每68个在Facebook网站的点赞,就可能推测该用户的肤色、性向、倾向支持美国民主党还是共和党,准确率分别高达95%、88%和85%。不仅如此,通过点赞还能推测用户的智力水平、宗教偏好、是否饮酒、抽烟和吸毒乃至父母是否离异。

更有甚者,它们能披露用户的一些线下状态,因为手机可以显示用户的移动速度和距离。科金斯基的结论是,智能手机就是一份我们有意无意随时在填写的心理问卷。

两年后,一位名叫亚历山大·科根的心理学系助教找到科金斯基,代表一家简称SCL的公司向他咨询心理测试分析方法,并希望能使用MyPersonality的数据库。科金斯基的团队起初考虑接受请求,因为那样一来研究中心可以得到大笔资金,但后来他上网搜索了一下这家全球战略传播实验室的SCL公司,发现该司自称根据心理模型做推广,一项核心业务是影响选举,这让科金斯基起了疑。

他的直觉是准确的:SCL旗下有多家公司,其中一些参与了乌克兰和尼日利亚等国的选举,帮助尼泊尔王室镇压叛乱,还有些子公司提供方法影响东欧和阿富汗国民对北约组织的看法。2013年,SCL分拆,诞生了一家涉足美国大选的新公司Cambridge Analytica。

当时科金斯基对此一无所知,但他已经有了不祥的预感。经过进一步调查,他发现科根秘密注册了一家公司和SCL开展业务。科金斯基开始怀疑科根的公司可能复制了自己原创的五型人格测量工具并把它卖给SCL,于是迅速中断了与科根的联系,并通知了所在的研究中心,剑桥大学为此出现内讧。后来,科根移居新加坡并更名,科金斯基修完学位得到在斯坦福工作的机会,西去美国定居。

科金斯基以为此事已告一段路,直到2015年11月“离开欧盟”宣布委托Cambridge Analytica帮忙做线上宣传。Cambridge Analytica乍看上去满是剑桥、性格、分析这些字眼,很多人一下子就想到了科金斯基。于是科金斯基开始收到大量电邮,人们追问他会拿出什么鼓吹退欧的行动。可这是他第一次听说Cambridge Analytica。

看着Cambridge Analytica的官方网站,科金斯基一脸惊恐,他的分析方法是不是大量用来为政治服务了? 英国公投退欧后,亲朋好友又写邮件给科金斯基:看看你做的好事。无论去哪儿,他都不得不给人解释,自己和Cambridge Analytica毫无关系。当然,这家公司是不会主动出来澄清,或披露它在英国退欧的活动中出了多少力的。

此后,无论是英国《卫报》于2015年12月刊发的报道,还是Das Magazin得到的公司内部文件都指向一个结果:SCL从科根处学到了科金斯基的方法,就连尼克斯在2016年那场康科迪亚峰会上讲解的方法也和科金斯基发明的极为相似。

尼克斯那时告诉现场听众,Cambridge Analytica同样采用社交媒体的调查和Facebook的数据。他声称:“我们已经描绘出全美所有成年人——2.2亿人的个性”--而这种吹嘘恰恰是科金斯基此前警告人们大数据的危险之处。

科金斯基实质上发明了一种人肉搜索引擎。随着研究深入,他开始认识到这种搜索引擎的潜力,同时察觉到自己的研究有危险的一面。

在他看来,互联网一直都是天赐的礼物,他衷心希望利用互联网回馈社会,实现共享。这是整整一代人的理想追求,它为一个超越物质世界的新时代拉开了序幕。但科金斯基越来越担心,假如有人滥用自己的搜索引擎操纵他人,那将怎样?他开始在大部分研究论著中加上警语。他警告所有读者,这种方法“可能对个人的幸福、自由甚至人生造成威胁。” 可惜当时没人真正理解他的苦心。

心理测量方法会控制一切吗?

到底心理测量方法对选举结果有多大影响? 这个问题可能无解,但也并非无迹可循。克鲁兹在党内初选中令人大跌眼镜的崛起,投票的乡村选民日渐增多,早期投票的非裔美国选民减少,以及特朗普竞选相对较少的花销,或许也可以归功于性格分析模型。

和希拉里相比,特朗普在数字领域的投入远超电视广告,而尼克斯与多位特朗普竞选班子的核心成员也曾多次表示,Facebook是总统竞选期间最强大的助选利器。不过,Cambridge Analytica不愿提供任何可以证明其效力的数据。

很多人断言,统计学家在这次美国大选中一败涂地,因为他们的预测错得离谱,可他们有没有想过,统计学家实际上也是赢得大选的功臣,只不过,只有那些运用新方法的统计学家才是功臣?

Cambridge Analytica无疑是这次竞选的另一大赢家(该公司董事史蒂夫·班农曾是右翼报纸 Breitbart News的执行董事长,现任特朗普的高级顾问、首席政治策略师)。目前,Cambridge Analytica公司正在巡回欧洲出席活动,展示在美国取得的成就,据悉,他们已经收到来自瑞士、德国和澳大利亚的业务咨询。

今年法国、荷兰和德国都将举行大选,民粹主义政党又都在这三大欧盟核心国家死灰复燃。在这样的背景下,美国大选的成功正是一场及时雨,为Cambridge Analytica杀入商业广告领域奠定了基础。

反观学术界,美国大选落幕后,斯坦福陷入动荡。科金斯基选择以一位研究者最锋利的武器——科学分析应对。他和同事桑德拉·玛兹一道进行了一系列测试(研究成果即将发表),初步测试结果已然惊人:研究显示,通过在Facebook网站提供匹配消费者个性特征的产品和推广信息,相关产品和推广语的广告点击量可提高63%,相关线下广告活动的咨询对话也增加了1400例,这足以体现针对不同个性推广的效力。

科金斯基和同事进一步展示了个性化定向推广的影响力。他们发现,大部分Facebook推广产品或品牌的页面都受到消费者的性格影响,根据某个Facebook页面就可以精确锁定庞大的消费者群体。

本文德语版的相关调查报道发表后, Cambridge Analytica的发言人发布声明,否认公司利用Facebook的数据:

“(本公司)与迈克·科金斯基博士并无业务关系,并非从事转包研究,也不曾运用和科金斯基相同的方法,根本很少用到心理测试。我司不曾致力于阻止任何美国国民在美国大选期间投票,所有工作只是为了增加选举的投票者。”

但反观现实世界,我们面对着是一个的的确确天翻地覆的世界:英国退欧,特朗普就任美国总统,世界民粹主义蠢蠢欲动,全球化退潮……

当年科金斯基开发的心理测评模型不危险,它只是揭示了危险的存在。