在公众数据使用上,为什么科技巨头就能实现 DARPA 之“不能”?

DeepTech DeepTech深科技 2018-06-09

 

“你的每一次信用卡交易、每一份订阅的杂志和开具的处方、每一个访问的网站和每一封收发邮件、每份学术成绩单、每一次的银行存款、每次预定的旅行、和每次参加的活动——所有这些交易与内容信息都会最终汇总到一个虚拟的大型中央数据库。”


纽约时报》专栏作家 William Safire 在 2002 年这样提醒大众。


在马克扎克伯格众多政府证词以及对剑桥分析丑闻的持续批评之后,有人猜测,这位纽约时报专栏作者一定会谈一谈 Facebook,以及互联网公司的广告商业模式。


事实并非如此:《纽约时报》 William Safire 的“你是嫌疑犯”专栏于 2002 年创立,比 Facebook 成立还要早两年。Safire 没有谈论社交网络或数字广告,他讨论了 TIA 项目(Total Information Awareness,由美国 Information Awareness Office 创立),美国国防部高级研究计划局(DARPA)提出通过挖掘大量美国人的数据来识别潜在的国家安全威胁。虚拟大数据库隶属于国防部,它将被用来识别公民的行为模式,由此帮助预测即将出现的恐怖威胁。此项目迫于民众压力终止。


而今天我们已经自愿参与到 Safire 在 16 年前设想的反乌托邦情景:将全部数据交给 Facebook 和 Google 等公司。要知道我们曾经认为政府收集用户数据的做法非常过分,而现在企业建立了我们的信息库,我们不得不接受上传数据给这些公司的后果。


由 Admiral John Poindexter 主导的 TIA 项目是一个元程序(又译超编程,是指某类计算机程序的编写,这类计算机程序编写或者操纵其它程序作为它们的数据,或者在运行时完成部分本应在编译时完成的工作)。它旨在汇总通过 DARPA 下属的 TIA 办公室(InformationAwareness Office)运行的其他程序生成的信号。


TIA 项目侧重建立信息分析、决策支持工具、语言翻译、数据挖掘和模式识别等能力。当各个能力协同工作时,将形成对公民及其行为的全面画像。TIA 项目的目的是预测恐怖主义行为并阻止恐怖攻击,这一灵感来源于政府未能将 911 恐怖分子留下的蛛丝马迹与他们将要进行的攻击联系起来(911时间前夕,曾有两篇报道分别指出疑似本拉登阵营的恐怖分子在美国学校进行飞行学习,以及有一名来自明尼苏达洲的可疑飞行员)。



在 TIA 项目上,美国两党没有重大分歧。不过,美国智库卡托研究所曾警告公众,称 TIA 可能导致一个监控的社会,并称违背了美国第四修正案。美国公民自由联盟(American Civil Liberties Union,ACLU)也认为 TIA 是一个虚拟的拖网,此项目将允许政府“尽可能多地收集关于每个人的信息 —— 而在当下的数据时代,这将会是很多信息。


政府会搜集包括但不限于个人的医疗和财务记录、政治信仰、旅行历史、处方单、购买习惯、(电话、电子邮件和上网)的通信信息、学校记录、个人和家庭联合会的信息。” 不久之后,Ron Wyden 和 Byron Dorgan 领导的美国参议院一致表决撤回对该项目的资金支持,一些技术工作被重新分散到政府的其他部门,并表示技术将不再主要用于对于美国公民的监控活动。


一边是 TIA 项目在华盛顿分崩离析,另一边是类似项目却在硅谷兴起。几年之间,顶级行业发展趋势报告和风险投资博客开始讨论“大数据”(Big Data)和“社交本地移动”(Social Mobile Local)的力量。


今天,你可以随口说出这样的几家公司:它们有你使用信用卡的购买记录、杂志订阅记录、网上浏览记录和邮件收发记录、旅行记录以及活动记录 ——包括所有 Safire 所提到的数据类型。这些数据整合在一起就可以预测你可能感兴趣的广告类型。


初创公司和大公司都开始吹捧他们收集、存储和挖掘数据的能力,这是一种当下流行的商业模式。并且,企业几乎不会将用户数据圈在一家,快捷登陆导致用户在各个网站看到相似的、根据他们行为投放的广告,即使是互联网的轻度用户也不能避免。世界级大科技公司成功之处在于,它们创造出了用户喜爱的产品——用户自愿开放其信息和行为数据,企业跟踪用户行为、收集用户数据无处不在,已成为常态,平台型科技巨头通过快捷登录、跟踪点击、收购初创公司轻松构建起准确的用户画像。


在上个月的国会听证会上,参议员 Maria Cantwell 在与 Facebook 首席执行官马克 · 扎克伯格的交流中提到了 TIA 和私人信息收集之间的相似之处:


“你听说过 TIA 吗?”Cantwell 议员问。 “你知道我在说什么吗?”


“我不知道,”扎克伯格回答。


图 | Facebook CEO 马克 · 扎克伯格在美国国会听证会上


扎克伯格不太可能从来没有听说过这个计划。毕竟,这个计划是在他读高中时提出的。Cantwell 接着解释了这一项目:大规模数据挖掘、也许是前所未有的监视、控制和识别。她指出 WhatsApp 和 Palantir 其实是数据收集器,并指出这是“信息时代的主要趋势”。她的调查展示了几家公司和 TIA 的相似之处,也提出了一些重要问题:为何企业有权收集如此多的数据,而且在美国人已经拒绝 DARPA 有类似行为的前提下?这种力量游离于公共监督范围之外的后果是什么?未来这种工具会对我们产生什么影响?


当然,TIA 与社交媒体巨头所运营的平台间存在一些重大差异。首先,用户自愿同意公司的服务条款。看起来,人们似乎知道他们放弃了什么来换取免费的电子邮件、短信、分享图片功能、和朋友保持联系。其次,面对 TIA 与社交媒体平台,用户需要承担的风险不同:政府有权逮捕你,而 Facebook 和 Google 不会。



TIA 的唯一目的是监视公民以及如何打好信息防御与反击战。 表面上看,Facebook 是一个社交网站,用户在这里发布状态、分享照片、与朋友互动;Google 是一个出色的搜索引擎网站,亦是受欢迎的电子邮件提供商。


但是,从更深的角度看,这些公司与 TIA 项目有相似之处:对公民数据安全同样存在威胁 -——但是,这些公司没有遇到来自公众的抵触和反对。这个情况很危险。现在,很多国家的政府,不仅仅是美国政府,可以利用庞大的数据库来预测公民的行为并监控公民。实际上,据 Wired 报道,已经有国家开始滥用数据监督权力,例如俄罗斯,它使用精确定位技术和大量数据的帮助来对美国公民进行画像。


讽刺的是,积累了 TIA 项目所必需的数据收集和挖掘机制的企业平台,没有义务将其用于 TIA 所主张的维护国家安全和反恐—— 而且许多数字公民自由组织认为企业不应该这么做。但更令人不安的是,我们的社交平台可能正相反:它们可能会无意中激化极端分子。社会信号能够识别激进行为的早期迹象,或者找出那些有可能接受或默许极端主义行为的人。相应地,推荐系统和搜索功能可能会无意中使用这些信号来进一步催化极端行为—— 这与 TIA 项目所希望实现的信号检测和干预极端行为完全相反。



那么,我们该何去何从?我们如何应对私人企业拥有的强大工具?首先,我们需要公民团体按照审查政府的方式审查大公司。电子前沿基金会(Electronic Frontier Foundation)和开放技术研究所(Open Technology Institute) 曾对 TIA 提出声讨,但是他们对 Facebook 和 Google 所掌握的巨大权力默不作声。 蓝灰网站(Slate)的作家 April Glaser 最近写了一篇很好的文章,研究这其中的细微差别和政治因素,涉及范围从从经济利益冲突到世界观。正如她所说的,我们需要监督者发声。


但公民群体本身无法赢得这场战斗,所有用户也需要互联网用户时时对大公司进行审视。国家尝试汇总数据库和挖掘某些可能揭示极端主义倾向行为数据的行为遭到反对,我们认为企图对这种信息入侵计划形成有效监督的想法是可笑的。但就在几年之后,我们却拱手将同样的数据内容泄露给大公司。我们不相信政府 ——因为政府有 太多的丑闻和滥用权力的行为—— 但我们并没有完全意识到,我们此时正在将我们的个人信息交给庞大的、没有公众监管的利益集团。


- End - 


编辑:左笠夫

参考:

https://www.wired.com/story/darpa-total-informatio-awareness/

 


    觉得不错,分享给更多人看到