NSA收集我们的数据可以做什么?
| 2013-06-12 21:09
美国国家安全局(NSA)收集Fackbook、Google、Microsoft和Apple用户数据,美国国民固定担心,我们这些“海外用户”也不能置身事外。究竟NSA拿着我们的数据可以做什么?
这个问题问Adam Fuchs这位仁兄就最合适不过。NSA利用了开源技术Accumulo将收集回来的数据分析,而Adam Fuchs正是在过去9年来参与Accumulo研发的关键人物。现在他是Sqrrl的公司的CTO和始创人,其产品Sqrrl正是Accumulo的商 业版本。他表示表示NSA在2007年起,就开始尝试使用自动化的分析工具,追踪和发现潜在的恐怖活动。现在NSA数据中心有上万个节点的规模,当中众多 的主机储存的是PB级的数据。
Accumulo擅长于分析庞大的数据,从而生成众多的图表,发现和强化这些数据间的连接。Fuchs并没有提到NSA数据图谱的规模,但他表示系 统可以管理数月甚至数年的资讯,轻易发现怀疑恐怖分子的通话网路以及涉及的参与者。前NSA法律顾问Stewart Baker表示,这些数据可以用做行为模式的识别,类似Google Adwords的运作原理,唯一的区别在于系统旨在发现那些“在某个特定时间段致电也门,并在几秒钟后挂断,随后马上有一个不同的也门号码拨入”的美国用 户。NSA会通过已掌握的恐怖分子的活动数据,来跟嫌疑者比较,从而决定是否需要进一步行动。
究竟NSA在代号PRISM的项目中收集从Google、Facebook等收集的数据中,采集的数据规模有多大?根据华盛顿邮报的报 道,PRISM每年的项目资金只有二千万美元,如果资料属实,这个数目恐怕连储存每年来自Google、Facebook、Microsoft、 Apple、Yahoo、AOL的数据也不够,更不要分析数据了。Yahoo每年在运营其Hadoop环境中的花费就超过1亿美元,Facebook用户 每天生成的新数据超过500TB。所以纵使NSA与此等公司合作,也只能选择一部分来分析。大家有兴趣的话也可下载Accumulo来自行架设一个 “NSA级别”的数据分析系统,毕竟Accumulo是一个开源产品。当然是否有这样的技术和庞大伺服器群,就另作别论了。
来自:http://www.linuxpilot.net/industry/news/201306100101NSA-PRISM