大数据时代 1

大数据时代:我们的生活方式将受到怎样的影响?

xiaoyi 发表于 2013-08-20 09:37 来源:参考消息

美国《基督教科学箴言报》网站8月11日刊登题为《运算新时代—我们的生活方式将受到怎样的影响》的署名文章,作者为罗伯特·莱尔曼。文章介绍说,阿诺德·伦德是美国通用电气公司下属实验室的负责人。时至今日,公司位于美国尼斯卡尤纳的研究总部里依然陈列着创始人托马斯·爱迪生用过的一张办公桌。

不过,即便是爱迪生恐怕也要通过培训才能完全理解伦德手中某个项目的内容。伦德研究的问题是—电力企业如何才能掌握数据的威力,预测出究竟哪些树木会在暴风雨中倒向输电线,以便避免停电的发生?

美国约翰斯·霍普金斯大学教授理查德·罗思曼的工作则更为基本:治病救人。美国疾病控制和预防中心会通过各家医院的报告来预测流感疫情,但这一过程需要数周时间。2009年,有研究成果似乎表明可以通过分析千百万条谷歌搜索词条来更快地预测疫情。诸如“孩子病了”这样的搜索词条如果突然增多,就会成为流感疫情的标志,而疾病控制和预防中心此时可能还蒙在鼓里。这就为罗思曼及其同事安德烈娅·杜加斯提出了一个新的问题—谷歌能否及时预测出流感疫情,帮助医院提前做好准备?

文章称,这些研究人员提出了不同的问题,但他们都是“大数据”新时代的有机组成部分—不管是好是坏,这一新现象都将彻底改变我们生活、文化乃至这颗星球的方方面面。

就在四年前,曾有人想在维基百科网上为“大数据”编写条目。但维基百科拒绝了,认为这条短语没有任何特别之处—只不过是“大”和“数据”二词的简单结合。时至今日,大数据似乎无所不在。有人认为大数据引发了自欧几里得时代以来的最大变革。

想要竞选公职吗?召集一帮电脑怪才,让他们梳理数据库,找出那些可能投票给你的人群—然后用量身定做的手机短信盯住这些人。美国总统奥巴马曾在2012年这样做过。想要解决非洲贫困问题?

分析手机短信和社交网络,找出失业、瘟疫等问题的早期征兆。联合国正在这样努力。渴望找到合适的伴侣?运用运算法则,分析无数种性格特征,确定谁与你最相配。许多婚恋网站现在就是这样做的。 那么,大数据究竟是什么意思?它新在哪里?有什么特别?又有什么缺点呢?这些问题已经引起了人们的极大兴趣,尤其在6月5日“棱镜门”曝光以后。大数据的阴暗面远不只是斯诺登的爆料,也远远不只是美国的那些行为。美国巴布森学院的信息技术专家托马斯·达文波特说:“大数据的作用将颇具变革性。”

大数据究竟会改变什么?为找到答案,让我们从头开始探究吧。

文章称,大数据首先需要有……很多很多数据。谷歌公司执行董事长埃里克·施密特说过,我们现在每48小时收集到的数据量(1.8泽它字节,即1,800,000,000,000,000,000,000字节)相当于人类从“文明之初到2003年为止”收集到的数据总和。

你没有看错。这家每天接收到500亿条搜索请求的公司的老总相信,人们现在短短数日收集到的数据量就已经超过人类在大部分历史时期收集到的数据总和。

文章指出,数据量增长的主要原因是,我们把许多日常活动都数字化了,比如网上购物和下载音乐。另一个因素是我们越来越依赖电子设备。每当我们发送电邮、检索词条、发表帖子、文章和微博时,这些电子设备都会留下我们的数字足迹。绝大部分数据并不会影响到我们。收集数据本身并不意味着数据是有价值的。然而,挖掘正确信息、发现规律和相关性的新能力已经影响到我们的日常生活了。

肯尼思·库基尔和维克托·迈耶-舍恩伯格在《大数据:一场将要改变我们生活、工作和思考方式的革命》一书中写道,美国沃尔玛百货公司通过挖掘销售数据,发现人们会在飓风来袭前储备许多名为“Pop -Tarts ”的零食。现在,每当暴风雨将要来临时,沃尔玛就会把“Pop -Tarts ”和手电筒放在同一排货架上。

不过,大数据带给人们的兴奋与担忧之情远比上面这个例子来得深刻。

罗伯特·莱尔曼在文中说,去年,有一棵倒下的树砸在了他家屋后的输电线上。当地公共事业部门进行维修的时候,一股电流击毁了他的电脑,破坏了机器里的所有内容。于是,阿诺德·伦德的输电线项目引起了他的注意。“对电力企业来说,主要成本之一就是对付树枝。”他说,“我们绘制出一个州的整个地貌,以及电网的分布图。我们通过卫星数据监测树木生长,修剪掉长得最繁茂的部分。然后,我们会预测哪些地方最有可能出事情。我们通过50种不同的变量考察断电的可能性。” 通过这简短的一席话,罗伯特·莱尔曼称他看到了库基尔和迈耶-舍恩伯格在书中提到的大数据为研究工作带来的三大变化。

第一、求规模,不求样本。一百多年来,统计学家们一直依赖小规模数据样本,以此作为归纳的基础。他们没有选择,因为他们没有能力收集更多数据。新技术意味着我们可以“收集到大量数据,而不是满足于……样本”。

第二、求杂,不求精。科研人员传统上喜欢“干净、精确的数据;如果得不到那么多数据,科研人员就必须尽可能拿出严谨态度”。现在就没必要了。数据量带来的好处胜过了我们“对精确度的苛求”。

第三、求相关性,不求原因。尽管科研人员乐于了解现象背后的原因,但“达到(研究)目的”并不一定要求我们必须了解世界的运行规律。

伦德的实验室诠释了这“三大变化”。首先,他的“全地貌图”与50种变量涉及海量数据。其次,伦德追求的是发生各种事件的“可能性”,而非“严格的精确度”。那么相关性呢?伦德当然看重原因,比如树木生长快慢的原因,只不过他更加关注的是那些可能需要相关人员采取行动的相关情况。

文章称,为进一步阐述相关性问题,库基尔和迈耶-舍恩伯格举了美国联合包裹运送服务公司的例子。这家公司会在自家卡车上安装传感器,用来感应与抛锚有关的振动及其他现象。“这些数据没法把故障原因告诉公司,但它们透露出的信息足以帮助公司了解到应该采取哪些应对措施。”

不过,大数据的副作用同样令人担忧。美国美利坚大学传媒学院的劳拉·德纳尔迪斯对三方面事情感到担心:新技术会不会(1)损害隐私,(2)扩大贫富差距,(3)把政府变成“老大哥”?今天,我们可以借助许多强大的方法,通过原本应该保密的资料发现当事人的真实身份。德纳尔迪斯担心某些公司对于我们使用社交媒体的习惯实在太过了解了。

文章提出,除个人隐私外,有批评人士对大数据在更广阔领域的影响表示担忧,比如扩大富国和穷国的差距。美国大公司雇得起数百名数据分析师,那么孟加拉国该如何竞争呢?这会扩大全球数字差距吗?或许眼下最令人不安的是,政府有可能以国家安全的名义运用大数据来监视国民。而斯诺登事件所引发的问题涵盖了隐私、保密、自由等诸多方面内容,当然也包括国家安全。

虽然大数据能够预测流感疫情,预测哪里的树木会倒下,但是大数据本身并不能解决我们面临的经济和道德难题。无论是在维护正常供电,还是帮助患者更快康复的时候,大数据所做的都是告诉我们出了什么情况,而不会告诉我们什么是对的。(编译/刘子彦)


© 2024 实用范文网 | 联系我们: webmaster# 6400.net.cn