大数据在未来世界政治格局中地位非常重要。政治家们多年来一直在依靠各种民调、选民兴趣调查和人口统计资料等等。2008年,奥巴马的竞选就被认为是一次数据驱动的竞选,但直到2012年的大选,直到有分析工具可供使用之时,大数据[注]才被真正用于选举,并促成奥巴马以从未使用过的分析方法赢得了大选。
和企业一样,政治党派多年来收集了大量的数据,但这些数据却被孤立地分类在各种目录中:捐款人、网站访问量、社交媒体评论等等。虽然每个分类都是有用的,将所有这些数据整合在一起进行分析甚至可以针对每个选民为其创造新的机会,然而直到现在,这种做法都因为成本太过昂贵而被放弃了。如今,有了Hadoop以及Hadoop即服务厂商的创新,大数据整备两党用来影响美国各州以及联邦的选举活动。
使用大数据得从数据收集和数据分析工具开始。对民主党人来说,大数据就是他们在最近几次竞选活动中一直使用的选民动员网络(Voter Activation Network)。共和党人在这方面的起步稍晚,至今尚未出现全党皆可利用的解决方案,不过德州的一个院外集团已经开发出了RVotes作为其选民数据库和扩大影响的工具。须知,大数据不仅在于收集数据,更在于如何有意义地使用这些数据,所以我们来看看大数据可能引导出的一些政治策略。
1、小额捐款
奥巴马竞选时所采用的一个策略是利用电视广告号召选民做小额捐款(10美元捐款)。虽然此举或被视为草根募捐或者某种公关噱头,但其做广告的目的实际上是为了收集选民的手机数据。为了进行捐款,电视观众被要求向一个竞选号码发送短信GIVE。一旦所有捐款人的手机号码被收集起来,竞选团队便可直接向奥巴马的支持者发送其他相关的竞选信息。
2、智能拉票
拉票并不是什么特别新的或者高科技的政治策略,但可以准确地得知某人的政治倾向或者最关注的利益点是什么。拉票志愿者们可以用一个移动应用访问此类信息,查看某人是否熟悉候选人,是否有可能投候选人的票等等。这样,他们便可在敲开选民的门之前做好充分的准备。
3、有针对性的广告
大多数人在前几次的选举活动中可能都注意到了政治广告投放的变化。我们不再是只看到两党广告的大杂烩,而是更像某种针对我们而做的广告。这是因为两党的竞选团队使用了大数据,可根据某人可能投某个候选人的票以及他所感兴趣的问题,而制作出有针对性的广告。例如号召降低医疗保险成本的广告就是专门针对还没有医保的人群制作的。
4、草根方法
大数据所带来的一个重大变化是,沟通不再只是投放大量的电视广告,而是要让广告精确地到达多少社区,多少选民组织。大数据为草根政治民众的回归提供了资源。例如政治团体会针对具体的社群收集重要问题的信息,然后要求候选人关注这些问题。
5、智能募捐
筹款是任何竞选活动取得成功的关键,所以很自然地,各个竞选团队都会利用大数据来募集尽可能多的捐款。例如马里兰州的共和党人就使用了数据分析工具来确定个人如何捐款,以及个人财富达到17000美元时可能捐多少,以便提前规划筹款的使用。
6、舆情监测
民意调查的结果一般都是有偏差的,往往会对选票实际上怎么变化看不清楚。而另一方面,上网行为却能对人们真正在想什么给出更好的答案。各党派的竞选团队已经开始在分析微博、在线评论和其他行动,以便确定候选人可能获得多少选票。
7、解读选民的行为
最后,要确定是什么原因导致某党派的忠诚选民转而投另一党派的票,这对于党员人数较少的地区或摇摆州的竞选来说尤为有用。奥巴马的竞选团队就利用大数据开发了一个评级系统,可预测每个选民可能出现的投票行为。该系统提供的4个行为指标包括:可能支持奥巴马,可能投票,可能经人提醒而投票,以及如果不是支持者,但有可能因某个特殊问题而改投奥巴马的票。
到目前为止,这套评级系统很成功。随着政治策略变得越来越复杂和有针对性,大数据也将在政治领域发挥越来越重要的作用。但是,大数据对政治的长期影响力还有待确定,大数据的应用需求,是大数据新技术开发的源泉。在不久的将来,也许很多原来单纯依靠人类自身判断力的领域应用,最终都将被计算机系统的数据分析和数据挖掘功能,所普遍改变甚至取代。一小片合适的信息,也许会促使创新迈进一大步;一组数据,也可能会得到数据收集人难以想象的应用,甚至可能在另一个看起来毫不相关的领域得到应用。借助这些创新型的大数据应用,数据的能量将会层层被放大。
“语义网(SemanticWeb)”,也称为下一代互联网,实际上就是“数据网”(WebofData)。语义网是一个全球的数据库网,在这个数据库网中,计算机可自动为用户搜寻、检索和集成网上的信息,而不再需要搜索引擎。大数据时代正在催生的这个最大的技术变革,就是要重新构造互联网,打造出下一代互联网。
四、“大数据” 对当今社会带来的巨大变革
(一) 大数据将丰富甚或根本上改变人类探索未知世界的方式、思维方法与人的行为方式 。在小数据和模拟数据时代,人们总是强调“为什么” 来认识世界。物理、化学等自然科学里,科学家要在实验室通过反复试验来检验理论或定律为什么是正确的;天文学、经济学等学科则根据理论来推测现象,或根据历史数据来验证。只有理论与数掂验证一致,才算揭示了现象背后的因果关系,才算回答“为什么”。
在大数据时代,人们更多强调的是“是什么” 的问题,也就是寻找事物背后的相关关系。譬如说,研究人员利用大数据,不是试图弄懂发动机抛锚或药物副作用消失的确切原因,研究人员可以收集和分析大量有关此类事件的信息及一切相关素材,找出可能有助于预测未来事件发生的规律。加拿大的研究人员正在开发一种大数据手段,以便能在明显症状出现之前发现早产婴儿体内的感染。通过把包括心率、血压、呼吸和血氧水平等16种生命体征转化成每秒1000多个数据点的信息流,他们已经能够找到极其轻微的变化与较为严重的问题之间的相关性。也就是研究人员与医生关注相关关系胜过因果关系。
在大数据时代,人的行为方式也将发展某种程度的变化。以往一般都是先想好要解决什么问题,再去获取相应的信息;而到了大数据时代,思维方式就变成了先尽可能多地占有信息,遇到问题时再从这海量信息中去“挖掘”解决方案。这两者的区别就像普通相机与光场相机(light field)的区别。据美国科技博客网站Venturebeat的报道,2012年3月,美国硅谷创业公司Lytro开发的光场相机正式上市。与普通相机不同,光场相机可以在拍摄完照片之后再对焦,具体生成的照片聚焦在什么位置,可以在拍摄完成之后根据需要再决定。
(二)大数据正在极大地改变企业经营的方方面面,一场新的商业革命已经来临
第一,大数据正在改变企业的营销手段。企业的传统营销手段是集中推销和各种广告宣传,更原始的办法是用大量的劳动力发传单推销产品。比如说我们今天在公交车站拿到的各种各样房地产推销广告就是如此。而在大数据的时代,企业可以充分利用大数据进行精准高效与低成本营销。著名的亚马逊公司在此方面做出了开拓性偿试。当你在网上挑选某一类图书时,亚马逊除了不能像在书店实体翻书以外,其它方面服务与书店无异。重要是,亚马逊通过大数据能时实知晓购书者的偏好,精准推荐相关图书,方便消费者选购,扩大销售量。由于它的创新和独特营销模式,亚马逊己成为全球商品品种最多的网上零售商和全球第二大互联网公司。
第二,大数据将为企业拓展广阔的新型服务与渠道。例如,日本先进工业技术研究所的科学家通过在汽车座椅下部安装压力传感器,把人体屁股特征转化成数据,然后把数据进行量化后做成能识别车主的防盗系统。有了这个系统后,如果架驶员不是车主,系统就会要求司机输入密码,如密码不对,汽车会自动熄火。这种能把一个人的坐姿数据化后,则预示着一些切实可行的服务和一个前途光明的产业。比如说,通过汇集数据,利用故事发生之前的坐姿变化情况,分析出坐姿和行驶安全之间的关系。同时,通过汇集数据,可以发现汽车被盗以及盗贼身份。
第三,在大数据时代,企业管理决策越来越受到大数据的分析和预测功能的影响。以美国网飞公司(Netflix)成功推出全球首部网络剧《纸牌屋》为例。网飞公司是世界上最大一家在线影片租赁提供商,并非传统的影视制作公司,为什么能首次推出一部作品就能获得第65届艾美奖最佳导演和最佳选角两项大奖呢?个中原因是大数据在公司决策过程中起了关键性作用。无论是《纸牌屋》剧本的挑选,还是导演、演员的选定,网飞公司都是根据其庞大的用户数据库作为科学决策的依据,依靠数据分析抓住观众的喜好。《纸牌屋》推出之后,迅速成为美国各大社交网站的热门话题,其明星效应使得该剧的口碑、点播率大获成功。《纸牌屋》进入中国后,首先在美剧迷中掀起交流高潮,继而由美剧迷在网络中发起的分享行为进行扩散。所有这些都是对传统影视公司商业模式的一种颠覆,也成就一个网站主导、数据先行的商业传奇故事。
(三)大数据对公共部门的服务与管理也将带来极大的变革
实事表明,大数据在政府和公共服务领域的应用,可有效推动政务工作开展,提高政府部门的决策水平、服务效率和社会管理水平,产生巨大社会价值。2009年,谷歌公司通过把 5000万条美国人最频繁检索的词条和美国疾控中心在2003年至2008年间季节性流感传播时期的数据进行比较,成功预测了当年甲型H1N1流感的爆发及其传播源头,远早于疾控中心官方。
还有,大数据能够提高安全保障能力。大数据在国防、反恐、安全等领域的应用,将对各部门搜集到的各类信息进行自动分类、整理、分析,有效解决情报、监视和侦察系统不足等问题,提高国家安全保障能力。2013年4月15日,美国马萨诸塞州波士顿发生了震惊世界的马拉松爆炸案,相关调查机构通过采集案发现场附近10TB左右的数据(其中包括移动通信基站上的电话通讯记录,附近商店、加油站、报摊的监控录像,以及志愿者提供的图片和影像资料),从而迅速锁定并令犯罪嫌疑人现形。
另外,通过收集数据,进行车流量的统计,再进一步对这些数据进行分析就能够将交通信息可视化,对同时段不同区域拥堵原因做出分析,这种分析为如何规划道路,是拓宽还是改道提供了参考的标准。大数据的应用一方面通过预警疏散交通压力,一方面为合理规划提供参考,双管齐下,交通难题的解决就轻松不少。 最值得一提的是,联合国(微博)已经推出了名为“全球脉动”(Global Pulse)的新项目,希望利用“大数据”来促进全球经济发展。联合国将进行所谓的“情绪分析”,使用自然语言解密软件来对社交网站和文本消息中的信息作出分析,用来帮助预测某个给定地区的失业率、支出削减或是疾病爆发等现象,其目标在于利用数字化的早期预警信号来提前指导援助项目,以阻止重新陷入贫困等困境。
五、大数据带来的挑战与启示
(一)大数据将使地球上所有人的隐私权受到挑战
随着互联网、移动互联网快速发展和3G手机的普及,我们每个人几乎每时每刻都在产生数据,而这些数据不再私有、不再神秘。也就是说只要我们上网和使用手机,我们的相关数据在毫无知晓的状态下被一些大数据公司收集。有人说iPhong就像一个“移动间谍” 是有道理的,因为它在用户不知情的情况下收集位置和无线数据后传回苹果公司,其它谷歌安卓系统和微软windows系统手机也都是一样的。当数据形成资源体现价值时,地球人所面临的共同问题是如何保护自己的隐私权。
这一棘手的问题,在具有强调集体轻个人的传统的中国,个人的隐私将会受到更大的威胁;即使是在具有完备法律保护隐私权的西方,面对大数据时代的到来,也颠覆了当下隐私权保护法以个人为中心的思想。特别是数据价值与作何用途,既使是收集者也无法事前告知,这是因为海量数据经过大数据挖掘,就会产生许多意想不到的新用途。因此,如何完善隐私权的法律体系与提高保护个人隐私权的伦理道德水平,成为了在大数据时代下夯实保护人类尊严和个人自由的基石。