有人把大数据形容为未来世界的石油,有人宣称掌握大数据的人可以像上帝一样俯瞰整个世界,美国政府甚至已经把对大数据的研究上升为国家战略。
我们正生活在一个充满“数据”的时代。大数据已经开始并将继续影响我们的生活,下面我们不妨试举几例。
精准广告投放已很普遍
很多女性可能有这样的经历,使用某浏览器在淘宝、京东等购物网站上购买过一本关于怀孕的书籍后,在之后十个月左右的时间里,你的浏览器两侧的广告栏里不断出现怀孕所需要的东西,如营养食品、对胎儿无影响的孕妇用药、胎心监测仪、体温计、血压计等产品广告,登录原来的购物网站,也会在首页向你推荐这类产品。而且,在十个月之后,你会发现,以上这些广告开始变成婴儿用品了。
你以前可能对浏览器广告非常讨厌,但对这类广告,你却欣然接受,因为它推荐的产品正是你所需要的。这实际上就是大数据应用的一个简单案例。你的浏览经历已经被浏览器和电商所记录,通过对用户浏览记录进行大数据分析,就可以推测出你目前是一种什么状态,今后又将经历哪些状态,于是,专为你定制的广告就在你需要的时候出现在你的眼前。
大数据最本质的应用就在于预测,即从海量数据中分析出一定的特征,进而预测未来可能会发生什么。实际上,上述例子仅仅是大数据应用的最初级阶段。
当不同的数据流被整合到大型数据库中后,预测的广度和精度都会大规模的提高。例如,当一个数据库从不同的数据来源获得了你使用手机的时间和地点、信用卡购物、银行卡电子收费系统、使用QQ等聊天工具的对象、你的QQ好友关系图、你在新浪微博、腾讯微博的收听及被收听关系图谱、你缴纳的水、电、燃气费等各方面的数据,数据分析师就能通过匹配获得你生活的不同侧面。通过大数据,数据分析可以发现各种各样的关联。通过分析,可以发现你多方面的需求,并不仅仅是诸如怀孕书籍和尿不湿之间的简单关联了。在数据足够“大”的情况下,你生活中几乎所有的需求都可能会被预测出来。例如,从数据分析出你可能会约会,于是会向你推荐衣服;从数据推测出你会出去旅游,于是向你推荐相关装备及旅行方式等。
医疗卫生体系会更加精密
通过分析大量用户的搜索记录,比如“咳嗽”、“发烧”等特定词条,谷歌公司能准确预测美国冬季流感传播趋势。和官方机构相比,谷歌能提前一两周预测流感暴发,预测结果与官方数据的相关性高达97%。
对个体而言,大数据可以为个人提供个性化的医疗服务。过去我们去看病,医生只能对我们的当下身体情况做出判断,而在大数据的帮助下,将来的诊疗可以对一个患者的累计历史数据进行分析,并结合遗传变异、对特定疾病的易感性和对特殊药物的反应等关系,实现个性化的医疗。还可以在患者发生疾病症状前,提供早期的检测和诊断。早期发现和治疗可以显著降低肺癌给卫生系统造成的负担,因为早期的手术费用是后期治疗费用的一半。
个性化教育可能真正实现
在大数据的支持下,教育将呈现另外的特征:弹性学制、个性化辅导、社区和家庭学习、每个人的成功……
举例来说,一个学生考试得了88分,这个分数仅仅是一个数字,它能代表什么呢?88分背后是家庭背景、努力程度、学习态度、智力水平等,把它们和88分联系在一起,这就成了“数据”。大数据因其数据来源的广度,有能力去关注每一个个体学生的微观表现——他在什么时候开始看书,在什么样的讲课方式下效果最好,在什么时候学习什么科目效果最好,在不同类型的题目上停留多久等等。
大数据支撑下的教育,就能根据每一个人的特点,解放每一个人本来就有的学习能力和天分。
延伸阅读
个人隐私保护 一道能迈过的坎
看了前面这些,读者可能要担心了,大数据有包罗万象的数据,其中不少数据涉及个人的职位、年龄、身体状况、消费水平、旅行习惯等隐私,那么,在大数据时代,个人隐私能够得到保护吗?答案是,只要国家相关部门实时推进隐私保护,企业主动落实隐私保护责任,大数据产业在飞速发展的同时并不会对民众隐私产生威胁。
在大数据产业中,有两个基本的做法,一是符号化。符号化是指识别用户的时候,识别的仅仅是一个“符号”,这个符号与真实信息并不相关,系统通过一定的算法能够知道多次登录的是同一个用户,但并没有办法反推出这个人是谁,因此,电话、住址等信息都没法与本人关联起来。二是用户特征。用户特征意味着在大数据时代企业感兴趣的往往是这个用户的特征,而不是家庭地址、电话号码等真正敏感的信息。例如,系统需要了解本科以上学历、月收入10000元以上、已婚等这样一个群体,只需要找出符合这些特征的人的特性,并不关心这个人是谁。这样也不会造成隐私的泄露。
当然,这些原则性问题有赖于政府推动、企业自律。
(综合中新社)
新闻推荐
外交部部长王毅14日在北京同美国国务卿克里举行会谈。双方就今年两国高层交往和对话机制以及各领域务实合作深入交换了意见,达成了广泛共识。王毅:不断积累中美关系正能量王毅...