涂子沛数据挖掘开始于哪一年起源于哪一年

12345678910
都在忙什么?
搜索配件:
&&价格区间:从
折扣价格¥48.30元
原价:¥69.00元 (7折)
最近30天销量:月销 98 笔
商品来源:
&购物咨询(商品客服):
由卖家 源创新图书专营店 从 北京 发货
推荐服务商:&&&&&&&&&&
双氙商品详情
商品标签云
买过的人评价...
★《亚洲周刊》“年度十大好书”,持续畅销;从0到1,开中国先河,领跑大数据时代最好的书, 经典之作——第一次详尽讲述“大数据浪潮”的来龙去脉;第一次深入解读“大数据时代”如何改变政府、商业和我们每个人的生活;第一次犀利阐明“数据”怎样推动民主进程……★&各界要人盛赞推荐——汪洋【中央高层人物】、柳传志【联想集团名誉主席】、任志强【中国房地产风云人物】、达文波特【全球顶尖的管理咨询大师】、许倬云【史学大家】、谢文【著名IT评论人】、薛海培【奥巴马总统大选亚裔事务顾问、美国华人全国委员会会长】、杨叙【英特尔全球副总裁、中国区总裁】、【中美10大高校著名学者】……各界要人盛赞推荐!★《大数据》,这里有“中国对手”——大数据浪潮,汹涌来袭。20世纪大萧条以来,美国作为世界强国的开放历史,数据技术浪潮的兴起过程,气势磅礴,波澜壮阔。真正读懂中国趋势,一定要先读懂美国。美国政府为什么能,中国到底缺什么?★《大数据》,这里有“中国建言”——哈佛大学商学院访问教授、全球顶尖的管理咨询大师达文波特,把脉经济,数据治国,专门为中国政经两界提示智库建言:“在很多领域,中国政府和中国的企业都有雄心勃勃的计划,这引起了全世界的关注,这些雄心和计划,现在应该拓展到大数据的领域。”★《大数据》,这里有“中国财富”——现代管理学之父德鲁克有言,预测未来最好的方法,就是去创造未来。商务智能、云计算、Facebook、推特、Web3.0、语义网……数据战争,就是未来之争!数据兴则企业兴,数据强则企业强!叫醒中国,超越中国模式的粗放式增长,迈向精细化的管理革命,大数据将是下一个社会发展阶段的“石油”和“金矿”。★《大数据》,这里有“中国致敬”——活着就为改变世界,只有偏执狂才能生存,不要以为乔布斯、盖茨、扎克伯格才这样。美国之为美国,还有坚持信息自由的新闻记者、发现摩尔定律的工程师、定义数据仓库的实业家、首倡普适计算的业余鼓手、鼓吹财政公开的民间活动家、倡导数据开放运动的青年学生,以及活跃在无数公民自治组织的普通个人。★《大数据》,这里有“中国问题”——回望中国,胡适批评“差不多先生”,黄仁宇求索“数目字管理”,我们的世界看起来雷打不动。大数据时代,挑战中国,摘不下“差不多先生”的文化标签,我们世界工厂还将是一个落后的100年!★《大数据》,这里有“中国乡愁”——大数据战略,重新洗牌全球格局:美国,再一次领跑世界;中国,却很可能再失良机而浑然不知!中国迷局如何解开?最具海归视野、近20年中美职业生涯的作者,从太平洋对面看到中美两国的差距,披露大量美国真实案例,最先为华文世界开启大数据重要话题,写成这本意在兴邦治国的战略之书,图文并茂,老百姓也看得懂。
《大数据》3.0升级精装版,增加作者自序,以及归国以来的演讲、专题——数据是我们新经济的土壤,是我们未来智能社会的土壤,数据可以治国,还可以强国。美国第一,中国第几?公布官员财产美国是怎么做的,美国能让少数人腐败起来吗?美国式上访是怎么回事?凭什么美国矿难那么少?全民医改美国做得到吗?美国总统大选有什么利器才能赢?下一轮全球洗牌我们世界工厂会被淘汰吗?……除了上帝,任何人都必须用数据来说话。大数据浪潮,汹涌来袭,与互联网的发明一样,这绝不仅仅是信息技术领域的革命,更是在全球范围启动透明政府、加速企业创新、引领社会变革的利器。现代管理学之父德鲁克有言,预测未来最好的方法,就是去创造未来。而“大数据战略”,则是当下领航全球的先机。大数据,这一世界大潮的来龙去脉如何?数据技术变革,何以能推动政府信息公开、透明和社会公正?何以促发行政管理和商业管理革新,并创造无限商机?又何以既便利又危及我们每个人的生活?Google、百度之类搜索服务,何以会不再有立足之地?引领世界的数据帝国——美国和西欧,正在如何应对大数据时代?我们中国,又当如何作为?本书通过讲述美国半个多世纪信息开放、技术创新的历史,以别开生面的经典案例——奥巴马建设“前所未有的开放政府”的雄心、公共财政透明的曲折、《数据质量法》背后的隐情、全民医改法案的波澜、统一身份证的百年纠结、隐私危机、街头警察的创新传奇、美国矿难的悲情历史、商务智能的前世今生、数据开放运动的全球兴起,以及云计算、Facebook和推特等社交媒体、Web3.0与下一代互联网的未来图景等等,为您一一细解,数据创新给公民、政府、社会带来的种种挑战和变革。美国是全书主体,但又处处反观中国当下的现实。回望中国,胡适批评“差不多先生”,黄仁宇求索“数目字管理”,作者从太平洋对面看到中美两国的差距,深知中国缺少什么、需要什么,故将十多年观察、思索所得,又新增微学校、微学位等教育领域正在发生的革命,以及建言中国“大数据战略”的重要文章和访谈,淘洗成这本开创性的“大数据之书”——《大数据:正在到来的数据革命,以及它如何改变政府、商业与我们的生活》。
涂子沛,著名信息管理专家,江西吉安人,曾在美国学习、工作多年,2014年12月从美国硅谷回国,出任阿里巴巴集团副总裁。本科毕业于华中科技大学计算机系,研究生就读于卡内基梅隆大学,获公共管理硕士和信息技术科学硕士学位。赴美留学前,曾在武警部队和公共部门磨砺10年,深刻洞悉中美两国的科技动态和文化理念。作者还先后担任上海真爱梦想基金会理事、中国旅美科技协会副主席等职务,并在国内多所大学有客座教职。《大数据》这本书在中国社会开大数据之先河,引发了对大数据战略、数据治国和开放数据的讨论,被盛赞“为华文世界开创了一个重要话题”。 作者的另一本著作《数据之巅》,提出当前信息技术的发展,已经让中国获得了后发优势,中国要在大数据时代的全球竞争中胜出,需要把大数据从科技符号提升成为文化符号,在全社会倡导数据文化。
第三版自序&&数据可以治国,还可以强国序言一&&大数据:为华文世界提出一个重要话题/许倬云序言二&&中国的雄心应该拓展到大数据领域/达文波特&【序幕】新总统的第一天一人一票:把“黑”人送进“白”宫大国新政:阳光是最好的防腐剂&【上篇】帝国风云:得数据者得天下——美国的成功经验第一章 &历史争战《信息自由法》1-1.第四股力量:知情权的起点1-2.国会议员:孤独的战争1-3.白宫当家人:一个妥协者和机动者1-4.政府VS.&社会:旧剧情重现新时代&第二章 &数据帝国的兴起2-1.摩尔定律:全世界半个世纪的发展规律2-2.最小数据集:上升到立法高度的开路先锋2-3.民意几时有:选票催生的创新2-4.普适计算:计算机本身将从人们的视线中消失2-5.“大数据”战略:争夺全世界的下一个前沿&第三章 &数据治国3-1.循“数”管理:平安大道怎样铺3-2.数据“验”平权:民权史上的碑石3-3.数据“打”假:最大的争议就是福利滥用pStat:街头警察的创新传奇&第四章 &商务智能的前世今生4-1.起源:从数据到知识的挑战和跨越4-2.结蛹:数据仓库之厚积薄发4-3.蚕动:联机分析之惊艳4-4.破茧:数据挖掘之智能生命的产生4-5.化蝶:数据可视化的华丽上演&【中篇】法则博弈:大数据时代的发展与危机第五章 &帝国的法则5-1.收集法则:减负,为人民减负5-2.使用法则:隐私,文明社会的共识5-3.发布法则:免费,人民已经交税5-4.管理法则:质量,互联网时代的根本&第六章 &《数据质量法》的困局6-1.产业界“俘虏”政府:数据背后的政经战争6-2.美式“旋转门”:权、名、利大串场6-3.“掺沙子”法案:国会对付总统的独门秘器6-4.环保“风险门”:公共利益常常无人代表6-5.集体行动的逻辑:人人都想“搭便车”6-6.三权之歧:什么是真正的“和谐”&第七章 &全国隐私风波7-1.《一九八四》:零隐私的恐惧7-2.大数据就是“老大哥”:中央数据银行之争7-3.百年纠结:统一身份证7-4.“9&11”大拐点:以反恐的名义向左转7-5.万维信息触角计划:追踪恐怖分子的“数据脚印”7-6.6种改变政府的力量:山姆大叔大退让&【下篇】公民故事:公民社会与数据互动之双赢时代第八章 &数据开放运动8-1.一个新的世界:从软件开源到数据开放8-2.总统的雄心:公共财政支出透明8-3.数据民主:印裔首席信息官的崛起8-4.Data.Gov:从旗舰初航到保“数”运动8-5.大众创新:航班延误之候机经济学&第九章 &试金石:白宫访客记录9-1.总统在见谁:大医改中的“小”插曲9-2.全体美国人的房子:白宫9-3.步步妥协:总统与草根的对决9-4.从白宫安保到政治监督:执著的公民改变世界&第十章 &矿难中的歌声和数据10-1.集体行动的号角:你站在哪一边10-2.可以避免的悲剧:数据揭示的全景式真相10-3.默认公开推定:和矿难赛跑的原则10-4.唯一的道路:民主时时都要“争”&【外篇】天下趋势:大数据社会未来之世界走向第十一章 &大趋势11-1.数据权:大不列颠的硕果11-2.大合流:&国际开放联盟11-3.云计算:新的航向11-4.再造互联网:从网页相连到数据相“联”&第十二章 &大挑战12-1.逐鹿政坛:得数据者得天下12-2.数据竞争:企业赢之道12-3.下一波浪潮:从大数据到大社会&第十三章 &大变革(2.0升级版新增)13-1.微学位:教育领域正在发生的革命13-2.大数据:再谈教育领域正在发生的革命13-3.微学校:三谈教育领域正在发生的革命&尾声 &挑战中国:摘下“差不多先生”的文化标签大事记 &&20世纪大萧条后美国信息开放、技术创新之路后记 &搭建“大数据”的世界建言 &中国如何应对大数据时代的挑战(升级增补)访谈 &大数据时代的“中国梦”(升级增补)演讲&&&大数据、大计算:新经济的土壤(升级增补)专题&&&什么是“数据的外部性”?(升级增补)索引&&(升级增补)
【新版自序】数据可以治国,还可以强国今年春节期间,出版社告诉我,作为中国大数据领域的开山之作,《大数据》很受欢迎,他们希望满足市场的需求,推出第三个版本,嘱咐我写点东西。之所以受到欢迎,可能是因为独树一帜。一提到大数据,很多人的第一反应,是数据在商业领域中的作用,所津津乐道的,也是精准营销,即通过数据分析增强对用户的洞察、扩大营销收入。但本书所强调的,却是“数据不仅可以治国,还可以强国”。数据治国,是指要凭借对数据的有效收集、处理和分析来治理国家,决定国家的大政方针和具体政策。从定义看,数据是对客观世界进行量化和记录的结果。量化,是人类进行科学研究最根本的手段,就此而言,数据治国也可以理解为“用定量分析、实证研究的科学方法来治理国家”。此外,数据表示的是过去,关注、表达的却是未来。数据之中蕴藏着社会发展的规律,“数据治国”的提法,也暗含着“人类可以更好地把握未来”之意。回顾人类的历史,任何一个国家的治理,都需要参照数据,但由于信息技术的进步、记录手段的普及,物理世界的状态、个人的社会行为得到了前所未有的记录,这种记录的粒度越来越细、维度越来越多、频度越来越密,形成了“大数据”。今天的数据治国,含义远远超出了“参照数据”。例如,当前国人关心的头号问题,莫过于空气质量。要解决好这个问题,从环境的监测、传感器的安装,到空气标准的设立、污染原因的分析,再到高污染、高能耗、低产值传统产业的转型,和智能电网、智能电表的使用和普及,整个治理链条都贯穿了数据。又例如交通拥堵,如今很多城市,立交桥高达三四层、地铁线也在快速扩张,却赶不上车辆增加的速度,在资源增长、空间有限的情况下,唯一的出路,是用好大数据,对城市的状态进行实时的分析和预测,不断优化现有资源的使用情况。还有当下智慧城市的建设,大数据的作用可谓重中之重。今天的政府,无论是东方、西方,都有人在不断尝试,试图把“凭借数据来治理社会”的模式推到极致。本书第七章“全国隐私风波”重点阐述了十几年前美国各方力量围绕“万维信息触角计划”(TIA)产生的纠结和较量。2002年,在国防部长拉姆斯菲尔德、海军中将波因德克斯特的主导下,美国国防部高级项目研究所(DARPA)试图建立一个超级数据库,把全社会每一个人的基本资料、信用卡交易信息、医疗保险记录、出入境记录、航空和酒店信息、电子邮件、电话记录、网络搜索记录等等数据都整合到一起,然后通过数据挖掘和监控,在大量的信息当中发现“信号”,实现有效的社会治理和管控。这个计划,因为可能侵犯公民的隐私,在美国国会不断受阻,但美国国防部却屡次变换名目、暗中推动项目进展。这段历史,堪称2013年“斯诺登事件”的前传,因为后来大面积曝光,最终震惊世界。西方不亮东方亮。这期间,新加坡的国防部长PeterHo在美国访问,他获知万维信息触角计划之后,大为赞赏。不久后,该计划在美国触礁流产,波因德克斯特被迫辞职,新加坡却重金引进了这个项目组的一批人员,并聘波因德克斯特为国防部顾问,视为上宾。在波因德克斯特的指导下,新加坡快速建立了一套万维信息触角,命名为“风险评估和全景扫描”(RAHS)。RAHS最初的目的,是通过全社会的数据联通和挖掘,在错综复杂的社会现象中发现恐怖袭击、流行病疫情等突发事件的“信号”,达到未雨绸缪、有效治理的目的。之后,由于行之有效,新加坡政府将系统不断扩大,推广到经济、文化、社会管理的种种领域。房屋管理局用它来了解人们对于住房体系的批评和期待,人口部门通过它掌握大众的生育态度变化,旅游部门用它来预测各地游客数量的周期,食品部门通过它决策是否应该减少对进口食品的依赖等等。从这个角度说,新加坡是数据治国的一个实验室,它不仅将大数据用于情报和反恐,还用于构建和谐社会。在中国,特别要强调的是,数据治国不是“数字治国”。一些官员一谈起辖区人口面积、GDP增长幅度、项目投资多少、惠及领域若干、利税增加几何都有“数”在胸,还特别喜欢用“三项原则”、“五个重点”、“八项规定”等等数字范式对工作进行总结,各项工作的考核也都与数据挂钩,大有唯“数据”盛行之势。这不是不好,但这些都是孤立的、静态的数字,并不是“数据治国”的真义。大数据时代,数据治国更关注的是动态的数据、系统化的数据,以不间断“流”的形式存在的、成片的、活的数据,它们应该成为公共决策的资源为政府和社会所广泛使用。归根结底,公共决策最重要的依据将是系统的、成片的、动态的数据流,而不是个人经验或长官意志,过去深入群众、实地考察的工作方法虽仍然有效,但对社会治理而言,系统采集的数据、科学分析的结果更为重要。我认为,数据不仅可以治国,还可以强国。其中的原因,是因为数据正在成为各行各业最重要的创新资源。以农业为例,来自天气、土壤和农作物的数据,可以实现自动化的灌溉、防治虫灾、决定如何种植和收割、节省水利资源、提高单位产量;在教育领域,以大数据为基础的在线智能学习平台(MOOC),可以突破教室的限制,让成千上万的学生同时得到个性化的教学和辅导;再以医疗领域为例,IBM公司的Watson系统可以快速地检索几百万名患者的病例、最新的医疗研究报告和成果,做出更快、更准确的诊断;工业领域更不待言,汽车、飞机正在被大数据改造,成为无人驾驶汽车、无人驾驶飞机;还有金融领域,利用电商平台的交易数据,“阿里小贷”可以在几分钟之内判断企业的信用,为近百万小微企业发放贷款。今年年初,阿里巴巴又推出了基于个体消费者的“芝麻信用”,用的创新资源还是数据。一百年前的美国,用了几十年的时间才建立全民信用体系。因为拥有无处不在的充沛数据,今天中国的全民信用体系可能在更短的时间内、以更低的成本就可以建立起来。毫不夸张地说,基于数据的创新将带动人类社会的各个领域都实现巨大的飞跃,这种飞跃是前人难以想象的。今天的年轻人面临的创新机会要远远多于前几代人,因为他们拥有人类有史以来最伟大的创新资源:数据。和其他的创新资源相比,数据之所以伟大,是因为它不会被它所激发的思想和创新所消耗,它可以重复使用,可以同时被无数人使用,此数据和彼数据整合,还可以产生新的价值和效用。在空间的拓展中和时间的延伸中,数据的能量将在人类社会层层放大,数据的不断积累是资源和知识的持续增加。但要成就数据的“伟大”,还有个前提,这就是数据的开放。正是出于这个原因,本书用了相当的篇幅来讨论“开放数据”。对于“开放数据”,中国社会目前还存在不少误解。一是将开放等同于公开,其实开放和公开是两个完全不同的概念。公开是信息层面的,是一条一条的;开放是数据库资源层面的,是一片一片的。开放数据,指的是将原始的数据及其相关的元数据以可以下载的电子格式让第三方自由使用。开放也不一定代表免费,因为开放是有成本的,企业可以以收费的形式开放数据。开放也可以有层次、有范围,针对某个特定的组织和群体开放,不一定面对全体社会大众。开放数据之于当下中国社会的意义,在于推动知识经济和网络经济的发展,在于促进中国经济由粗放向精细、从“制造”向“创造”的转型升级,在于释放社会生产力、催生创新。通过开放更多的数据,让创新的资源自由地流动,李克强总理提出的“大众创业,万众创新”才能更快、更好地在中国大地形成燎原之势。大众创新、创业的趋势,也可以在美国社会的发展过程中观察到。根据美国科学基金会(NSF)的数据,1981年,大公司(超过25000人)的研发投入占全美研发投入的70%,可谓主导了美国的创新;到2007年,大公司的研发投入仍然在上升,但格局却发生了改变,尽管绝对数量增长了4倍,其占全美研发投入的比例却下降到35%。同期,1000人以下小公司的研发投入增长了50倍,其占全美的比例从1981年的4%上升到2007年的24%。这些数据表明,研发和创新呈现分散化,在向小公司和个人转移,其中最根本的原因,就是知识、信息特别是数据资源的深度开放,不再受大公司、大组织的垄断,不再是精英阶层的专利。文化靠沉淀,文明靠创新。创新,才是一个国家持续发展、不断迈向强大的真正动力。今天的中国,创新已经成为共识。就此而言,数据强国我们正在路上。记得《大数据》首版上市,是2012年7月。当时我在美国,半年多之后,美国才出版了第一本有影响力的专著《大数据时代》,比中国晚了整整半年。抚今追昔,我感叹不已,新的思想和观念在全球自由地流动,在奔涌的浪潮之中,我也从美国硅谷回到了中国的杭州。除了增补自序、重要的专栏文章以及我在第一届世界互联网大会上的演讲等,本版还增加了索引。一本好书不能没有索引,这是我一直的观点。几经曲折,《大数据》第三版终于加上了索引,除了出版社的支持,还要感谢冯启娜、赵瀚林、陈竞芬等志愿者,因为他们的协助,这个心愿得以达成。&涂子沛日于杭州
这几天,我看了两本书,其中有一本是广西师范大学出版社出版的,一个在美国的华人涂子沛写的《大数据》,看以后非常有启发。/中国人数据意识的淡薄由来已久,甚至可以称之为国民性的一部分。/我希望大家能认真读一读这本书,带着问题读,带着想法读。——汪洋&[中国高层人物]&涂子沛先生能为大数据推动社会进步作出贡献,功莫大焉。——柳传志&[联想集团有限公司董事局名誉主席]&在很多领域,中国政府和中国的企业都有雄心勃勃的计划,这引起了全世界的关注,这些雄心和计划,现在应该拓展到大数据的领域。涂子沛先生的《大数据》这本书,将在这个重要的领域,为中国政府和企业的努力提供引导和帮助。无论是对中国政府,还是就中国的商业组织而言,《大数据》都是一本重要的书。——托马斯&H.&达文波特&[全球顶尖的管理咨询大师、哈佛大学商学院访问教授、巴布森学院总统杰出奖教授]&在极权的国家,他们手上拥有足够的资讯,足以利用这资讯,掌握每一个人的日常生活;“老大哥”的影子,可以无所不在……涂子沛先生《大数据》这部书,清楚地叙述了资讯时代对我们生活的影响与社会的控御力。他讨论的范围方方面面、极为广泛。我们要对涂子沛先生致敬与致谢,因为他为华文世界提出一个重要的话题。——许倬云&[史学大家、匹兹堡大学历史系荣誉讲座教授]&《大数据》从奥巴马建设“前所未有的开放政府”出发,描写了半个多世纪以来数据对美国社会政治、商业、文化等方方面面的影响,谈及了1930年以来历任美国总统,可谓波澜壮阔。涂子沛作为科技业的精英,并没有将自己眼光和生活局限于技术之上,他对美国社会的独到观察和理解、对华人社区工作的积极参与和贡献,都是促成本书成为一本佳作的重要原因。——薛海培&[奥巴马总统大选亚裔事务顾问、美国华人全国委员会会长、凤凰卫视时事评论员]&《大数据》这本书讲述了数据技术浪潮的兴起过程,回顾了近一个世纪以来美国作为一个世界强国的开放历史,气势磅礴。从书中可以看到,美国的发展动力,正是开放和创新。我们正在向个性化的智能互联网时代迈进,计算力的扩展正在不断加速,数据将成为我们最强大的创新动力。——杨叙&[英特尔全球副总裁、中国区总裁]&《大数据》是一本视角独特、取材新颖、别开生面的好书。它以数据为轴线,描绘了美国走过的开放创新历程。从该历程中我们看到,数据挖掘是一种知识生产过程,从中产生创新,产生管理,产生推动社会变革的理论与实践。更有意思的是,美国政治的发展,公民权利的实现,以及各种自由与福利的保障,都和对数据的创造性应用密切相关。这对已经步入信息时代的中国,尤其有借鉴意义。趋势所在,数据乃大。涂子沛先生的专业性分析和介绍,是一项创造性的工作。——郭巍青&[中山大学政治与公共事务管理学院教授]&大数据具有催生社会变革的能量。但释放这种能量,需要严谨的数据治理、富有洞见的数据分析,以及一个激发管理创新的环境。涂子沛的《大数据》这本书总结了美国的经验和实践,并为中国提出了一个路线图。我为他的成就感到骄傲。这本书完整地融合了技术、政治、商业三个角度,体现了我们学院师资教学的独特优势。我相信本书会在中国激发新的思想和讨论,帮助中国迎接大数据的挑战。——Ramayya Krishnan &[卡内基梅隆大学海因兹学院及信息管理学院院长、终身教授]&通过历史故事的讲述,用近似新闻评论的笔法,《大数据》这本书以美国为例介绍了由经验管理到数据管理这场正在发生的革命性变革,通俗形象地讲清楚了科学的道理,实属难得。这对学者们扩大视野,对管理干部深化科学发展观的认识,都有十分重要的价值。——薛华成&[中国管理信息系统的主要开创者、澳门科技大学行政与管理学院名誉院长]&《大数据》这本书揭示了数据在未来社会中的革命性作用。大数据将是下一个社会发展阶段的“石油”和“金矿”。无论是个人、企业还是国家,谁能更好地抓住数据、理解数据、分析数据,谁就能在下一波的社会竞争中脱颖而出。关于数据的知识,将成为个人知识结构中的必备要素和基础。——施伯乐&[复旦大学计算机研究所所长、上海(国际)数据库研究中心主任]&18世纪启动的工业革命为人类创造了巨大的财富,也极大地推动了社会变革。20世纪中启动的信息革命对人类社会也将产生巨大的冲击,而这个进程刚刚开始。涂子沛先生所著的《大数据》一书,用有趣的故事带我们回顾信息时代的里程碑,使我们透过未来的变幻不清的迷雾,展望和畅想信息革命的大趋势。——董洁林&&[苏州大学企业创新和发展研究中心主任、教授]&《大数据》值得仔细阅读与思考。要让数据更好地说话,既依赖于数据科学与技术的发展,更需要政府、机构和公民的数据意识的不断提高。——汪小帆&[上海交大电子信息与电气工程学院教授]&数据科学正在成为一个新兴的学科和领域。涂子沛先生的《大数据》这本书,为我们揭示了大数据浪潮发生的前因后果,以及这种技术进步对政治、经济、文化的种种影响。希望读者从本书中获益,以积极的态势应对中国的大数据挑战。——张晖 [卡内基梅隆大学计算机系终身教授]
在线试读部分章节
【“大数据”战略:争夺全世界的下一个前沿】联邦政府的每一个机构和部门,都需要制定一个应对“大数据”的战略。——《规划数字化的未来:美国总统科学技术顾问委员会给总统和国会的报告》2010年&业务工作的管理数据,民意社情的调查数据,以及对大自然、动植物的特点和变化进行监控而产生的环境数据,是联邦政府的三大数据来源。这三种数据,其发展各有先后,收集方式各不相同,数据量也大小不一。它们之间,存在着一些交叉和重叠,有一些民意调查的数据,是业务数据,而一些因环境监控产生的数据,也可以是业务工作的数据。由于无线传感器的快速普及,环境数据增长得最快,成为联邦政府数据量最大的来源。虽然环境数据增长得最快,但这三种数据,其实都在爆炸。这种爆炸,并不仅仅是数量一个维度的。2001年,著名的高德纳咨询公司(Gartner)在一份研究报告21中指出,数据的爆炸是“三维的”、是立体的,这三个维度,主要表现在以下三个方面:一是同一类型的数据量在快速增大;二是数据增长的速度在加快;三是数据的多样性,即新的数据来源和新的数据种类在不断增加。数据的爆炸性增长,也不仅仅限于联邦政府。如前文所述,2011年麦肯锡公司在其研究报告《大数据:下一个创新、竞争和生产率的前沿》中指出,在美国,仅仅制造行业就拥有比美国政府还多一倍的数据,此外,新闻业、银行业、医疗业、投资业、零售业都拥有可以和美国政府相提并论的海量数据。哈尔&范里安(HalVarian)是谷歌的首席经济学家,也是美国研究信息经济学的著名学者。2000年,他对数据和信息产生的速度进行了研究,他认为,人类社会每年产生的信息量,实在太大了,已经没办法用准确的方法来计算现有的数字信息总量,只能估算。他估计2000年新产生的数据量为1000拍到2000拍。但到2010年,仅仅全球企业一年新存储的数据量就超过了7000拍,而全球消费者新存储的数据量约为6000拍。这种数据量的增长,已经大大超出了人类的预期和想象。时至今日,数据已经像“洪流”一样,在全球的政治、经济生活当中奔腾。而且,随着信息技术的普及和进步,新的支流还在不断产生,各个支流流动、交汇和整合的速度,还在继续加快。作为美国社会的信息枢纽,联邦政府当然要正面迎对这个挑战。2010年12月,总统行政办公室下属的科学技术顾问委员会(PCAST)、信息技术顾问委员会(PITAC)向奥巴马和国会提交了《规划数字化未来》的专门报告,该报告把数据收集和使用的工作,提到了战略的高度。这个报告列举了5个贯穿各个科技领域的共同挑战,报告指出“每一个挑战都至关重要”,而第一个挑战就是“数据”问题。报告说:“如何收集、保存、维护、管理、分析、共享正在呈指数级增长的数据是我们必须面对的一个重要挑战。从网络摄像头、博客、天文望远镜到超级计算机的仿真,来自于不同渠道的数据以不同的形式如潮水一般向我们涌来。这些数据以不同的格式存储在不同的环境中,有的在计算机的硬盘里,有的在数据仓库之内。如何保证这些数据现在、将来的完整性和可用性,我们面临着很多的问题和挑战。如何使用这些数据,则是另外一个挑战……应对好这些挑战,将引导我们在科研、医疗、商业和国家安全方面开创新的成功。”在报告中,两个委员会还例举了美国癌症研究所以及中央情报局如何通过收集海量数据、建立数据仓库、实施以数据挖掘为核心的自动分析技术,获得了出人意料的创新和成功。委员会一致认为,如何有效地利用数据将贯穿所有科技领域的挑战。最后,两个委员会向奥巴马建议:联邦政府的每一个机构和部门,都需要制定一个“大数据”的战略。其实,“大数据”这个名词并不新鲜,早在1980年代,美国就有人提出了“大数据”的概念。20多年来,各个领域的数据量都在迅猛增长,美国的企业界、学术界也不断地对这个现象及其意义进行探讨,“大数据”这个名词变得越来越流行、越来越重要,最后成为了国家和政府层面的发展战略。之所以要称之为战略,是因为“大数据”之“大”,并不仅仅在于其“容量之大”。当然,由于数据容量的爆炸,数据的收集、保存、维护以及共享等等任务,都成为具有研究意义的现象和挑战。但“大数据”之“大”,更多的意义在于:人类可以“分析和使用”的数据在大量增加,通过这些数据的交换、整合和分析,人类可以发现新的知识,创造新的价值,带来“大知识”、“大科技”、“大利润”和“大发展”。如前文所述,数据,是记录信息的载体,是知识的来源。数据的激增,意味着人类的记录范围、测量范围和分析范围在不断扩大,知识的边界在不断延伸。2007年,雅虎的首席科学家沃茨博士在《自然》上发表了一篇文章《21世纪的科学》22,他发现,得益于计算机技术和海量数据库的发展,个人在真实世界的活动得到了前所未有的记录,这种记录的粒度23很高,频度在不断增加,为社会科学的定量分析提供了极为丰富的数据。由于能测得更准、计算得更加精确,他认为,社会科学将脱下“准科学”的外衣,在21世纪全面迈进科学的殿堂。例如,新闻的跟帖、网站的下载记录、社交平台的互动记录等等都为政治行为的研究提供了大量的数据,政治学这门古老的学科,将登堂入室,成为地道的“科学”。麻省理工学院的教授布伦乔尔森(Erik Brynjolfsson)则比喻说,大数据的影响,就像4个世纪之前人类发明的显微镜一样。显微镜把人类对自然界的观察和测量水平推进到了“细胞”的级别,给人类社会带来了历史性的进步和革命。24 而大数据,将成为我们下一个观察人类自身社会行为的“显微镜”和监测大自然的“仪表盘”。这个新的显微镜,将再一次扩大人类科学的范围,推动人类知识的增长,引领新的经济繁荣。麦肯锡全球研究所在其2011年的报告中最后概括说:大数据,将成为全世界下一个创新、竞争和生产率提高的前沿。抢占这个前沿,无异于抢占下一个时代的“石油”和“金矿”。日,奥巴马政府又进一步推进了其“大数据”战略。奥巴马的高级顾问、总统科学技术顾问委员会(PCAST)的主席霍尔德伦(John Holdren)代表国防部、能源部等6个联邦政府部门宣布,将投入2亿多美元立即启动“大数据发展研究计划”(Big Data Research and Development Initiative),以推动大数据的提取、存储、分析、共享和可视化。霍尔德伦也是哈佛大学肯尼迪政府学院的知名教授,他在讲话中表示:像美国历史上对超级计算和互联网的投资一样,这个大数据发展研究计划将对美国的创新、科研、教育和国防产生深远的影响。奥巴马则强调联邦政府必须和公司、大学结盟,全民动员(All Hands on Deck),来应对“大数据”时代的挑战。&【大挑战——逐鹿政坛:得数据者得天下】“政治技术决定政治成败。“——莫顿&布莱克韦尔,美国政治活动家日,奥巴马以电子邮件和视频的方式,正式宣布自己将参加2012年的总统竞选、争取连任。4年多以前,2007年2月,他在广场上的人潮中宣布了自己将参选总统的决定。作为代表伊利诺伊州的联邦参议员,他选择了位于该州首府的议会广场作为集会地点,这里曾经是林肯总统发表演讲的地方。奥巴马在凛冽的寒风中,面对沸腾的人群和高声喝彩,发表了近一个小时的演讲,随后开始了他长达一年多的大选征程。但这一次,没有簇拥的集会、鼓动的口号和大幅的标牌,一切都由网上的点击,在瞬间平静地完成。另外几位热门人选,如前麻省州长罗姆尼(Mitt Romney)、前众议院议长金里奇(NewtGingrich)也先后用推特(Twitter)和脸谱(Facebook)正式宣布了他们的参选意愿。而通过集会拉开竞选的序幕,原本是美国上百年的政治传统。有评论说,这表明,脸谱、推特和视频分享网站的发展已经深刻地改变了美国的政治生态,新的传统正在形成。还有评论指出,这次总统大选,是民主、共和两党都充分认识到社交网站重要性之后的第一次大选,技术对政治的作用将前所未有地凸显。回顾历史,从上个世纪30年代的广播,到60年代的电视,再到本世纪初的互联网,技术一直在美国的政治生活中扮演重要的角色,甚至决定选举的成败。互联网出现之后,就交流和互动而言,广播和电视无疑相形见绌。和它们相比,网络能提供一种没有强权的、多中心的、双向的甚至多向的信息交流方式,这一改广播、电视单向交流的不足,使候选人和选民之间的互动方式发生了深刻的改变。如果说2008年的大选,是一场关于网络技术“用多”还是“用少”的较量,那么2012年的竞争,工具本身已经不再是竞争的优势。因为,近4年来,民主、共和两党都鼓励本党的政治家把网络作为必争之地,网络的重要作用已经得到了政治家的一致重视。共和党曾经发起“新媒体挑战”(New Media Challenge)的竞赛活动,以网络上粉丝的增长速度为衡量标准,鼓励党员集聚网络人气。比赛进行了一个半月,最后来自路易斯安那州的众议员佛兰芒(John Fleming)夺得了第一名。民主党当然不甘落后,也举办了类似的“在线政治明星”评比活动。也就是说,两党的主要竞争者都在大规模地使用网络。竞争的重点已经不是“用不用”的问题,而是“如何用”、“用得好不好、巧不巧”。互联网在政治竞选中的主要功能有两个,一是交流,候选人通过它和选民展开个性化的实时对话、收集采纳民意,并为自己的政治主张寻找支持;二是动员,通过它发动草根力量,完成召集志愿者、募款、造势等关键的选举活动。当前,谁能把网络交流和动员这两个功能发挥得更好、运用到极致,其竞争的核心和重点,就是数据。可以说,这是一场数据竞争。数据收集、分析和整合的能力已经成为技术和网络竞争的关键所在。2008年,奥巴马通过他的个人竞选网站()收集了1300万人的个人信息和邮件地址,这曾经是他在交流规模上无可比拟的优势。但和2008年相比,如今的脸谱等社交网站已经不仅仅是个交流平台,还是一个记录了8亿人资料的开放“信息港”,第三方可以在上面开发新的应用并与其现有的数据直接相联,这为其他候选人提供了超越奥巴马的可能性。奥巴马在宣布再参选以后,立即重新改版了他的个人网站。支持者一登录,便被要求提交其社交网站的账号,并询问是否能够读取其在社交网站上的档案信息,甚至索要在用户社交网页上发布消息的授权。这些举措,招招式式都是为了获取更多、更翔实完备的选民数据。其他候选人当然也不甘落后,几乎每个候选人都先后推出了自己的网站,个别候选人甚至不惜重金,用送出纪念品的形式来鼓励选民把自己的账号和社交网站的账号挂钩相连,其目的都是为了扩展自己的数据容量,扩大未来与选民交流的规模。与交流规模相比,交流的质量更为重要。大规模发送信息并不难,但只有挠到接收方痒处和痛处的信息才可能引起真正的关注。这就要求发送方必须了解信息受众,而不是简单地“群发”。这个方面,奥巴马已经有教训和体会。日,美国国会在为是否提高国家债务的上限进行激辩。奥巴马一天内连接发出十多个推特(微博),要求他的粉丝采取行动、给议员施压,催促他们通过提高债务上限的提案。但当天晚上,奥巴马的推特就流失了33000多名粉丝。奥巴马的技术团队随后对此进行了调查,发现其中的原因,正是很多人对这个话题不感兴趣,认为“总统在给他们发送信息垃圾”。奥巴马的团队正在全力提高数据细分的能力。例如,堕胎问题一直是两党辩论的热点,奥巴马如果能在辩论之时,锁定35岁以下的女性进行信息交流,就可能形成稳定的观点联盟,造成声势。又比如,一谈到养老金问题,50岁以上的老人将成为第一目标群体。除了性别、年龄之外,选民还可以按地域、种族、教育程度、宗教信仰等其他维度来划分,这些维度,还可以交叉,交叉分析的维度越多,信息受众就能分得越细、瞄得越准,信息交流的效率也就越高。此外,除了数据的细分,还可以通过数据模型预测不同选民的不同需要和行为模式,最终把个性化的短信和视频通过互联网或手机送达特定的群体。除了交流,成功的动员也离不开有效的数据支持。研究表明,选举动员的重点是争取“墙头草”或“中间派”,最有效的方式是派出志愿者上门游说,这可能将选票拉升几个百分点,在势均力敌的情况下,成为胜出的关键。如果能掌握这类“中间派”人士的基本信息甚至个人喜好,志愿者的登门游说就能有的放矢、事半功倍。所以如何在网上确定这个群体、获取他们的数据,是决定动员效率的一个关键。此外,通过不同数据库之间的分析和整合,为毕业于同一个学校、居住在同一个地区甚至拥有同一个爱好或观点的志愿者建立新的网络联系体,让支持者感觉同声同气、彼此相连,也能极大提高动员的效率和士气。围绕数据细分的这些精细化的应用,可谓多不胜数。这种基于数据的选民细分方法,也被称为“纳米定位”(Nanotargeting) 。当然,奥巴马能否最终当选,还取决于政治、经济、社会等等诸多方面的因素,但如果仅仅从技术层面来考虑,这一仗争的是数据,比的是数据收集、分析以及整合的能力。从这个意义上来说,得数据者得天下。这种基于数据的竞争,当然不仅仅局限在政治选举的领域。其实,早在2008年奥巴马当选总统之前,商业领域的数据竞争现象就引起了学界的研究和关注。&【大数据就是“老大哥”:中央数据银行之争】“我们有很多小的、独立的信息记录系统。这些系统,就单个而言,它们可能无关痛痒,甚至是很有用的、完全合理的。但一旦把它们通过自动化的技术整合连接起来,它们就会渐渐蚕食我们的个人自由。这才是真正的危险。”——美国隐私研究委员会,年,人类的计算模式还仅仅处在第一个阶段——主机时代,这种危险和担心就开始初现端倪。那个时候,现在白宫的行政管理预算局(OMB)还叫预算局。预算局提出了一个简单、大胆、在当时堪称革命性的创新计划。该局建议,联邦政府应该成立一个统一的“数据中心”,把政府部门所有的数据库连接、集中、整合起来,建立一个大型的数据库。预算局相信,这不仅能节约硬件成本,还能提高数据管理、查询和统计的效率;此外,通过部门之间的数据对接和整合,还可以提高数据的准确性和一致性,减少数据的错误。预算局甚至为这个计划提出了具体的实施方案:人口普查局、劳工统计局、税务局以及社保局等4个数据密集型部门先行一步,首先将数据库连接起来,其他各个部门的数据库逐步纳入,最终的目标是,以公民为单位,为全国每一个人建立一个数据档案,这个档案将包括每一个人教育、医疗、福利、犯罪和纳税等等一切从摇篮到坟墓的数据记录。预算局将这个大型数据库称为“中央数据银行”。普林斯顿大学的高等研究院(IAS)是全世界最顶尖的研究机构之一,它的特点,是可以不屈从任何行政的任务和资金的压力,自主开展纯粹的科学研究。时任该研究院主任的是凯森教授(Carl Kaysen),他盛赞这是一个划时代的计划。凯森发表了专门的可行性报告,指出统一管理不仅能节省运营成本、提高数据的准确性和查询的效率,还将更好地保障数据安全。听起来有百利而无一弊,中央数据银行的计划得到了行政圈、学术界的一致响应。经过一年的论证,1966年,联邦政府正式向国会提交了“中央数据银行”的方案,请求拨款、开工,开创新的数据管理篇章。新闻界也开始报道联邦政府的这个创举。但没想到,新闻界的报道引起了强烈的社会反弹。这种反弹,最后导致了这个计划的流产。1967年1月,《纽约时报》发表了著名记者、隐私权专家帕卡德(Vance Packard)的文章《不能告诉计算机》,他写道:“当政府把我们每一个人的信息和日常生活的细节都装进一个中央级的数据银行,我们将受控于坐在电脑机器前面的那个人和他的按钮。这令人不安,这是一种危险。”美国公民自由联盟(ACLU)是一个成立于1920年、位于纽约的公益组织,它的目标是利用法律的手段维护公民的权利,隐私权正是ACLU关心的重点。对于中央数据银行的计划,ACLU强烈反对,并发表了一系列的声明和调查。哈佛大学也对这个计划开展了专门的民调,其调查的结果表明,56%的美国人担心自己的隐私会受到侵害,明确反对这个计划。一时间,曾经赢得了各方赞誉的数据银行计划在国会的讨论中陷入了泥沼。此后,美国国会对此召开了一系列的听证会。1968年,众议院隐私委员会发布了一份报告,作出结论说,该计划无法保证公民的隐私不会受到侵害,不予批准。但这只是一个中断,甚至仅仅只是一个开始。此后的几十年,随着数据库越来越多,类似于“中央数据银行”的计划不断改头换面,在国会发起冲刺。美国各界对其的讨论也从来没有间断过,并形成了泾渭分明的两派。支持的一派以经济学家和技术专家为主,这个阵营认为,现代经济依赖于大规模的数据整合和交换,统一集成的中央数据库,将提高经济效率,方便大众的生活,是现代社会发展的必然,是社会进步的不二选择。反对方自然是隐私至上的信奉者。他们认为,在信息时代,无论是个人的日常消费等琐碎小事,还是事关健康、教育的重大决策,都会在各种各样的信息系统当中留下“数据脚印”。这些“数据脚印”,保存在不同的系统中,可能无伤大雅。但如果建立起中央数据银行,通过数据整合和信息加总,就可以再现一个人生活的轨迹和全景,各个系统之间的数据可以彼此印证、互相解释,个人隐私就无所遁形。隐私学学者认为,这种信息加总和数据整合,无异于一种监控,准确地说,是一种“数据监控”(Dataveillance),其对个人隐私权的侵害,无异于《一九八四》中的电幕。进入大数据时代之后,甚至有专家提出:大数据就是老大哥!(Big Data is Big Brother)&【大变革——之“微学位:教育领域正在发生的革命”】这个月初,哈佛大学与麻省理工大学共同宣布,将投入6000万美元,开发一个在线教育平台。届时,不仅两个学校的授课过程免费向全世界开放,这个平台本身,也以开源的形式,向其他大学和教育机构免费开放。而几个月以前,斯坦福大学已经把“在线教育”变成了硅谷最热门的话题。其计算机系的Ng教授,把自己的一门课放到了互联网上,结果全球有十几万人注册,这些人,除了在网上听他的实时讲授,还和斯坦福大学的在校生做同样的作业、接受同样的评分和考试。最后,有几千人完成了这门课程。Ng教授看到了其中的商机,在硅谷拉到了1000多万的投资,成立了在线教育公司Coursera。更早一些,谷歌无人驾驶汽车的发明者、大名鼎鼎的斯坦福教授Thrun,也离职创办了一家在线教育网站Udacity。随着类似的公司如雨后春笋般冒出,普林斯顿大学、加州大学伯克利分校、宾夕法尼亚大学等等知名学府都在近期宣布加盟在线教育,逐步向全世界开放自己的课程。当然,这也不是大学的专利。我所在的宾夕法尼亚州,从小学到高中,都建立了在线学校,选择参加在线学习的学生,可以免费获得州政府配发的一台笔记本电脑、一台打印机和扫描仪,作为学习的工具。这是因为他放弃了公立学校的学位,节省了公共教育的开支。目前,宾州的在线学校Cyber School,已经招收了几千名中小学生。之所以获得教育界和投资界的一致青睐,是因为现在的在线教育,已经不仅仅是一个镜头、一段远程录相这么简单,而增加了“互动”、“互助”、“行为评价和诱导”等等新的技术和色彩。例如,师生可以随时对话,计算机能够记录你在一张幻灯片上停留的时间,判别你在答错一道题之后有没有回头复习,统计你在网上提问的次数、参与讨论的多少,然后在这个基础上,对你的学习行为进行诱导和评价。此外,学习者还可以结成互助小组,甚至互相批改、评价对方的作业和报告。哈佛大学和麻省理工学院的新网站还宣布,对于完成一门课程的学生,只要缴纳极少的费用,就可以获得一个认证,这个认证并不是真正的学位。在这个新生事物层出不穷的时代,我们不妨称之为“微学位”。“微学位”等新概念、新技术的出现,我认为,将给教育领域带来一场革命。它的影响,不仅立竿见影,而且相当深远,会波及整个社会。1946年,人类发明第一台电子计算机。如果以此为起点,那人类社会进入信息时代已经有半个多世纪。信息时代的特点是信息流动的速度加快、传播的广度加大,信息垂手可得、无处不在。但信息不是知识,信息必须经过加工、组织、整理才能成为知识,即将到来的在线教育浪潮,把系统整理的知识以课程为载体推上了互联网,这将帮助我们在信息时代的基础上再迈进一步,进入真正的知识时代。知识时代的最大特点,是知识无所不在、随处可得。学校,曾经是最重要的教育资源,好的学校,更是稀缺性的资源。由于在线教育的普及,在不远的将来,名校将人人可上,教育资源匮乏的问题将得到缓解。但在线教育对个人的重大意义,还不仅仅是教育机会的增加,更是学习方式的改变。在传统的学校,我们是接受教育,但在网络学校,人人都可以各取所需,随时随地、按照自己的节奏和计划来开展学习。例如,高中生可以尝试体验大学的课程,离开了校园的人,也可以登陆在线空间,再和在校生一起听课。通过在线教育,学习可以成为一个高度个性化的主动建构过程,终身教育也将成为普遍的现实。更多更好的教育资源、主动学习、终身教育,这些都是教育工作者探讨多年、孜孜以求的梦想。在线教育引发的不仅仅是个人学习的革命,更会改变整个教育行业的生态。其影响大小,一时难下定论,我们不妨通过多问几个问题来催生自己的想象。以大学为例,通过把课程变成一种网络服务,而且公开竞争,越来越产品化,大学作为一个知识传播中心的作用是不是可以发挥得更好?此外,在线教育可以帮助大学突破围墙和座位的限制,名牌大学会不会因此更受追捧、其品牌效应会不会更加突出?还有,一流的大学不惧把自己的课程推上网和全世界的学习者共享,是不是因为它们还有更核心的竞争力?这个竞争力又是什么呢?是不是“创新”?顺着这个思路去想,不难得出结论:真实世界的大学会把更多的时间和精力倾斜到新知识的发现和生产上,而在线教育将承担更多的知识传播功能。再有,学生和学校的关系是不是也会发生变化?过去,是学生争学校;将来,学校抢学生的现象可能会更加突出。一流的大学将成为一个创新型人才的集聚地,普通的大学可能要通过更好的行政管理和服务来吸引学生。再设想,如果你是用人单位,面对一名持有名牌大学“微学位”的候选人和一名三流大学的毕业生,你最后会雇用谁?“微学位”的产生,会不会引起教育行业一种新的竞争、重新布局、甚至洗牌?哈佛大学在线教育的负责人认为,目前这场在线教育的浪潮,是印刷术发明之后,教育领域面临的最重大的变革。对中国的教育领域而言,如何合理规划、用好资源,是挑战,但更是福音,这值得我们全社会、特别是教育部的官员、教育一线的工作者以及企业家的思考、研究和关注。&【建言:中国如何应对大数据时代的挑战】(四) 政府需要做什么?一是政府机构、行业组织和大型企业要建立专门的数据治理机构来统筹数据治理的工作,例如数据治理委员会、大数据管理局等,数据治理的重点在于数据定义的一致性和数据的质量。在大数据时代,不同系统之间的数据要进行整合,因此要有统一的元数据定义,这不仅是中国而且是全世界当下都在面临的挑战。各个领域和行业的数据标准制定得好,将会起到事半功倍的效果。就单个企业而言,要认识到,未来的竞争是知识生产率而不是劳动生产率的竞争,数据分析产生的价值可能比较碎片化,分布在商业流程的各个环节,数据挖掘的投资回报也有不确定性,但企业领导必须有眼光,把数据治理的工作尽快统筹起来,为增强企业在大数据时代的竞争力做好准备。此外,数据治理机构的首长应该由组织的高层领导担任,否则标准无法推进到全局,也改善不了整个行业或组织的情况。二是开放数据。数据增值的关键在于整合,但自由整合的前提是数据的开放。开放数据是指将原始的数据及其相关元数据以可以下载的电子格式放在互联网上,让其他方自由使用。开放数据和公开数据是两个不同的概念,公开是信息层面的,是一条一条的;开放是数据库层面的,是一片一片的。开放也不一定代表免费,企业的数据,可以以收费的形式开放。开放也是有层次的,可以对某个群体、某个组织,也可以对整个社会开放。在大数据的时代,开放数据的意义,不仅仅是满足公民的知情权,更在于让大数据时代最重要的生产资料数据自由地流动起来,以催生创新,推动知识经济和网络经济的发展,促进中国的经济增长由粗放型向精细型转型升级。三是鼓励、扶持基于数据的创新和创业。政策扶持的传统方法,可能是以政府为主导建立大数据产业园,对新兴企业提供办公场所等便利条件或者现金支持,这固然有效,但更有效的方式是调动全社会的力量。例如,拨款支持大数据开源社区、程序员协会等民间组织的建设,通过扶持类似的民间团体,快速推进新技术、新理念在全社会的传播和普及;再例如,以开放的数据为基础,举办应用程序开发大赛,向全社会征询数据使用、创新的意见,主办方可以是政府,也可以是企业,拿出一定的资金,奖励最优秀的应用程序,激发民间蕴藏的创新力量。四是要在全社会弘扬数据文化。数据文化,是尊重事实、推崇理性、强调精确的文化。要承认,回望历史,中国是个数据文化匮乏的国家,就现状而言,中国数据的公信力弱、质量低,数据定义的一致性差也是不争的事实。这方面,政府应该发挥主导作用,首先在公共领域推行数据治国的理念,要认识到,在大数据时代,公共决策最重要的依据将是系统的数据,而不是个人经验和长官意志,过去深入群众、实地考察的工作方法尽管仍然有效,但对决策而言,系统采集的数据、科学分析的结果更为重要。政府应加大数据治国的舆论宣传,将数据的知识纳入公务员的常规培训体系,力争在全社会形成“用数据来说话、用数据来管理、用数据来决策、用数据来创新”的文化氛围和时代特点。最后是要围绕个人数据安全,逐步加强隐私立法。任何技术都是双刃剑,大数据也不例外。如何在推动数据开放的同时有效地保护公民隐私,将是大数据时代的一个重大挑战。新年刚刚拉开序幕,希望中国政府相关部门尽快制定与大数据相关的政策,出台具体的措施,从而抓住历史的机遇、推动中国社会的发展和进步。属于中国的大数据时代来了!
卖家:别具一格图书专营店
来自:北京
最近30天销量:0件
相关内容:&
¥35.00(7.4折)
卖家:晨应图书专营店
来自:上海
最近30天销量:0件
相关内容:&
卖家:博库图书专营店
来自:浙江 杭州
最近30天销量:1件
相关内容:&
卖家:北京华章图书专营店
来自:北京
最近30天销量:8件
相关内容:&
卖家:博库图书专营店
来自:浙江 杭州
最近30天销量:2件
相关内容:&
¥53.70(9.2折)
卖家:兴阅图书专营店
来自:福建 福州
最近30天销量:12件
相关内容:&
¥69.00(7.1折)
卖家:兴阅图书专营店
来自:北京
最近30天销量:9件
相关内容:&
¥99.00(7.1折)
卖家:奥维博世图书专营店
来自:北京
最近30天销量:31件
相关内容:&
卖家:新华文轩网络书店
来自:四川 成都
最近30天销量:29件
相关内容:&
¥20.30(9.4折)
卖家:奥维博世图书专营店
来自:北京
最近30天销量:20件
相关内容:&
卖家:奥维博世图书专营店
来自:北京
最近30天销量:47件
相关内容:&
卖家:兴阅图书专营店
来自:福建 福州
最近30天销量:27件
相关内容:&
¥79.00(7.5折)
您或许还喜欢
62.00&&&&(6.3折)
40.66&&&&(6.8折)
39.20&&&&(6.6折)
35.50&&&&(5.9折)
19.00&&&&(6.6折)
请留下你对双氙的意见或建议,感谢!
(如果有个人或商家的相关问题需要解决或者投诉,请致电400-000-5668)
联系电话/微信/QQ:
支持中英文(Support in both Chinese and English)
感谢您的反馈,我们会努力做得更好!

我要回帖

更多关于 数据挖掘始于哪一年 的文章

 

随机推荐