发表于2024-11-05
数据之巅 大数据革命,历史、现实与未来 pdf epub mobi txt 电子书 下载
《数据之巅》作者开中国大数据之先河,《数据之巅》内容更加丰富,观点更加震撼,堪称作者集大成之作。《数据之巅》将再次掀起全民阅读大数据的热潮。
作者是中国数据文化的首倡者,提出把科技符号变成文化符号的理念,倡导数据治国的理论。
数据,科学的生机和命脉;数据之巅,进入科学的殿堂,**未来的思索。记住,我们要用数据来说话,用科学来思考。
史学家许倬云、招行前行长马蔚华、中国宽带资本董事长田溯宁联袂推荐;神州数码公司董事局主席郭为、中信银行行长朱小黄、万向集团副董事长肖风倾情解读。
《数据之巅》案例丰富,生动,读起来趣味盎然,又不失科学的风采和素养。
海报:
更多精彩,点击进入中信出版集团品牌店》
数据,自古就有,人口普查、农业统计、军事战争、政治计算……数据虽小,却有助于治国安邦。美国之所以繁荣鼎盛,数据文化根基牢不可破概是主因之一。
信息爆炸、互联互通、智慧城市时代,大数据,更以排山倒海之势席卷全球,政府施政、企业掘金,大众要公平与正义,大数据被赋予了新的历史使命。
在《数据之巅:大数据革命,历史、现实与未来》这本书中,从小数据时代到大数据的崛起,作者以宏大的历史观、文化观、大数据观,给我们描绘了一幅数据科学、智慧文化的全景图。全书从美国建国之基讲起,通过阐述初数时代、内战时代、镀金时代、进步时代、抽样时代、大数据时代的特征,系统梳理了美国数据文化的形成,阐述了其数据治国之道,论述了中国数据文化的薄弱之处,展望了未来数据世界的远景。
“尊重事实,用数据说话”,“推崇知识和理性,用数据创新”,作者不仅意在传承黄仁宇“数目字”管理的薪火,还试图把数据这个科技符号在中国转变为文化符号,形成一种文化话语体系。大数据正在撬动中国的制度创新、科技创新。阅读此书,历史与现实相互融合,知识与激情相互交织,思想与观念相互碰撞,未来与前景必定豁然开朗。
涂子沛,江西吉安人,现居美国硅谷。2012年其著作《大数据》在中国社会开大数据之先河,引发了大数据战略、数据治国和开放数据的讨论,历史学家许倬云先生盛赞其“为华文世界开创了一个重要话题”。本书为作者第二本著作,全书对大数据追根溯源,提出当前信息技术的发展,已经让中国获得了后发优势,中国要在大数据时代的全球竞争中胜出,必须把大数据从科技符号提升成为文化符号,在全社会倡导数据文化。
作者本科毕业于华中科技大学计算机系,研究生毕业于中山大学和卡内基梅隆大学,获公共管理硕士和信息科学硕士学位。
★涂子沛先生开启了一道大门,我相信,后面会有更多的发展,让大家进入这一个重要的现代文化园地。
——许倬云著名历史学家、美国匹兹堡大学历史系荣誉讲座教授
★在《数据之巅》这本书中,涂先生跳到了哲学思考的层面,以统计学的社会应用为切入点,解构数据文化在美国政治、经济乃至军事发展上起到的关键作用,一环扣一环,构思精巧,故事生动,逻辑清晰,读起来实在“解渴”。感谢涂先生的智慧,为时代贡献了一部杰作!
——郭为神州数码控股有限公司董事局主席
★涂子沛先生的《数据之巅》通过追溯梳理美国的数据历史、展望人类的数据未来,给中国社会提出了一个数据时代的新命题——如何构建数据文化?本书引人入胜、发人深思,是不可不读的好书。
——马蔚华招商银行前行长
★数据本无大小,但运用数据的立场却分出大小,是谓大数据。数据表示的是过去,但表达的是未来,所以观察数据需要有历史观。涂子沛先生的这本新作《数据之巅》以大历史、大数据、大社会、大进步的格局,通过数据将遥远拉近,将悠久缩短,将巨大归聚,将过程简直。无论你从事何业或研究何题,都值得认真阅读这部**之作。
——朱小黄中信银行行长、中信集团监事长
★大数据是互联网金融的基础支柱。互联网金融是云计算、大数据、社交网络这个移动互联大时代里的小时代。时代潮流,浩浩荡荡!涂子沛先生的大数据系列著作,带您观时代大潮!
——肖风通联数据董事长、万向信托董事长
★涂子沛先生《数据之巅》一书的历史高度和现实意义,超出了他的《大数据》。如果说他上部书开启了中国人对大数据的认识,此书则从历史的角度来说明,对数据的理解和掌握是人类文明进步的标志。中国人在“初数时代”是被动的、落后的,黄仁宇在他的名著《万历十五年》中也将中国明朝未能走向资本主义归结为中国人不能在“数目字上管理国家”。在新世纪的大数据时代,我们能否成为参与者甚至领导者?子沛这本书中有诸多可贵的思考和启示,我向读者推荐。
——田溯宁中国宽带资本董事长
★涂先生深思熟虑,用语殷殷,穿行在中美两国的历史中,努力发掘各个大数据改变观念,改造社会,改革制度的故事,无论人与事件,都是栩栩如生,发人深省。这本书让我们有目标有信心,也给我们创新的无限空间。
——王巍中国金融博物馆理事长
★大数据的江湖有两派,国家治理派和产业升级派。涂子沛先生无疑是国家治理派的宗师,这本书在美国200多年的政界商海、刀光剑影中勾勒出雄浑的数据思维、文化、价值观和方法论。临到尾处,我的期待愈来愈强。他的**本书《大数据》在通篇的历史视角、西方视角后,煞费苦心附上一篇“挑战中国”的尾声,把人拉回当下、令人掩卷忧思;这次果不其然,子沛以整整一章的浓墨重彩,挑战了“智慧城市”这一兼具进行时和未来时的话题,而当涉及中国元素时,子沛的行文中出现了暖色调,那种欣赏和希冀让人宽慰之极、意犹未尽!期待《数据之巅》之后,山不穷,峰更高。
——吴甘沙英特尔中国研究院院长
★涂子沛先生已经成为中国大数据和数据分析领域*前沿的思想者和专家,如果您想了解大数据的历史、现实和未来,这本书将是您的必读书目。
——托马斯·H·达文波特巴布森学院教授,麻省理工学院数字商务中心研究员
第七章 大数据时代:通往计算型的智能社会
大数据是人类文明新的土壤,在这片土壤之上,人类将开始建设一个智能社会。
—本书作者,2014年
世上本没有数:正解大数据
传统意义上的“数据”,是指“有根据的数字”,数字之所以产生,是因为人类在实践中发现,仅仅用语言、文字和图形来描述这个世界是不精确的,也是远远不够的。例如,有人问“姚明有多高”,如果回答说“很高”、“非常高”、“最高”,别人听了,只能得到一个抽象的印象,因为每个人对“很”、“非常”有不同的理解,“最”也是相对的,但如果回答说“2.26米”,就一清二楚。除了描述世界,数据还是我们改造世界的重要工具。人类的一切生产、交换活动,可以说都是以数据为基础展开的,例如度量衡、货币的背后都是数据,它们的发明和出现,都极大地推动了人类文明的进步。
数据最早来源于测量,所谓“有根据的数字”,是指数据是对客观世界测量结果的记录,而不是随意产生的。测量是从古至今科学研究最主要的手段,可以说,没有测量,就没有科学;也可以说,一切科学的本质都是测量。就此而言,数据之于科学的重要性,就像语言之于文学、音符之于音乐、形色之于美术一样,离开数据,就没有科学可言。
除了测量,新数据还可以由老数据经计算衍生而来。测量和计算都是人为的,也就是说,世上本没有数,一切数据都是人为的产物。我们说的“原始数据”,并不是“原始森林”这个意义上的“原始”,原始森林是指天然就存在的,而原始数据仅仅是指第一手的、没有经过人为修改的数据。
传统意义上的数据,和信息、知识也是完全不同的概念:数据是信息的载体,信息是有背景的数据,而知识是经过人类的归纳和整理,最终呈现规律的信息。
图7–1 传统意义上的数据和信息的区别
但进入信息时代之后,“数据”二字的内涵开始扩大:不仅指代“有根据的数字”,还统指一切保存在电脑中的信息,包括文本、图片、视频等。其中的原因是,20世纪60年代软件科学取得了巨大进步、发明了数据库,此后,数字、文本、图片都不加区分地保存在电脑的数据库中,数据也逐渐成为“数字、文本、图片、视频”等的统称,也即“信息”的代名词。
文本、音频、视频本身就已经是信息,而且其来源也不是对世界的测量,而是对世界的一种记录,所以信息时代的数据又多了一个来源:记录。
图7–2 数据的三大来源
图7–3 现代意义上的“数据”:范畴比信息还要大
注:进入信息时代之后,数据成为信息的代名词,两者可以交替使用。一封邮件虽然包含很多条信息,但从技术的角度出发,可能还是“一个数据”,就此而言,现代意义上的数据的范畴,其实比信息还大。
除了内涵的扩大,数据库发明之后,还出现了另外一个重要现象,那就是数据的总量在不断增加,而且增加的速度不断加快。
20世纪80年代,美国就有人提出了“大数据”的概念。这个时候,其实还没有进入数据大爆炸的时代,但有人预见到,随着信息技术的进步,软件的重要性将下降,数据的重要性将上升,因此提出“大数据”的概念。这时候的“大”,如“大人物”和“大转折”之“大”,主要指价值上的重要性;到了21世纪前10年,尤其是2004年社交媒体产生之后,数据开始爆炸,大数据的提法又重新进入大众的视野并获得了更大的关注。这个时候的“大”,含义也更加丰富了:一是指容量大,二是指价值大。
从这个角度出发,大数据可以首先理解为传统的小数据加上现代的“大记录”,这种大记录的主要表现形式是文本、图片、音频、视频等,和传统的测量完全是两回事。而且大数据之所以“大”,主要是“大记录”的增长,基于信息技术的进步,人类记录的范围在不断扩大:
大数据 = 传统的小数据 + 现代的大记录
(源于测量) (源于记录)
但到底多大才算大呢?针对这一问题,十多年来争议颇多。这首先涉及衡量数据大小的单位,2000年的时候,一般认为,“太”(T)级别的数据就是大数据了,当时拥有“太”级别数据的企业并不多,但自此之后,互联网企业开始崛起,这些企业拥有各种各样的数据,其中大部分都是文本、图片和视频,其数据量之大,传统企业根本无法望其项背。
理解几个主要的存储单位
一首音乐 ≈ 4兆(M)
一部电影 ≈ 1吉(G,1吉=1 024兆,相当于250首歌曲的大小)
一个普通图书馆的藏书 ≈ 1太(T,1太=1 024吉,相当于1 024部电影的大小)
我认为,不仅仅是互联网行业,其实各行各业的数据都在爆炸,只是规模不同。如果仅仅把大数据的标准限定在互联网企业,认为只有互联网企业才拥有大数据,那就严重窄化了大数据的意义。毕竟容量只是表象,价值才是本质,而且大容量并不一定代表大价值,大数据的真正意义还在于大价值,价值主要是通过数据的整合、分析和开放而获得。大数据是指人类有前所未有的能力来使用海量的数据,在其中发现新知识、创造新价值,从而为社会带来“大知识”、“大科技”、“大利润”和“大智能”等发展机遇。
以上论述,是从概念上分析“数据”和“大数据”的区别,而掌握一个概念最好的方法,还是从动态上了解其成因。大数据的成因,还是人类信息技术的进步,而且是信息技术领域不同时期多个进步交互作用的结果,其中最重要的原因,当数摩尔定律。
改变世界的三股力量:大数据的成因
1965年,英特尔的创始人之一戈登·摩尔(Gordon Moore)在考察了计算机硬件的发展规律之后,提出了著名的摩尔定律。该定律认为,同一面积芯片上可容纳的晶体管数量,一到两年将增加一倍。1
要理解这种增加的意义,并不简单。摩尔的本意是,由于单位面积芯片上晶体管的密度增加了,计算机硬件的处理速度、存储能力,即其主要性能一到两年将提升一倍。本来性能提升了,价格也应该上升才对,但现实却很诡异:半个多世纪以来,硬件的性能不断提高,价格却持续下降。之所以这样,竟然还是因为晶体管越做越小,这种体积的缩小也导致其成本下降,再加上人类对晶体管的需求越来越大,大规模的生产也导致价格不断下降。
回顾这半个多世纪的历史,硬件的发展基本符合摩尔定律。以物理存储器为例,其性能确实不断上升,与此同时,价格不断下降。1955年,IBM推出了第一款商用硬盘存储器,一兆字节的存储量需要6 000多美元,此后,其价格不断下降:1960年,一兆字节下降到3 600美元;1993年,下降到大概1美元;2000年,再降至1美分左右;到2010年,每兆价格约为0.005美分。半个多世纪,存储器的价格下降了1亿多倍,这种变化的速度既巨大又剧烈,令人瞠目结舌。事实上,考察人类全部的历史,没有其他任何一种产品的价格下降空间能够如此巨大!
图7–4 1971~2011年中央处理器上的晶体管数量和摩尔定律
注:纵坐标为晶体管数量,横坐标为年份。该曲线表明,在1971~2011年,大概每两年相同面积的中央处理器集成电路上的晶体管数量就增加1倍。需要注意的是,纵坐标从2 300到10 000再到
100 000,其实不成比例,如果严格按比例作图,这将是一条非常陡峭的曲线,页面将无法容纳。(资料来源:维基百科)
晶体管的产量多过全世界的大米颗粒
……
进入一个重要的现代文化园地
许倬云 著名历史学家、美国匹兹堡大学历史系荣誉讲座教授
涂子沛先生所著的这部大作,是大数据时代的应时之作。
他将数据用在管理和研究方面的发展史,以其在美国的发展过程,作为主要内容。他从美国开国时期的人口普查,作为起点,讨论民主制度如何经过数据的调查,才能发展成为“一人一票”的制度。接着,19世纪中叶,美国向西开发,美国的工程兵团,进行丈量和调查,使美国的地理状况和疆域,都有明白的依据。20世纪,“打孔”的计算方法,开创了后世计算器管理大量数据的技术。到今天,我们日常生活中,因为计算机和网络的普及,无处没有数据的存在。以我老病人为例,疾病的性质,或药物的效果,都必须靠大量的数据,作为诊断和治疗的依据。凡此,都是数据的使用。
美国的社会愈来愈复杂,资本主义的国家,证券交易乃是一桩大事。单单用统计来管理证券,已经不太够用。大概在最近30来年,许多大证券商,为了要预测经济的起落和某一种产业的兴衰,大量地使用不同产业之间的关系,也顾及国际贸易的情形。这些私营的企业界,几乎都能相当精准地判断市场的情形。于是,管理证券交易的美联储,实际上就是美国的中央银行,也必须更细密地运用许多数据,以掌握经济的全貌,然后再决定对市场供应的货币是从宽还是从紧。这才是“大数据”的第一次使用。
中国古代兵书《孙子兵法》就说过:“算则胜,不算则不胜;多算胜,少算则不胜。”此处的“算”字,就是如何利用数字,来估计各种因素。一个能干的将领,打一次战役,要考虑到天时、地利、人和,这都是可以用数字表现的。但是,一个治国的领袖,在上述因素以外,还得考虑许多其他的条件。1942年,日本偷袭珍珠港,以为可以一棒打死美国。他们没算到,美国工业的实力,有充分的再生力量,三个月之内,美国立刻就能恢复足够的海空实力。这就是日本军人,只知道计算战役,不会计算战争。到今天,安倍野心勃勃,处处挑衅,他志在日本复兴。他的计算,大概又是计算自己现在的兵力和科技能力;他没有算到,自己的原料供应不够,能源不能自主,人口结构老化:这就是“算”得不够。
“大数据”之“大”,就在于将各种分散的数据,彼此联系,由点而线,由线而面,由面而层次,以瞻见更完整的覆盖面,也更清楚地理解事物的本质和未来的取向。人脑的结构,足够发挥联想力和推论。我们每天的日常生活,时时刻刻在不知不觉中,做“大数据”的工作,将许多因素综合在一起,作为行动和决定的依据。只是一个国家或一个社会的发展,不能全靠眼睛看得见的一些讯息,有许多事物,必须依靠全面和长期的发展情况,才能真实地反映当时一切决定的背景和条件。
今天信息科学的发展,已经能够产生、存储并实时地分析处理大量的信息,整合多个源头的数据,形成全面的多项关系,指出线性的发展方向,引导我们有广阔的视野。计算机今天处理数据的能力和速度,已经超过最聪明的个人。可是,用计算机的还是“人”,如何驾驭这些数字,还是“人”在设计。只是,我们必须要有此认识:今天的世界,已经千丝万缕,将各地、各种行业、各种条件,纠缠成一个复杂的全球网络。管理大企业和管理国家,必须要有足够的信息,了解多种多样的情况,以全面地理解各种问题及其彼此的关联。即使是对个人而言,因为越来越多的行为已经转变为电子化的记录,其生活也和大数据息息相关。“大数据”这个课题,十分重要,我盼望有更多的学者,在这方面提出更多的作品。
涂子沛先生的大作,是讨论大数据较早的中文作品;在此以前,还罕见讨论数据为管理方式的书籍。这本书,主要是以美国社会中数据的使用为例。我知道他一心想用这些例子,提醒中国的读者:在信息科学高度发展的今天,我们不能再忽略数据的使用。涂子沛先生开启了一道大门,我相信,后面会有更多的开
数据之巅 大数据革命,历史、现实与未来 电子书 下载 mobi epub pdf txt
京东正版,价格实惠,值得购买。
评分质量很好!快递速度快~推荐!
评分东西还好能用就行!!!
评分网上买书,方便快捷,快递速度不错,就是中午送打扰睡觉了
评分听了罗胖精彩的介绍买的。
评分书是好书,但我不喜欢精装版的,不好阅读
评分可以呀可以呀可以呀可以呀可以呀可以呀
评分从社会人文到数据分析的很有意思的书
评分希望了解大数据的发展趋势。
数据之巅 大数据革命,历史、现实与未来 pdf epub mobi txt 电子书 下载