发表于2024-12-22
大数据主义 [DATA-ISM] pdf epub mobi txt 电子书 下载
人类社会正在从从以煤、铁、石油为代表的工业时代进入大数据、人工智能驱动的信息经济时代!
我们正在经历一场发生在决策、消费者行为以及几乎所有领域的颠覆性革命,大数据主义将对生产、流通、分配、消费活动以及经济运行机制、社会生活方式和国家治理能力产生不可估量的重要影响。
2015年8月31日,国务院印发“促进大数据发展行动纲要的通知”,旨在大力推动大数据在中国的发展和应用。《大数据主义》一书中到处都是关于像脸谱网、谷歌这类创新型企业,以及雅虎的前数据工程师杰夫·哈默巴赫、IBM的首席科学家迈克尔·哈多克这类数据精英的趣闻轶事、真知灼见以及一些内部信息,侧重展示了大数据技术在互联网行业、创新型企业、传统行业、医疗行业、农业等领域的应用,特别贴和国务院的这份重要通知。
如果你想知道世界将如何发展,那么《大数据主义》你非读不可。《大数据主义》突破大数据领域的表象,为人们提供了独特的视角,洞见掌握科技前沿技术的精英们是如何从数据中提取更多有用信息的。
中国的大数据主义时代已经来临,我们是否做好了准备去应对它带来的机遇与挑战?
大数据时代最耀眼的数据科学家、技术大佬、科技巨头联袂推荐本书。他们是:谷歌首席经济学家哈尔·范里安,谷歌公司执行董事长埃里克·施密特,人工智能专家、美国华盛顿大学计算机科学家奥伦·埃奇奥尼,德勤领先创新中心联合董事长约翰·哈格尔三世;奇虎360公司董事长周鸿祎,北京大学新闻与传播学院教授胡泳,经济学家巴曙松,《经济参考报》总编辑杜跃进。
根据一项估计,人类历史上90%的数据都在过去两年中产生。2014年,国际数据公司预测,数据世界已增至4.4亿万亿字节。如果将如此庞大的信息量存储在苹果平板电脑ipad中,叠加起来的Ipad的厚度可达到地球到月球距离的2/3。这预示着我们已经进入了大数据时代。
煤、铁和石油是推动工业革命进程的三大生产性资产,如今信息经济时代的主要原材料是大数据。
在《大数据主义》一书中,作者解释了大数据技术将如何引发一场新的革命,促进新一轮经济效率的提高和创新。互联网规模的海量数据集将被用于几乎各个领域、各个行业和各个企业,以进行探索、预测和提高效益。《大数据主义》重点关注那些处于数据科学领域前沿的年轻企业家,还有诸如IBM等为公司前景而在数据科学领域押下极大赌注的行业巨头。
《大数据主义》还介绍了新的技术革命将如何改变人类的决策方式——人们将更加依赖于数据和分析,而不是直觉和经验;同样,它还将改变领导力和管理的本质。
该书对读者而言是一本行业指南,它预测了行业动向,详细解释了个人和组织应该如何利用、保护并管理大数据,从而在变幻莫测的未来仍能立于不败之地。
大数据主义时代已经来临,我们是否做好了准备去应对它的好与坏?
史蒂夫·洛尔(Steve Lohr),为《纽约时报》撰稿长达20多年,写作内容涉及技术、商业和经济三大领域,同时他还负责撰写《纽约时报》的科技博客Bits,曾采访过史蒂夫·乔布斯(这在《史蒂夫·乔布斯传》里面有所体现)。2013年,他所在团队获得普利策新闻奖。他还做过10年的海外记者,也当过编辑,为《纽约时报杂志》《大西洋月刊》《华盛顿月刊》等媒体撰稿。
本书向读者展示了这样一幅图景:不管你自觉还是不自觉,乐意还是不乐意,大数据正以空前的速度和规模渗透到人类社会生活的方方面面,它在一定程度上已经和正在改变人们观察、认识、思考乃至生存与发展的方式。特别是这后一方面的变化,或许就是“大数据”之所以成为“主义”的原因。
——《经济参考报》
推荐序
第1章 大数据到底有多“大”?
我们已经进入大数据时代
技术进步与摩尔定律
大数据主义的兴起
第2章 人的潜力与数据的潜力
一位年轻的明星数据科学家
一个阅读兴趣广泛的“T型人”
聪明人也会犯低级错误
从华尔街到脸谱网
第3章 蓝色巨人与大数据的博弈
大数据技术在医疗领域的应用
IBM公司的大数据战略
从“蓝色巨人”到“智慧的地球”
大数据时代的企业生存法则
第4章 企业决策与数据挖掘
数据、直觉与好的决
大数据将引发“管理革命”
数据驱动型企业的赢利之道
第5章 数据科学的崛起与发展
社交网络大数据的价值何在?
用户数据分析技术是脸谱网的引擎
数据科学家们的颠覆式创新
第6章 人工智能与机器学习
厘清大数据中的相关关系和因果关系
人类与人工智能的未来
人工智能系统要学会讲故事
第7章 用大数据推动企业与行业发展
当传统的葡萄酒业遇上大数据
物联网与大型工业机器的数字化
大数据可以产生巨大的经济效益
第8章 物理世界与数字世界的融合
人与智能机器的合作博弈
大数据营销的艺术与科学
用大数据建立人类行为模型
第9章 医疗行业的大数据革命
最棘手也是最有价值的问题
建立数据驱动的医疗保健体系
用数据杠杆撬动医疗行业的进步
第10章 大数据时代的隐私“黑洞”
个人隐私权受到前所未有的挑战
大数据会泄露多少我们的隐私?
是个性化服务还是经济歧视行为?
能精准量化人类性格特征的数据技术
如何将隐私风险降至最低?
第11章 大数据主义与美丽新世界
大数据市场的野蛮生长
大数据技术引发的关键思考
致谢
早在谷歌、脸谱网等硅谷互联网孵化器问世之前,大数据时代就已经拉开了帷幕。起初,大数据是由字节构成的纯数字形式,然后它迅速迈进了由原子构成的物理世界,最后融入了社会主流。麦克森分销中心与埃默里大学医院重症监护室的例子告诉我们,大数据不仅可以节省时间,还可以挽救生命。从长远来看,大数据技术必将发展成为数据驱动的人工智能,驻留于数码世界与物理世界的顶层。现在,我们扬帆起航,朝着这个愿景进发。大数据技术正在引导一场计量方面的革命,有望为下一个席卷整个经济领域的效率与创新浪潮奠定基础。但是,技术并不是孤军作战。将来,我们在考虑如何决策,或者说应该如何决策这个问题时,同样需要大数据为我们出谋划策。我在《纽约时报》的同事戴维·布鲁克斯把这种正在兴起的观点称作“大数据主义”,这个词可以形象地反映大数据的深远影响。经验一再告诫我们,创新工具非常重要,它们不仅有利于经济增长,还可以帮助我们重塑世界观,以及做出相关决策。
大数据催生了大量技术,首先是各种新老数据源,包括Web网页、浏览习惯、传感器信号、社交媒体、智能手机的GPS位置数据、基因组信息和监控录像等。数据潮汹涌而来,每两年数据总量就会增加一倍。但是我认为,大数据被严重夸张的(经常也是最不重要的)方面就是这个“大”字。计算全球数据总量变成了书呆子们玩的各种预测与评估游戏,把人们引上了研究泽字节、尧字节、布朗多字节等冷僻字眼的歧途,各种类似表达令人震惊。据估计,历史上90%的数据都产生于过去两年。2014年,国际数据公司推算出全世界的数据总量有4.4泽字节之多,即4.4万亿兆字节。这家研究公司称,如果把这么多的信息塞进纤薄的苹果平板电脑里,那么这些平板电脑摞起来可以达到157 000英里a高,是地球与月球距离的2/3。
大数据中的“大”字确实重要,但是远没有很多人想象的那么重要。海洋里的水也非常多,但是我们无法直接饮用。因此,更重要的问题是如何运用、如何理解这些数据。本书讲的成功故事都涉及大数据的应用,但是通常来说,这些数据的量还不足以让谷歌的工程师们为之惊讶。此外,尽管计算机在处理、存储与内存等方面取得的进步有助于解决大数据遭遇的难题,但亟须解决的最大问题还在于软件,因为关键性程序指令主要是为了满足机器学习软件等人工智能工具包持续升级的需要。
数据与智能技术不断为我们开辟计量的新天地,让我们看得更远、更清楚。大数据技术就是数字时代的“望远镜”或者“显微镜”,使我们可以看到并计量之前我们一无所知的新事物。“望远镜”让我们看得更远,发现新的星系;而“显微镜”则将比细胞更微小的神秘世界展现在我们眼前。
现代望远镜改变了天文学,现代显微镜使生物学发生了翻天覆地的变化,大数据也有同样的效果,不过它的作用范围更广,涉及每一个领域、每一门学科。技术的长足进步是推动经济发展的发动机。互联网首先驱使通信经济学发生了变化,随后在互联网基础之上发展的Web网络服务等技术为创新与新型经营活动提供了平台。大数据技术同样如此,虽然它还是一项年轻的技术,但它正在改变经济的意义,可以说这项技术将会变成人类决策活动的一个平台。
所有决策活动对经验与直觉的依赖将逐渐减少,而对数据与分析的倚重将与日俱增。在决策活动中,本能的作用逐渐减弱,而科学的重要程度将逐渐增强。
……
大数据何以成为“主义”?
数据者,有广义与狭义之分。狭义的数据,就是数字或数值,如1、2、3、4、5……;广义的数据,则可概括为人类观察、实验、计算等的记录。作为这些记录的符号,或数字,或文字,或图像,或音视频,从上古时代的结绳记事、楔形文字、甲骨文,到古代乃至现代以竹简、布帛、羊皮、纸张等为载体的图文,直至现在以比特为单位的电子信息,可谓无所不包。
也许,正是由于互联网技术工程师们习惯于把以电子信息方式存在的内容统称为“数据”,于是,“数据”一词便由狭义的“数字”或“数值”演变为主要指向通用的广义“数据”。
随着计算机、互联网、现代通信以及相关软硬件技术的飞速发展,大数据和云计算,如同一枚硬币不可分离的两面,成为我们这个时代的高频词。
大数据之大,不仅大在巨量或海量——由人们熟知的千字节(KB)、兆(MB)、千兆(GB)和太字节(TB),跃升为专业人士才了解的拍字节(PB)、艾字节(EB)、泽字节(ZB),乃至尧字节(YB)。(1KB=1 024B,1MB=1 024KB,1GB=1 024MB,1TB=1 024GB,1PB=1 024TB,1EB=1 024PB,1ZB=1 024EB,1YB=1 024ZB)。其中,不变的是基本单位B,即比特或字节,而从K到Y,则是成千倍的递增,以致有人据此宣称,目前的数据计算已经进入“PB时代”。
大数据之大,还大在数据结构的有容乃大——它不再需要传统的数据库表格来整齐排列,几乎可以无所不包地记录、存储和计算各种规则的结构化数据和不规则的非结构化数据,于是便有了逐步演变为一个数字化世界的可能。
如此庞大和复杂的数据,远远超出传统计算机的处理能力,于是,建立在互联网基础上的云计算技术应运而生,承担起存储、传输、计算和应用大数据的重任。而正是大数据与云计算的有效互动,打开了世界观、方法论乃至价值观的新视野。
在本书中,作者引用专业研究机构的统计,揭示了大数据的规模与速度:一方面,到2014年,全世界电子化数据已增至4.4ZB,即4.4亿万亿字节,如果将如此之巨的信息量存入只有7.5毫米厚的苹果平板电脑,后者叠加起来的厚度可达地球与月球间距离的2/3;另一方面,有史以来90%的数据量,都是在过去两年的时间里产生的。
由此不难预期,一个电子化的、独立于物质世界的“数字世界”,正在大数据和云计算的互动中迅速构建,它虽然不可能穷尽物质世界全部存在,越来越逼近物质世界本体却是不争的事实。
尤为值得注意的是,许许多多以往被闲置的数据,由于一些精明商家的开发和利用,开始“变废为宝”。一个耳熟能详的案例,就是那个“尿片+啤酒”的商业发现与行动。世界最大零售商沃尔玛通过大数据统计和分析发现,男性顾客在购买婴儿尿片时,常常会顺便搭配几瓶啤酒,于是推出将啤酒和尿片捆绑销售的促销手段,从而有效提高了啤酒销量。
凡此种种表明,如同宇宙大爆炸般飞速扩张的“数字世界”,不仅日益成为外在的客观物质世界的“镜像”,而且正在越来越多地包含了对人类自身行为的追踪和记录,成为人类观察和认识自我的“镜子”。
二者的叠加,形成一个有趣的悖论:由大数据构筑而成的数字世界,在日趋脱离客观物质世界的同时,又越来越接近世界的本原。因此,人们在解码这样一个虚拟世界的同时,也在一定程度上改变着对世界的看法。
然而,就在哲学家们对数字世界的属性还没有来得及给出明确界定之际,为利益所驱动的商家们却迫不及待地启动了对这一新矿藏的发掘。
他们是如此的急切:还没来得及弄清两个相关现象之间的互动机理或因果关系,便急匆匆地将其中的商机转化为提升经济效益的手段;云计算技术刚刚出现,便迅速地将统计分析对象由随机采样拓展为可获取的全部数据;为寻求“大数据的高效率”,不惜置“小数据的精确度”于不顾……
回过头来看,正是这近乎“饥不择食”的匆忙,竟在无意中成就了认识数字世界的锁钥:不再执着于因果关联,不再满足于抽样分析,不再一味地追求精确度的提高,转而直面模糊与混杂,关注看似不相关的相关现象。这一系列有别于以往的方法,为人类认识世界、解决问题提供了传统工具箱中没有的新工具。
诚如史蒂夫·洛尔在本书中的比喻,这些大数据时代的新工具,犹如“望远镜”或“显微镜”。“望远镜”让人们看得更远,发现新的星系;“显微镜”则将比细胞更加微小的世界展示在人们面前。人们据此看到并计量之前一无所知的事物。
抛开学术和技术层面的研讨,大数据及其应用几乎与生俱来就伴随了喋喋不休的争论。
其中有两个关键词,一是“开放”,一是“保护”。如果说开放就是要打破垄断分割,推动信息与数据互联互通;变革体制机制,实现数据资源共有共享;鼓励技术创新,促进大数据资源开发利用……最大限度地拓展数字世界“公共空间”,让大数据和云计算普惠大众,造福人类;那么保护则意味着要在数字世界为个人留下一方“私密领地”,或者为公权力划上一道不能逾越的“红线”——“风可进,雨可进,国王不能进”。
开放与保护,“公共空间”与“私密领地”,在这里构成既对立又统一的关系。对立在开放与保护“井水不犯河水”,统一在“公共空间”与“私密领地”共存于同一个数字世界,且双方都以对方的存在为自身存在的证据,正所谓没有“公”即没有“私”,没有“私”亦没有“公”。
一言以蔽之,数字世界与现实世界理应奉行同样的价值理念:该开放的一定要最大程度开放,该保护的必须严格加以保护。
本书向读者展示了这样一幅图景:不管你自觉还是不自觉,乐意还是不乐意,大数据正以空前的速度和规模渗透到人类社会生活的方方面面,它在一定程度上已经和正在改变人们观察、认识、思考乃至生存与发展的方式。特别是这后一方面的变化,或许就是“大数据”之所以成为“主义”的原因。
大数据何以成为“主义”?
数据者,有广义与狭义之分。狭义的数据,就是数字或数值,如1、2、3、4、5……;广义的数据,则可概括为人类观察、实验、计算等的记录。作为这些记录的符号,或数字,或文字,或图像,或音视频,从上古时代的结绳记事、楔形文字、甲骨文,到古代乃至现代以竹简、布帛、羊皮、纸张等为载体的图文,直至现在以比特为单位的电子信息,可谓无所不包。
也许,正是由于互联网技术工程师们习惯于把以电子信息方式存在的内容统称为“数据”,于是,“数据”一词便由狭义的“数字”或“数值”演变为主要指向通用的广义“数据”。
随着计算机、互联网、现代通信以及相关软硬件技术的飞速发展,大数据和云计算,如同一枚硬币不可分离的两面,成为我们这个时代的高频词。
大数据之大,不仅大在巨量或海量——由人们熟知的千字节(KB)、兆(MB)、千兆(GB)和太字节(TB),跃升为专业人士才了解的拍字节(PB)、艾字节(EB)、泽字节(ZB),乃至尧字节(YB)。(1KB=1 024B,1MB=1 024KB,1GB=1 024MB,1TB=1 024GB,1PB=1 024TB,1EB=1 024PB,1ZB=1 024EB,1YB=1 024ZB)。其中,不变的是基本单位B,即比特或字节,而从K到Y,则是成千倍的递增,以致有人据此宣称,目前的数据计算已经进入“PB时代”。
大数据之大,还大在数据结构的有容乃大——它不再需要传统的数据库表格来整齐排列,几乎可以无所不包地记录、存储和计算各种规则的结构化数据和不规则的非结构化数据,于是便有了逐步演变为一个数字化世界的可能。
如此庞大和复杂的数据,远远超出传统计算机的处理能力,于是,建立在互联网基础上的云计算技术应运而生,承担起存储、传输、计算和应用大数据的重任。而正是大数据与云计算的有效互动,打开了世界观、方法论乃至价值观的新视野。
在本书中,作者引用专业研究机构的统计,揭示了大数据的规模与速度:一方面,到2014年,全世界电子化数据已增至4.4ZB,即4.4亿万亿字节,如果将如此之巨的信息量存入只有7.5毫米厚的苹果平板电脑,后者叠加起来的厚度可达地球与月球间距离的2/3;另一方面,有史以来90%的数据量,都是在过去两年的时间里产生的。
由此不难预期,一个电子化的、独立于物质世界的“数字世界”,正在大数据和云计算的互动中迅速构建,它虽然不可能穷尽物质世界全部存在,越来越逼近物质世界本体却是不争的事实。
尤为值得注意的是,许许多多以往被闲置的数据,由于一些精明商家的开发和利用,开始“变废为宝”。一个耳熟能详的案例,就是那个“尿片+啤酒”的商业发现与行动。世界最大零售商沃尔玛通过大数据统计和分析发现,男性顾客在购买婴儿尿片时,常常会顺便搭配几瓶啤酒,于是推出将啤酒和尿片捆绑销售的促销手段,从而有效提高了啤酒销量。
凡此种种表明,如同宇宙大爆炸般飞速扩张的“数字世界”,不仅日益成为外在的客观物质世界的“镜像”,而且正在越来越多地包含了对人类自身行为的追踪和记录,成为人类观察和认识自我的“镜子”。
二者的叠加,形成一个有趣的悖论:由大数据构筑而成的数字世界,在日趋脱离客观物质世界的同时,又越来越接近世界的本原。因此,人们在解码这样一个虚拟世界的同时,也在一定程度上改变着对世界的看法。
然而,就在哲学家们对数字世界的属性还没有来得及给出明确界定之际,为利益所驱动的商家们却迫不及待地启动了对这一新矿藏的发掘。
他们是如此的急切:还没来得及弄清两个相关现象之间的互动机理或因果关系,便急匆匆地将其中的商机转化为提升经济效益的手段;云计算技术刚刚出现,便迅速地将统计分析对象由随机采样拓展为可获取的全部数据;为寻求“大数据的高效率”,不惜置“小数据的精确度”于不顾……
回过头来看,正是这近乎“饥不择食”的匆忙,竟在无意中成就了认识数字世界的锁钥:不再执着于因果关联,不再满足于抽样分析,不再一味地追求精确度的提高,转而直面模糊与混杂,关注看似不相关的相关现象。这一系列有别于以往的方法,为人类认识世界、解决问题提供了传统工具箱中没有的新工具。
诚如史蒂夫·洛尔在本书中的比喻,这些大数据时代的新工具,犹如“望远镜”或“显微镜”。“望远镜”让人们看得更远,发现新的星系;“显微镜”则将比细胞更加微小的世界展示在人们面前。人们据此看到并计量之前一无所知的事物。
抛开学术和技术层面的研讨,大数据及其应用几乎与生俱来就伴随了喋喋不休的争论。
其中有两个关键词,一是“开放”,一是“保护”。如果说开放就是要打破垄断分割,推动信息与数据互联互通;变革体制机制,实现数据资源共有共享;鼓励技术创新,促进大数据资源开发利用……最大限度地拓展数字世界“公共空间”,让大数据和云计算普惠大众,造福人类;那么保护则意味着要在数字世界为个人留下一方“私密领地”,或者为公权力划上一道不能逾越的“红线”——“风可进,雨可进,国王不能进”。
开放与保护,“公共空间”与“私密领地”,在这里构成既对立又统一的关系。对立在开放与保护“井水不 大数据主义 [DATA-ISM] 电子书 下载 mobi epub pdf txt
正版图书,正在学习当中,正在学习当中
评分用于公司员工学习的,很好的一本书
评分质量很好,正版图书,还会再次购买的
评分比较适合大数据销售来快速了解各种应用场景
评分京东的书都是正版,一次多买几本送货及时
评分666666
评分美中不足在于 一是书是翻译的,有些句子不是太通,语言习惯不太符合国人的表达;二是观点隐藏较深,需要仔细阅读,反复揣摩才能体会,但这也不应该算是缺点吧~;三是小标题确实有些“标题党”,文不对题的情况很多;四是书名原文是“预测分析”,与大数据关系不大,但翻译后硬是加上“大数据”,难免有博眼球之嫌
评分好书需要大家一起来支持一下!特别喜欢这些种类的纸质书!
评分写的很好,推荐大家读一下
大数据主义 [DATA-ISM] pdf epub mobi txt 电子书 下载