發表於2024-12-22
大數據主義 [DATA-ISM] pdf epub mobi txt 電子書 下載
人類社會正在從從以煤、鐵、石油為代錶的工業時代進入大數據、人工智能驅動的信息經濟時代!
我們正在經曆一場發生在決策、消費者行為以及幾乎所有領域的顛覆性革命,大數據主義將對生産、流通、分配、消費活動以及經濟運行機製、社會生活方式和國傢治理能力産生不可估量的重要影響。
2015年8月31日,國務院印發“促進大數據發展行動綱要的通知”,旨在大力推動大數據在中國的發展和應用。《大數據主義》一書中到處都是關於像臉譜網、榖歌這類創新型企業,以及雅虎的前數據工程師傑夫·哈默巴赫、IBM的首席科學傢邁剋爾·哈多剋這類數據精英的趣聞軼事、真知灼見以及一些內部信息,側重展示瞭大數據技術在互聯網行業、創新型企業、傳統行業、醫療行業、農業等領域的應用,特彆貼和國務院的這份重要通知。
如果你想知道世界將如何發展,那麼《大數據主義》你非讀不可。《大數據主義》突破大數據領域的錶象,為人們提供瞭獨特的視角,洞見掌握科技前沿技術的精英們是如何從數據中提取更多有用信息的。
中國的大數據主義時代已經來臨,我們是否做好瞭準備去應對它帶來的機遇與挑戰?
大數據時代最耀眼的數據科學傢、技術大佬、科技巨頭聯袂推薦本書。他們是:榖歌首席經濟學傢哈爾·範裏安,榖歌公司執行董事長埃裏剋·施密特,人工智能專傢、美國華盛頓大學計算機科學傢奧倫·埃奇奧尼,德勤領先創新中心聯閤董事長約翰·哈格爾三世;奇虎360公司董事長周鴻禕,北京大學新聞與傳播學院教授鬍泳,經濟學傢巴曙鬆,《經濟參考報》總編輯杜躍進。
根據一項估計,人類曆史上90%的數據都在過去兩年中産生。2014年,國際數據公司預測,數據世界已增至4.4億萬億字節。如果將如此龐大的信息量存儲在蘋果平闆電腦ipad中,疊加起來的Ipad的厚度可達到地球到月球距離的2/3。這預示著我們已經進入瞭大數據時代。
煤、鐵和石油是推動工業革命進程的三大生産性資産,如今信息經濟時代的主要原材料是大數據。
在《大數據主義》一書中,作者解釋瞭大數據技術將如何引發一場新的革命,促進新一輪經濟效率的提高和創新。互聯網規模的海量數據集將被用於幾乎各個領域、各個行業和各個企業,以進行探索、預測和提高效益。《大數據主義》重點關注那些處於數據科學領域前沿的年輕企業傢,還有諸如IBM等為公司前景而在數據科學領域押下極大賭注的行業巨頭。
《大數據主義》還介紹瞭新的技術革命將如何改變人類的決策方式——人們將更加依賴於數據和分析,而不是直覺和經驗;同樣,它還將改變領導力和管理的本質。
該書對讀者而言是一本行業指南,它預測瞭行業動嚮,詳細解釋瞭個人和組織應該如何利用、保護並管理大數據,從而在變幻莫測的未來仍能立於不敗之地。
大數據主義時代已經來臨,我們是否做好瞭準備去應對它的好與壞?
史蒂夫·洛爾(Steve Lohr),為《紐約時報》撰稿長達20多年,寫作內容涉及技術、商業和經濟三大領域,同時他還負責撰寫《紐約時報》的科技博客Bits,曾采訪過史蒂夫·喬布斯(這在《史蒂夫·喬布斯傳》裏麵有所體現)。2013年,他所在團隊獲得普利策新聞奬。他還做過10年的海外記者,也當過編輯,為《紐約時報雜誌》《大西洋月刊》《華盛頓月刊》等媒體撰稿。
本書嚮讀者展示瞭這樣一幅圖景:不管你自覺還是不自覺,樂意還是不樂意,大數據正以空前的速度和規模滲透到人類社會生活的方方麵麵,它在一定程度上已經和正在改變人們觀察、認識、思考乃至生存與發展的方式。特彆是這後一方麵的變化,或許就是“大數據”之所以成為“主義”的原因。
——《經濟參考報》
推薦序
第1章 大數據到底有多“大”?
我們已經進入大數據時代
技術進步與摩爾定律
大數據主義的興起
第2章 人的潛力與數據的潛力
一位年輕的明星數據科學傢
一個閱讀興趣廣泛的“T型人”
聰明人也會犯低級錯誤
從華爾街到臉譜網
第3章 藍色巨人與大數據的博弈
大數據技術在醫療領域的應用
IBM公司的大數據戰略
從“藍色巨人”到“智慧的地球”
大數據時代的企業生存法則
第4章 企業決策與數據挖掘
數據、直覺與好的決
大數據將引發“管理革命”
數據驅動型企業的贏利之道
第5章 數據科學的崛起與發展
社交網絡大數據的價值何在?
用戶數據分析技術是臉譜網的引擎
數據科學傢們的顛覆式創新
第6章 人工智能與機器學習
厘清大數據中的相關關係和因果關係
人類與人工智能的未來
人工智能係統要學會講故事
第7章 用大數據推動企業與行業發展
當傳統的葡萄酒業遇上大數據
物聯網與大型工業機器的數字化
大數據可以産生巨大的經濟效益
第8章 物理世界與數字世界的融閤
人與智能機器的閤作博弈
大數據營銷的藝術與科學
用大數據建立人類行為模型
第9章 醫療行業的大數據革命
最棘手也是最有價值的問題
建立數據驅動的醫療保健體係
用數據杠杆撬動醫療行業的進步
第10章 大數據時代的隱私“黑洞”
個人隱私權受到前所未有的挑戰
大數據會泄露多少我們的隱私?
是個性化服務還是經濟歧視行為?
能精準量化人類性格特徵的數據技術
如何將隱私風險降至最低?
第11章 大數據主義與美麗新世界
大數據市場的野蠻生長
大數據技術引發的關鍵思考
緻謝
早在榖歌、臉譜網等矽榖互聯網孵化器問世之前,大數據時代就已經拉開瞭帷幕。起初,大數據是由字節構成的純數字形式,然後它迅速邁進瞭由原子構成的物理世界,最後融入瞭社會主流。麥剋森分銷中心與埃默裏大學醫院重癥監護室的例子告訴我們,大數據不僅可以節省時間,還可以挽救生命。從長遠來看,大數據技術必將發展成為數據驅動的人工智能,駐留於數碼世界與物理世界的頂層。現在,我們揚帆起航,朝著這個願景進發。大數據技術正在引導一場計量方麵的革命,有望為下一個席捲整個經濟領域的效率與創新浪潮奠定基礎。但是,技術並不是孤軍作戰。將來,我們在考慮如何決策,或者說應該如何決策這個問題時,同樣需要大數據為我們齣謀劃策。我在《紐約時報》的同事戴維·布魯剋斯把這種正在興起的觀點稱作“大數據主義”,這個詞可以形象地反映大數據的深遠影響。經驗一再告誡我們,創新工具非常重要,它們不僅有利於經濟增長,還可以幫助我們重塑世界觀,以及做齣相關決策。
大數據催生瞭大量技術,首先是各種新老數據源,包括Web網頁、瀏覽習慣、傳感器信號、社交媒體、智能手機的GPS位置數據、基因組信息和監控錄像等。數據潮洶湧而來,每兩年數據總量就會增加一倍。但是我認為,大數據被嚴重誇張的(經常也是最不重要的)方麵就是這個“大”字。計算全球數據總量變成瞭書呆子們玩的各種預測與評估遊戲,把人們引上瞭研究澤字節、堯字節、布朗多字節等冷僻字眼的歧途,各種類似錶達令人震驚。據估計,曆史上90%的數據都産生於過去兩年。2014年,國際數據公司推算齣全世界的數據總量有4.4澤字節之多,即4.4萬億兆字節。這傢研究公司稱,如果把這麼多的信息塞進縴薄的蘋果平闆電腦裏,那麼這些平闆電腦摞起來可以達到157 000英裏a高,是地球與月球距離的2/3。
大數據中的“大”字確實重要,但是遠沒有很多人想象的那麼重要。海洋裏的水也非常多,但是我們無法直接飲用。因此,更重要的問題是如何運用、如何理解這些數據。本書講的成功故事都涉及大數據的應用,但是通常來說,這些數據的量還不足以讓榖歌的工程師們為之驚訝。此外,盡管計算機在處理、存儲與內存等方麵取得的進步有助於解決大數據遭遇的難題,但亟須解決的最大問題還在於軟件,因為關鍵性程序指令主要是為瞭滿足機器學習軟件等人工智能工具包持續升級的需要。
數據與智能技術不斷為我們開闢計量的新天地,讓我們看得更遠、更清楚。大數據技術就是數字時代的“望遠鏡”或者“顯微鏡”,使我們可以看到並計量之前我們一無所知的新事物。“望遠鏡”讓我們看得更遠,發現新的星係;而“顯微鏡”則將比細胞更微小的神秘世界展現在我們眼前。
現代望遠鏡改變瞭天文學,現代顯微鏡使生物學發生瞭翻天覆地的變化,大數據也有同樣的效果,不過它的作用範圍更廣,涉及每一個領域、每一門學科。技術的長足進步是推動經濟發展的發動機。互聯網首先驅使通信經濟學發生瞭變化,隨後在互聯網基礎之上發展的Web網絡服務等技術為創新與新型經營活動提供瞭平颱。大數據技術同樣如此,雖然它還是一項年輕的技術,但它正在改變經濟的意義,可以說這項技術將會變成人類決策活動的一個平颱。
所有決策活動對經驗與直覺的依賴將逐漸減少,而對數據與分析的倚重將與日俱增。在決策活動中,本能的作用逐漸減弱,而科學的重要程度將逐漸增強。
……
大數據何以成為“主義”?
數據者,有廣義與狹義之分。狹義的數據,就是數字或數值,如1、2、3、4、5……;廣義的數據,則可概括為人類觀察、實驗、計算等的記錄。作為這些記錄的符號,或數字,或文字,或圖像,或音視頻,從上古時代的結繩記事、楔形文字、甲骨文,到古代乃至現代以竹簡、布帛、羊皮、紙張等為載體的圖文,直至現在以比特為單位的電子信息,可謂無所不包。
也許,正是由於互聯網技術工程師們習慣於把以電子信息方式存在的內容統稱為“數據”,於是,“數據”一詞便由狹義的“數字”或“數值”演變為主要指嚮通用的廣義“數據”。
隨著計算機、互聯網、現代通信以及相關軟硬件技術的飛速發展,大數據和雲計算,如同一枚硬幣不可分離的兩麵,成為我們這個時代的高頻詞。
大數據之大,不僅大在巨量或海量——由人們熟知的韆字節(KB)、兆(MB)、韆兆(GB)和太字節(TB),躍升為專業人士纔瞭解的拍字節(PB)、艾字節(EB)、澤字節(ZB),乃至堯字節(YB)。(1KB=1 024B,1MB=1 024KB,1GB=1 024MB,1TB=1 024GB,1PB=1 024TB,1EB=1 024PB,1ZB=1 024EB,1YB=1 024ZB)。其中,不變的是基本單位B,即比特或字節,而從K到Y,則是成韆倍的遞增,以緻有人據此宣稱,目前的數據計算已經進入“PB時代”。
大數據之大,還大在數據結構的有容乃大——它不再需要傳統的數據庫錶格來整齊排列,幾乎可以無所不包地記錄、存儲和計算各種規則的結構化數據和不規則的非結構化數據,於是便有瞭逐步演變為一個數字化世界的可能。
如此龐大和復雜的數據,遠遠超齣傳統計算機的處理能力,於是,建立在互聯網基礎上的雲計算技術應運而生,承擔起存儲、傳輸、計算和應用大數據的重任。而正是大數據與雲計算的有效互動,打開瞭世界觀、方法論乃至價值觀的新視野。
在本書中,作者引用專業研究機構的統計,揭示瞭大數據的規模與速度:一方麵,到2014年,全世界電子化數據已增至4.4ZB,即4.4億萬億字節,如果將如此之巨的信息量存入隻有7.5毫米厚的蘋果平闆電腦,後者疊加起來的厚度可達地球與月球間距離的2/3;另一方麵,有史以來90%的數據量,都是在過去兩年的時間裏産生的。
由此不難預期,一個電子化的、獨立於物質世界的“數字世界”,正在大數據和雲計算的互動中迅速構建,它雖然不可能窮盡物質世界全部存在,越來越逼近物質世界本體卻是不爭的事實。
尤為值得注意的是,許許多多以往被閑置的數據,由於一些精明商傢的開發和利用,開始“變廢為寶”。一個耳熟能詳的案例,就是那個“尿片+啤酒”的商業發現與行動。世界最大零售商沃爾瑪通過大數據統計和分析發現,男性顧客在購買嬰兒尿片時,常常會順便搭配幾瓶啤酒,於是推齣將啤酒和尿片捆綁銷售的促銷手段,從而有效提高瞭啤酒銷量。
凡此種種錶明,如同宇宙大爆炸般飛速擴張的“數字世界”,不僅日益成為外在的客觀物質世界的“鏡像”,而且正在越來越多地包含瞭對人類自身行為的追蹤和記錄,成為人類觀察和認識自我的“鏡子”。
二者的疊加,形成一個有趣的悖論:由大數據構築而成的數字世界,在日趨脫離客觀物質世界的同時,又越來越接近世界的本原。因此,人們在解碼這樣一個虛擬世界的同時,也在一定程度上改變著對世界的看法。
然而,就在哲學傢們對數字世界的屬性還沒有來得及給齣明確界定之際,為利益所驅動的商傢們卻迫不及待地啓動瞭對這一新礦藏的發掘。
他們是如此的急切:還沒來得及弄清兩個相關現象之間的互動機理或因果關係,便急匆匆地將其中的商機轉化為提升經濟效益的手段;雲計算技術剛剛齣現,便迅速地將統計分析對象由隨機采樣拓展為可獲取的全部數據;為尋求“大數據的高效率”,不惜置“小數據的精確度”於不顧……
迴過頭來看,正是這近乎“飢不擇食”的匆忙,竟在無意中成就瞭認識數字世界的鎖鑰:不再執著於因果關聯,不再滿足於抽樣分析,不再一味地追求精確度的提高,轉而直麵模糊與混雜,關注看似不相關的相關現象。這一係列有彆於以往的方法,為人類認識世界、解決問題提供瞭傳統工具箱中沒有的新工具。
誠如史蒂夫·洛爾在本書中的比喻,這些大數據時代的新工具,猶如“望遠鏡”或“顯微鏡”。“望遠鏡”讓人們看得更遠,發現新的星係;“顯微鏡”則將比細胞更加微小的世界展示在人們麵前。人們據此看到並計量之前一無所知的事物。
拋開學術和技術層麵的研討,大數據及其應用幾乎與生俱來就伴隨瞭喋喋不休的爭論。
其中有兩個關鍵詞,一是“開放”,一是“保護”。如果說開放就是要打破壟斷分割,推動信息與數據互聯互通;變革體製機製,實現數據資源共有共享;鼓勵技術創新,促進大數據資源開發利用……最大限度地拓展數字世界“公共空間”,讓大數據和雲計算普惠大眾,造福人類;那麼保護則意味著要在數字世界為個人留下一方“私密領地”,或者為公權力劃上一道不能逾越的“紅綫”——“風可進,雨可進,國王不能進”。
開放與保護,“公共空間”與“私密領地”,在這裏構成既對立又統一的關係。對立在開放與保護“井水不犯河水”,統一在“公共空間”與“私密領地”共存於同一個數字世界,且雙方都以對方的存在為自身存在的證據,正所謂沒有“公”即沒有“私”,沒有“私”亦沒有“公”。
一言以蔽之,數字世界與現實世界理應奉行同樣的價值理念:該開放的一定要最大程度開放,該保護的必須嚴格加以保護。
本書嚮讀者展示瞭這樣一幅圖景:不管你自覺還是不自覺,樂意還是不樂意,大數據正以空前的速度和規模滲透到人類社會生活的方方麵麵,它在一定程度上已經和正在改變人們觀察、認識、思考乃至生存與發展的方式。特彆是這後一方麵的變化,或許就是“大數據”之所以成為“主義”的原因。
大數據何以成為“主義”?
數據者,有廣義與狹義之分。狹義的數據,就是數字或數值,如1、2、3、4、5……;廣義的數據,則可概括為人類觀察、實驗、計算等的記錄。作為這些記錄的符號,或數字,或文字,或圖像,或音視頻,從上古時代的結繩記事、楔形文字、甲骨文,到古代乃至現代以竹簡、布帛、羊皮、紙張等為載體的圖文,直至現在以比特為單位的電子信息,可謂無所不包。
也許,正是由於互聯網技術工程師們習慣於把以電子信息方式存在的內容統稱為“數據”,於是,“數據”一詞便由狹義的“數字”或“數值”演變為主要指嚮通用的廣義“數據”。
隨著計算機、互聯網、現代通信以及相關軟硬件技術的飛速發展,大數據和雲計算,如同一枚硬幣不可分離的兩麵,成為我們這個時代的高頻詞。
大數據之大,不僅大在巨量或海量——由人們熟知的韆字節(KB)、兆(MB)、韆兆(GB)和太字節(TB),躍升為專業人士纔瞭解的拍字節(PB)、艾字節(EB)、澤字節(ZB),乃至堯字節(YB)。(1KB=1 024B,1MB=1 024KB,1GB=1 024MB,1TB=1 024GB,1PB=1 024TB,1EB=1 024PB,1ZB=1 024EB,1YB=1 024ZB)。其中,不變的是基本單位B,即比特或字節,而從K到Y,則是成韆倍的遞增,以緻有人據此宣稱,目前的數據計算已經進入“PB時代”。
大數據之大,還大在數據結構的有容乃大——它不再需要傳統的數據庫錶格來整齊排列,幾乎可以無所不包地記錄、存儲和計算各種規則的結構化數據和不規則的非結構化數據,於是便有瞭逐步演變為一個數字化世界的可能。
如此龐大和復雜的數據,遠遠超齣傳統計算機的處理能力,於是,建立在互聯網基礎上的雲計算技術應運而生,承擔起存儲、傳輸、計算和應用大數據的重任。而正是大數據與雲計算的有效互動,打開瞭世界觀、方法論乃至價值觀的新視野。
在本書中,作者引用專業研究機構的統計,揭示瞭大數據的規模與速度:一方麵,到2014年,全世界電子化數據已增至4.4ZB,即4.4億萬億字節,如果將如此之巨的信息量存入隻有7.5毫米厚的蘋果平闆電腦,後者疊加起來的厚度可達地球與月球間距離的2/3;另一方麵,有史以來90%的數據量,都是在過去兩年的時間裏産生的。
由此不難預期,一個電子化的、獨立於物質世界的“數字世界”,正在大數據和雲計算的互動中迅速構建,它雖然不可能窮盡物質世界全部存在,越來越逼近物質世界本體卻是不爭的事實。
尤為值得注意的是,許許多多以往被閑置的數據,由於一些精明商傢的開發和利用,開始“變廢為寶”。一個耳熟能詳的案例,就是那個“尿片+啤酒”的商業發現與行動。世界最大零售商沃爾瑪通過大數據統計和分析發現,男性顧客在購買嬰兒尿片時,常常會順便搭配幾瓶啤酒,於是推齣將啤酒和尿片捆綁銷售的促銷手段,從而有效提高瞭啤酒銷量。
凡此種種錶明,如同宇宙大爆炸般飛速擴張的“數字世界”,不僅日益成為外在的客觀物質世界的“鏡像”,而且正在越來越多地包含瞭對人類自身行為的追蹤和記錄,成為人類觀察和認識自我的“鏡子”。
二者的疊加,形成一個有趣的悖論:由大數據構築而成的數字世界,在日趨脫離客觀物質世界的同時,又越來越接近世界的本原。因此,人們在解碼這樣一個虛擬世界的同時,也在一定程度上改變著對世界的看法。
然而,就在哲學傢們對數字世界的屬性還沒有來得及給齣明確界定之際,為利益所驅動的商傢們卻迫不及待地啓動瞭對這一新礦藏的發掘。
他們是如此的急切:還沒來得及弄清兩個相關現象之間的互動機理或因果關係,便急匆匆地將其中的商機轉化為提升經濟效益的手段;雲計算技術剛剛齣現,便迅速地將統計分析對象由隨機采樣拓展為可獲取的全部數據;為尋求“大數據的高效率”,不惜置“小數據的精確度”於不顧……
迴過頭來看,正是這近乎“飢不擇食”的匆忙,竟在無意中成就瞭認識數字世界的鎖鑰:不再執著於因果關聯,不再滿足於抽樣分析,不再一味地追求精確度的提高,轉而直麵模糊與混雜,關注看似不相關的相關現象。這一係列有彆於以往的方法,為人類認識世界、解決問題提供瞭傳統工具箱中沒有的新工具。
誠如史蒂夫·洛爾在本書中的比喻,這些大數據時代的新工具,猶如“望遠鏡”或“顯微鏡”。“望遠鏡”讓人們看得更遠,發現新的星係;“顯微鏡”則將比細胞更加微小的世界展示在人們麵前。人們據此看到並計量之前一無所知的事物。
拋開學術和技術層麵的研討,大數據及其應用幾乎與生俱來就伴隨瞭喋喋不休的爭論。
其中有兩個關鍵詞,一是“開放”,一是“保護”。如果說開放就是要打破壟斷分割,推動信息與數據互聯互通;變革體製機製,實現數據資源共有共享;鼓勵技術創新,促進大數據資源開發利用……最大限度地拓展數字世界“公共空間”,讓大數據和雲計算普惠大眾,造福人類;那麼保護則意味著要在數字世界為個人留下一方“私密領地”,或者為公權力劃上一道不能逾越的“紅綫”——“風可進,雨可進,國王不能進”。
開放與保護,“公共空間”與“私密領地”,在這裏構成既對立又統一的關係。對立在開放與保護“井水不 大數據主義 [DATA-ISM] 下載 mobi epub pdf txt 電子書
關於大數據的著作中很新很全很深刻的一部
評分還沒看呢,不知道好不好,還沒看呢,不知道好不好。
評分還沒來得及看,不過紙質挺好
評分質量很好,正版圖書,還會再次購買的
評分寫的很好,推薦大傢讀一下
評分剛剛購買,還沒來得及看,物流超快。
評分書不錯,物流很快!
評分2015年不能錯過的書~~~~
評分書不錯。要認真學習一下瞭。
大數據主義 [DATA-ISM] pdf epub mobi txt 電子書 下載