發表於2024-12-22
數據之巔 大數據革命,曆史、現實與未來 pdf epub mobi txt 電子書 下載
《數據之巔》作者開中國大數據之先河,《數據之巔》內容更加豐富,觀點更加震撼,堪稱作者集大成之作。《數據之巔》將再次掀起全民閱讀大數據的熱潮。
作者是中國數據文化的首倡者,提齣把科技符號變成文化符號的理念,倡導數據治國的理論。
數據,科學的生機和命脈;數據之巔,進入科學的殿堂,**未來的思索。記住,我們要用數據來說話,用科學來思考。
史學傢許倬雲、招行前行長馬蔚華、中國寬帶資本董事長田溯寜聯袂推薦;神州數碼公司董事局主席郭為、中信銀行行長硃小黃、萬嚮集團副董事長肖風傾情解讀。
《數據之巔》案例豐富,生動,讀起來趣味盎然,又不失科學的風采和素養。
海報:
更多精彩,點擊進入中信齣版集團品牌店》
數據,自古就有,人口普查、農業統計、軍事戰爭、政治計算……數據雖小,卻有助於治國安邦。美國之所以繁榮鼎盛,數據文化根基牢不可破概是主因之一。
信息爆炸、互聯互通、智慧城市時代,大數據,更以排山倒海之勢席捲全球,政府施政、企業掘金,大眾要公平與正義,大數據被賦予瞭新的曆史使命。
在《數據之巔:大數據革命,曆史、現實與未來》這本書中,從小數據時代到大數據的崛起,作者以宏大的曆史觀、文化觀、大數據觀,給我們描繪瞭一幅數據科學、智慧文化的全景圖。全書從美國建國之基講起,通過闡述初數時代、內戰時代、鍍金時代、進步時代、抽樣時代、大數據時代的特徵,係統梳理瞭美國數據文化的形成,闡述瞭其數據治國之道,論述瞭中國數據文化的薄弱之處,展望瞭未來數據世界的遠景。
“尊重事實,用數據說話”,“推崇知識和理性,用數據創新”,作者不僅意在傳承黃仁宇“數目字”管理的薪火,還試圖把數據這個科技符號在中國轉變為文化符號,形成一種文化話語體係。大數據正在撬動中國的製度創新、科技創新。閱讀此書,曆史與現實相互融閤,知識與激情相互交織,思想與觀念相互碰撞,未來與前景必定豁然開朗。
塗子沛,江西吉安人,現居美國矽榖。2012年其著作《大數據》在中國社會開大數據之先河,引發瞭大數據戰略、數據治國和開放數據的討論,曆史學傢許倬雲先生盛贊其“為華文世界開創瞭一個重要話題”。本書為作者第二本著作,全書對大數據追根溯源,提齣當前信息技術的發展,已經讓中國獲得瞭後發優勢,中國要在大數據時代的全球競爭中勝齣,必須把大數據從科技符號提升成為文化符號,在全社會倡導數據文化。
作者本科畢業於華中科技大學計算機係,研究生畢業於中山大學和卡內基梅隆大學,獲公共管理碩士和信息科學碩士學位。
★塗子沛先生開啓瞭一道大門,我相信,後麵會有更多的發展,讓大傢進入這一個重要的現代文化園地。
——許倬雲著名曆史學傢、美國匹茲堡大學曆史係榮譽講座教授
★在《數據之巔》這本書中,塗先生跳到瞭哲學思考的層麵,以統計學的社會應用為切入點,解構數據文化在美國政治、經濟乃至軍事發展上起到的關鍵作用,一環扣一環,構思精巧,故事生動,邏輯清晰,讀起來實在“解渴”。感謝塗先生的智慧,為時代貢獻瞭一部傑作!
——郭為神州數碼控股有限公司董事局主席
★塗子沛先生的《數據之巔》通過追溯梳理美國的數據曆史、展望人類的數據未來,給中國社會提齣瞭一個數據時代的新命題——如何構建數據文化?本書引人入勝、發人深思,是不可不讀的好書。
——馬蔚華招商銀行前行長
★數據本無大小,但運用數據的立場卻分齣大小,是謂大數據。數據錶示的是過去,但錶達的是未來,所以觀察數據需要有曆史觀。塗子沛先生的這本新作《數據之巔》以大曆史、大數據、大社會、大進步的格局,通過數據將遙遠拉近,將悠久縮短,將巨大歸聚,將過程簡直。無論你從事何業或研究何題,都值得認真閱讀這部**之作。
——硃小黃中信銀行行長、中信集團監事長
★大數據是互聯網金融的基礎支柱。互聯網金融是雲計算、大數據、社交網絡這個移動互聯大時代裏的小時代。時代潮流,浩浩蕩蕩!塗子沛先生的大數據係列著作,帶您觀時代大潮!
——肖風通聯數據董事長、萬嚮信托董事長
★塗子沛先生《數據之巔》一書的曆史高度和現實意義,超齣瞭他的《大數據》。如果說他上部書開啓瞭中國人對大數據的認識,此書則從曆史的角度來說明,對數據的理解和掌握是人類文明進步的標誌。中國人在“初數時代”是被動的、落後的,黃仁宇在他的名著《萬曆十五年》中也將中國明朝未能走嚮資本主義歸結為中國人不能在“數目字上管理國傢”。在新世紀的大數據時代,我們能否成為參與者甚至領導者?子沛這本書中有諸多可貴的思考和啓示,我嚮讀者推薦。
——田溯寜中國寬帶資本董事長
★塗先生深思熟慮,用語殷殷,穿行在中美兩國的曆史中,努力發掘各個大數據改變觀念,改造社會,改革製度的故事,無論人與事件,都是栩栩如生,發人深省。這本書讓我們有目標有信心,也給我們創新的無限空間。
——王巍中國金融博物館理事長
★大數據的江湖有兩派,國傢治理派和産業升級派。塗子沛先生無疑是國傢治理派的宗師,這本書在美國200多年的政界商海、刀光劍影中勾勒齣雄渾的數據思維、文化、價值觀和方法論。臨到尾處,我的期待愈來愈強。他的**本書《大數據》在通篇的曆史視角、西方視角後,煞費苦心附上一篇“挑戰中國”的尾聲,把人拉迴當下、令人掩捲憂思;這次果不其然,子沛以整整一章的濃墨重彩,挑戰瞭“智慧城市”這一兼具進行時和未來時的話題,而當涉及中國元素時,子沛的行文中齣現瞭暖色調,那種欣賞和希冀讓人寬慰之極、意猶未盡!期待《數據之巔》之後,山不窮,峰更高。
——吳甘沙英特爾中國研究院院長
★塗子沛先生已經成為中國大數據和數據分析領域*前沿的思想者和專傢,如果您想瞭解大數據的曆史、現實和未來,這本書將是您的必讀書目。
——托馬斯·H·達文波特巴布森學院教授,麻省理工學院數字商務中心研究員
第七章 大數據時代:通往計算型的智能社會
大數據是人類文明新的土壤,在這片土壤之上,人類將開始建設一個智能社會。
—本書作者,2014年
世上本沒有數:正解大數據
傳統意義上的“數據”,是指“有根據的數字”,數字之所以産生,是因為人類在實踐中發現,僅僅用語言、文字和圖形來描述這個世界是不精確的,也是遠遠不夠的。例如,有人問“姚明有多高”,如果迴答說“很高”、“非常高”、“最高”,彆人聽瞭,隻能得到一個抽象的印象,因為每個人對“很”、“非常”有不同的理解,“最”也是相對的,但如果迴答說“2.26米”,就一清二楚。除瞭描述世界,數據還是我們改造世界的重要工具。人類的一切生産、交換活動,可以說都是以數據為基礎展開的,例如度量衡、貨幣的背後都是數據,它們的發明和齣現,都極大地推動瞭人類文明的進步。
數據最早來源於測量,所謂“有根據的數字”,是指數據是對客觀世界測量結果的記錄,而不是隨意産生的。測量是從古至今科學研究最主要的手段,可以說,沒有測量,就沒有科學;也可以說,一切科學的本質都是測量。就此而言,數據之於科學的重要性,就像語言之於文學、音符之於音樂、形色之於美術一樣,離開數據,就沒有科學可言。
除瞭測量,新數據還可以由老數據經計算衍生而來。測量和計算都是人為的,也就是說,世上本沒有數,一切數據都是人為的産物。我們說的“原始數據”,並不是“原始森林”這個意義上的“原始”,原始森林是指天然就存在的,而原始數據僅僅是指第一手的、沒有經過人為修改的數據。
傳統意義上的數據,和信息、知識也是完全不同的概念:數據是信息的載體,信息是有背景的數據,而知識是經過人類的歸納和整理,最終呈現規律的信息。
圖7–1 傳統意義上的數據和信息的區彆
但進入信息時代之後,“數據”二字的內涵開始擴大:不僅指代“有根據的數字”,還統指一切保存在電腦中的信息,包括文本、圖片、視頻等。其中的原因是,20世紀60年代軟件科學取得瞭巨大進步、發明瞭數據庫,此後,數字、文本、圖片都不加區分地保存在電腦的數據庫中,數據也逐漸成為“數字、文本、圖片、視頻”等的統稱,也即“信息”的代名詞。
文本、音頻、視頻本身就已經是信息,而且其來源也不是對世界的測量,而是對世界的一種記錄,所以信息時代的數據又多瞭一個來源:記錄。
圖7–2 數據的三大來源
圖7–3 現代意義上的“數據”:範疇比信息還要大
注:進入信息時代之後,數據成為信息的代名詞,兩者可以交替使用。一封郵件雖然包含很多條信息,但從技術的角度齣發,可能還是“一個數據”,就此而言,現代意義上的數據的範疇,其實比信息還大。
除瞭內涵的擴大,數據庫發明之後,還齣現瞭另外一個重要現象,那就是數據的總量在不斷增加,而且增加的速度不斷加快。
20世紀80年代,美國就有人提齣瞭“大數據”的概念。這個時候,其實還沒有進入數據大爆炸的時代,但有人預見到,隨著信息技術的進步,軟件的重要性將下降,數據的重要性將上升,因此提齣“大數據”的概念。這時候的“大”,如“大人物”和“大轉摺”之“大”,主要指價值上的重要性;到瞭21世紀前10年,尤其是2004年社交媒體産生之後,數據開始爆炸,大數據的提法又重新進入大眾的視野並獲得瞭更大的關注。這個時候的“大”,含義也更加豐富瞭:一是指容量大,二是指價值大。
從這個角度齣發,大數據可以首先理解為傳統的小數據加上現代的“大記錄”,這種大記錄的主要錶現形式是文本、圖片、音頻、視頻等,和傳統的測量完全是兩迴事。而且大數據之所以“大”,主要是“大記錄”的增長,基於信息技術的進步,人類記錄的範圍在不斷擴大:
大數據 = 傳統的小數據 + 現代的大記錄
(源於測量) (源於記錄)
但到底多大纔算大呢?針對這一問題,十多年來爭議頗多。這首先涉及衡量數據大小的單位,2000年的時候,一般認為,“太”(T)級彆的數據就是大數據瞭,當時擁有“太”級彆數據的企業並不多,但自此之後,互聯網企業開始崛起,這些企業擁有各種各樣的數據,其中大部分都是文本、圖片和視頻,其數據量之大,傳統企業根本無法望其項背。
理解幾個主要的存儲單位
一首音樂 ≈ 4兆(M)
一部電影 ≈ 1吉(G,1吉=1 024兆,相當於250首歌麯的大小)
一個普通圖書館的藏書 ≈ 1太(T,1太=1 024吉,相當於1 024部電影的大小)
我認為,不僅僅是互聯網行業,其實各行各業的數據都在爆炸,隻是規模不同。如果僅僅把大數據的標準限定在互聯網企業,認為隻有互聯網企業纔擁有大數據,那就嚴重窄化瞭大數據的意義。畢竟容量隻是錶象,價值纔是本質,而且大容量並不一定代錶大價值,大數據的真正意義還在於大價值,價值主要是通過數據的整閤、分析和開放而獲得。大數據是指人類有前所未有的能力來使用海量的數據,在其中發現新知識、創造新價值,從而為社會帶來“大知識”、“大科技”、“大利潤”和“大智能”等發展機遇。
以上論述,是從概念上分析“數據”和“大數據”的區彆,而掌握一個概念最好的方法,還是從動態上瞭解其成因。大數據的成因,還是人類信息技術的進步,而且是信息技術領域不同時期多個進步交互作用的結果,其中最重要的原因,當數摩爾定律。
改變世界的三股力量:大數據的成因
1965年,英特爾的創始人之一戈登·摩爾(Gordon Moore)在考察瞭計算機硬件的發展規律之後,提齣瞭著名的摩爾定律。該定律認為,同一麵積芯片上可容納的晶體管數量,一到兩年將增加一倍。1
要理解這種增加的意義,並不簡單。摩爾的本意是,由於單位麵積芯片上晶體管的密度增加瞭,計算機硬件的處理速度、存儲能力,即其主要性能一到兩年將提升一倍。本來性能提升瞭,價格也應該上升纔對,但現實卻很詭異:半個多世紀以來,硬件的性能不斷提高,價格卻持續下降。之所以這樣,竟然還是因為晶體管越做越小,這種體積的縮小也導緻其成本下降,再加上人類對晶體管的需求越來越大,大規模的生産也導緻價格不斷下降。
迴顧這半個多世紀的曆史,硬件的發展基本符閤摩爾定律。以物理存儲器為例,其性能確實不斷上升,與此同時,價格不斷下降。1955年,IBM推齣瞭第一款商用硬盤存儲器,一兆字節的存儲量需要6 000多美元,此後,其價格不斷下降:1960年,一兆字節下降到3 600美元;1993年,下降到大概1美元;2000年,再降至1美分左右;到2010年,每兆價格約為0.005美分。半個多世紀,存儲器的價格下降瞭1億多倍,這種變化的速度既巨大又劇烈,令人瞠目結舌。事實上,考察人類全部的曆史,沒有其他任何一種産品的價格下降空間能夠如此巨大!
圖7–4 1971~2011年中央處理器上的晶體管數量和摩爾定律
注:縱坐標為晶體管數量,橫坐標為年份。該麯綫錶明,在1971~2011年,大概每兩年相同麵積的中央處理器集成電路上的晶體管數量就增加1倍。需要注意的是,縱坐標從2 300到10 000再到
100 000,其實不成比例,如果嚴格按比例作圖,這將是一條非常陡峭的麯綫,頁麵將無法容納。(資料來源:維基百科)
晶體管的産量多過全世界的大米顆粒
……
進入一個重要的現代文化園地
許倬雲 著名曆史學傢、美國匹茲堡大學曆史係榮譽講座教授
塗子沛先生所著的這部大作,是大數據時代的應時之作。
他將數據用在管理和研究方麵的發展史,以其在美國的發展過程,作為主要內容。他從美國開國時期的人口普查,作為起點,討論民主製度如何經過數據的調查,纔能發展成為“一人一票”的製度。接著,19世紀中葉,美國嚮西開發,美國的工程兵團,進行丈量和調查,使美國的地理狀況和疆域,都有明白的依據。20世紀,“打孔”的計算方法,開創瞭後世計算器管理大量數據的技術。到今天,我們日常生活中,因為計算機和網絡的普及,無處沒有數據的存在。以我老病人為例,疾病的性質,或藥物的效果,都必須靠大量的數據,作為診斷和治療的依據。凡此,都是數據的使用。
美國的社會愈來愈復雜,資本主義的國傢,證券交易乃是一樁大事。單單用統計來管理證券,已經不太夠用。大概在最近30來年,許多大證券商,為瞭要預測經濟的起落和某一種産業的興衰,大量地使用不同産業之間的關係,也顧及國際貿易的情形。這些私營的企業界,幾乎都能相當精準地判斷市場的情形。於是,管理證券交易的美聯儲,實際上就是美國的中央銀行,也必須更細密地運用許多數據,以掌握經濟的全貌,然後再決定對市場供應的貨幣是從寬還是從緊。這纔是“大數據”的第一次使用。
中國古代兵書《孫子兵法》就說過:“算則勝,不算則不勝;多算勝,少算則不勝。”此處的“算”字,就是如何利用數字,來估計各種因素。一個能乾的將領,打一次戰役,要考慮到天時、地利、人和,這都是可以用數字錶現的。但是,一個治國的領袖,在上述因素以外,還得考慮許多其他的條件。1942年,日本偷襲珍珠港,以為可以一棒打死美國。他們沒算到,美國工業的實力,有充分的再生力量,三個月之內,美國立刻就能恢復足夠的海空實力。這就是日本軍人,隻知道計算戰役,不會計算戰爭。到今天,安倍野心勃勃,處處挑釁,他誌在日本復興。他的計算,大概又是計算自己現在的兵力和科技能力;他沒有算到,自己的原料供應不夠,能源不能自主,人口結構老化:這就是“算”得不夠。
“大數據”之“大”,就在於將各種分散的數據,彼此聯係,由點而綫,由綫而麵,由麵而層次,以瞻見更完整的覆蓋麵,也更清楚地理解事物的本質和未來的取嚮。人腦的結構,足夠發揮聯想力和推論。我們每天的日常生活,時時刻刻在不知不覺中,做“大數據”的工作,將許多因素綜閤在一起,作為行動和決定的依據。隻是一個國傢或一個社會的發展,不能全靠眼睛看得見的一些訊息,有許多事物,必須依靠全麵和長期的發展情況,纔能真實地反映當時一切決定的背景和條件。
今天信息科學的發展,已經能夠産生、存儲並實時地分析處理大量的信息,整閤多個源頭的數據,形成全麵的多項關係,指齣綫性的發展方嚮,引導我們有廣闊的視野。計算機今天處理數據的能力和速度,已經超過最聰明的個人。可是,用計算機的還是“人”,如何駕馭這些數字,還是“人”在設計。隻是,我們必須要有此認識:今天的世界,已經韆絲萬縷,將各地、各種行業、各種條件,糾纏成一個復雜的全球網絡。管理大企業和管理國傢,必須要有足夠的信息,瞭解多種多樣的情況,以全麵地理解各種問題及其彼此的關聯。即使是對個人而言,因為越來越多的行為已經轉變為電子化的記錄,其生活也和大數據息息相關。“大數據”這個課題,十分重要,我盼望有更多的學者,在這方麵提齣更多的作品。
塗子沛先生的大作,是討論大數據較早的中文作品;在此以前,還罕見討論數據為管理方式的書籍。這本書,主要是以美國社會中數據的使用為例。我知道他一心想用這些例子,提醒中國的讀者:在信息科學高度發展的今天,我們不能再忽略數據的使用。塗子沛先生開啓瞭一道大門,我相信,後麵會有更多的開
數據之巔 大數據革命,曆史、現實與未來 下載 mobi epub pdf txt 電子書
大數據時代,我們生活隨之改變
評分好書慢慢看,慢慢提高。哈哈哈哈哈哈。
評分新時代的學生和白領都應該看看
評分好書,很喜歡,是我想要的!書山有路勤為徑!好!!
評分很好用的。很好用的。很好用的。
評分書的質量沒得話講,是正版的
評分統一評價,都很不錯,滿意。
評分一本很好的書籍,瞭解瞭美國曆史文化,又瞭解瞭其技術,特彆是大數據的發展曆程。同時作者的寫作水平,文學功力也不低,值得精讀。
評分京東正版,價格實惠,值得購買。
數據之巔 大數據革命,曆史、現實與未來 pdf epub mobi txt 電子書 下載