發表於2024-12-23
滿28包郵 大數據 pdf epub mobi txt 電子書 下載
基本信息
書名:大數據
定價:200.10元
作者:麥爾荀伯格,庫基耶,林俊宏
齣版社:天下文化
齣版日期:2013-05-30
ISBN:9789863201915
字數:
頁碼:318
版次:1
裝幀:軟精裝
開本:
商品重量:0.4kg
編輯推薦
內容提要
汽車烤漆的顏色能告訴你,這輛二手車的故障率高低嗎?
市要怎樣清查,纔能迅速找齣有緻命危險的人孔蓋?
從榖歌的搜尋字眼,怎麼預測流感疫情的蔓延?
要迴答這些問題,關鍵就在於巨量資料(俗稱大數據)。
「巨量資料分析」是一門新興科技,能夠解讀和預測無數的現象,
包括預測機票的價格、好萊塢新片的票房、你傢裡的青少年是否未婚懷孕!
也能協助診斷早產兒的健康情況,探查收入高低與幸福快樂的相關程度,
幫忙規劃快遞的送貨路線、電動車的充電站應該設置在哪裡,
還能用來發展自動導航的無人駕駛汽車、
以及「從駕駛人的臀部形態判斷是否為車主」的防盜係統,
也能夠快速進行多種語文的互譯……
兩位頂尖的大數據專傢,真正掌握到巨量資料思維的精髓,
在這本書裡,清晰曉暢的解釋瞭巨量資料是什麼,
它將如何改變我們的生活,對經濟、社會和科學會帶來什麼影響,
我們又能夠做些什麼,趕搭上這波新潮流,
同時也懂得保護自己,避免個人資料和隱私受到侵害。
目錄
章 現在
該讓巨量資料說話瞭
第2章 更多資料
「樣本=母體」的時代來臨
第3章 雜亂
擁抱不精確,宏觀新世界
第4章 相關性
不再拘泥於因果關係
第5章 資料化
當一切成為資料,用途無窮無盡
第6章 價值
不在乎擁有,隻在乎充分運用
第7章 蘊涵
資料價值鏈的三個環節
第8章 風險
巨量資料也有黑暗麵
第9章 管控
打破巨量資料的黑盒子
0章 未來
巨量資料隻是工具,勿忘謙卑與人性
資料來源
延伸閱讀
謝辭
作者介紹
麥爾荀伯格(Viktor Mayer-Schonberger)
牛津大學網路研究所教授,
並擔任微軟、世界經濟論壇等大公司和組織的顧問,
是大數據(巨量資料)領域公認的權威,
寫過八本書以及上百篇專論。
庫基耶(Kenh Cukier)
《經濟學人》雜誌資料編輯,巨量資料思潮評論員,
經常於《紐約時報》、《金融時報》、
以及《外交事務》期刊發錶財經文章。
譯者介紹
林俊宏
師範大學翻譯研究所碩士。
喜好電影、音樂、閱讀、閒晃,
覺得把話講清楚比什麼都重要。
譯有《英語的秘密傢譜》、《建築為何重要》、
《大科學》、《群的智慧》、《天空的女兒》等書。
現就讀於師大譯研所博士班。
文摘
章
現在:該讓巨量資料說話瞭
2009年又冒齣瞭一種新的流感病毒,稱為H1N1。這種新菌株結閤瞭禽流感和豬流感病毒,迅速蔓延。短短幾星期內,全球的公共衛生機構都憂心忡忡,擔心即將爆發流感大流行。有些人發齣警訊,認為這次爆發可能與1918年的西班牙流感不相上下,當時感染人數達到五億人,後奪走數韆萬人的性命。雪上加霜的是,麵對流感可能爆發,卻還沒有能派上用場的疫苗,公共衛生當局能努力的,就是減緩其蔓延的速度。為瞭達到這項目的,必須先知道當前流行感染的範圍及程度。
在美國,疾病管製局(CDC)要求醫生一碰到新流感病例,就必須立刻通報。即使如此,通報的速度仍然總是慢瞭病毒一步,大約是慢上一到兩星期。畢竟,民眾覺得身體不舒服之後,通常還是會過個幾天纔就醫,而層層通報迴到疾管局也需要時間,更別提疾管局要每星期纔整理一次通報來的資料。但是麵對迅速蔓延的疫情,拖個兩星期簡直就像是拖瞭一個世紀,會在關鍵的時刻,讓公共衛生當局完全無法掌握真實情況。
巨量資料初試啼聲
說巧不巧,就在H1N1躍上新聞頭條的幾星期前,網路巨擘榖歌(Google)旗下的幾位工程師,在的《自然》科學期刊發錶瞭一篇重要的論文,當時並未引起一般人的注意,隻在衛生當局和電腦科學圈裡引起討論。該篇論文解釋瞭榖歌能如何「預測」美國在鼕天即將爆發流感,甚至還能精準定位到是哪些州。榖歌的祕訣,就是看看民眾在網路上搜尋些什麼。由於榖歌每天會接收到超過三十億筆的搜尋,而且會把它們儲存起來,那就會有大量的資料得以運用。
榖歌先挑齣美國人常使用的前五韆萬個搜尋字眼,再與美國疾病管製局在2003年到2008年之間的流感傳播資料,加以比對。榖歌的想法,是想靠著民眾在網路上搜尋什麼關鍵詞,找齣那些感染瞭流感的人。雖然也曾有人就網路搜尋字眼做過類似的努力,但是從來沒人能像榖歌一樣掌握巨量資料(big data,直譯為大數據),並具備強大的處理能力和在統計上的專業技能。
雖然榖歌已經猜到,民眾的搜尋字眼可能與流感有關,像是「止咳退燒」,但相不相關其實不是真正的重點,他們設計的係統也不是從這個角度齣發。榖歌這套係統真正做的,是要針對搜尋字眼的搜尋頻率,找齣和流感傳播的時間、地區,有沒有統計上的相關性(correlation)。他們總共用上瞭高達4億5韆萬種不同的數學模型,測試各種搜尋字眼,再與疾管局在2007年與2008年的實際流感病例加以比較。他們可挖到寶瞭!這套軟體找齣瞭一組共四十五個搜尋字眼,放進數學模型之後,預測結果會與官方公布的全美真實資料十分符閤,有強烈的相關性。
於是,他們就像疾管局一樣能夠掌握流感疫情,但可不是一、兩星期之後的事,而是幾近即時同步的掌握!
因此,在2009年發生H1N1危機的時候,比起手中的資料(以及無可避免的通報延遲),榖歌係統能提供更有用、更及時的資訊。公衛當局有瞭這種寶貴的資訊,控製疫情如虎添翼。
驚人的是,榖歌的這套方法並不需要去採集檢體、也不用登門造訪各傢醫院診所,而隻是好好利用瞭巨量資料,也就是用全新的方式來使用資訊,以取得實用且價值非凡的見解、商機或服務。有瞭榖歌這套係統,下次爆發流感的時候,全球就有瞭更佳的工具能夠加以預測、並防止疫情蔓延。
巨量資料功能強大,可以讓許多領域改頭換麵,公共衛生領域不過是其中之一,而商業領域也正在經歷這個過程。例如買飛機票就是個很好的例子。
序言
滿28包郵 大數據 pdf epub mobi txt 電子書 下載