本篇文章給大家談?wù)剶?shù)據(jù)分析經(jīng)典案例,以及數(shù)據(jù)分析著名案例對(duì)應(yīng)的知識(shí)點(diǎn),希望對(duì)各位有所幫助,不要忘了收藏本站喔。
今天給各位分享數(shù)據(jù)分析經(jīng)典案例的知識(shí),其中也會(huì)對(duì)數(shù)據(jù)分析著名案例進(jìn)行解釋,如果能碰巧解決你現(xiàn)在面臨的問題,別忘了關(guān)注本站,現(xiàn)在開始吧!
本文目錄一覽:
有哪些大數(shù)據(jù)分析案例?
如下數(shù)據(jù)分析經(jīng)典案例:
1. 大數(shù)據(jù)應(yīng)用案例之:醫(yī)療行業(yè)
1)Seton Healthcare是采用IBM最新沃森技術(shù)醫(yī)療保健內(nèi)容分析預(yù)測(cè)數(shù)據(jù)分析經(jīng)典案例的首個(gè)客戶。該技術(shù)允許企業(yè)找到大量病人相關(guān)的臨床醫(yī)療信息,通過大數(shù)據(jù)處理,更好地分析病人的信息。
在加拿大多倫多的一家醫(yī)院,針對(duì)早產(chǎn)嬰兒,每秒鐘有超過3000次的數(shù)據(jù)讀取。通過這些數(shù)據(jù)分析,醫(yī)院能夠提前知道哪些早產(chǎn)兒出現(xiàn)問題并且有針對(duì)性地采取措施,避免早產(chǎn)嬰兒夭折。
它讓更多的創(chuàng)業(yè)者更方便地開發(fā)產(chǎn)品,比如通過社交網(wǎng)絡(luò)來收集數(shù)據(jù)的健康類App。也許未來數(shù)年后,它們搜集的數(shù)據(jù)能讓醫(yī)生給數(shù)據(jù)分析經(jīng)典案例你的診斷變得更為精確,比方說不是通用的成人每日三次一次一片,而是檢測(cè)到你的血液中藥劑已經(jīng)代謝完成會(huì)自動(dòng)提醒你再次服藥。
2)大數(shù)據(jù)配合喬布斯癌癥治療
喬布斯是世界上第一個(gè)對(duì)自身所有DNA和腫瘤DNA進(jìn)行排序的人。為此,他支付了高達(dá)幾十萬美元的費(fèi)用。他得到的不是樣本,而是包括整個(gè)基因的數(shù)據(jù)文檔。醫(yī)生按照所有基因按需下藥,最終這種方式幫助喬布斯延長(zhǎng)了好幾年的生命。
2. 大數(shù)據(jù)應(yīng)用案例之:能源行業(yè)
1)智能電網(wǎng)現(xiàn)在歐洲已經(jīng)做到了終端,也就是所謂的智能電表。在德國(guó),為了鼓勵(lì)利用太陽能,會(huì)在家庭安裝太陽能,除了賣電給你,當(dāng)你的太陽能有多余電的時(shí)候還可以買回來。
通過電網(wǎng)收集每隔五分鐘或十分鐘收集一次數(shù)據(jù),收集來的這些數(shù)據(jù)可以用來預(yù)測(cè)客戶的用電習(xí)慣等,從而推斷出在未來2~3個(gè)月時(shí)間里,整個(gè)電網(wǎng)大概需要多少電。有了這個(gè)預(yù)測(cè)后,就可以向發(fā)電或者供電企業(yè)購(gòu)買一定數(shù)量的電。
因?yàn)殡娪悬c(diǎn)像期貨一樣,如果提前買就會(huì)比較便宜,買現(xiàn)貨就比較貴。通過這個(gè)預(yù)測(cè)后,可以降低采購(gòu)成本。
2)丹麥的維斯塔斯風(fēng)能系統(tǒng)(Vestas Wind Systems)運(yùn)用大數(shù)據(jù),系統(tǒng)依靠的是BigInsights軟件和IBM超級(jí)計(jì)算機(jī),分析出應(yīng)該在哪里設(shè)置渦輪發(fā)電機(jī),事實(shí)上這是風(fēng)能領(lǐng)域的重大挑戰(zhàn)。在一個(gè)風(fēng)電場(chǎng)20多年的運(yùn)營(yíng)過程中,準(zhǔn)確的定位能幫助工廠實(shí)現(xiàn)能源產(chǎn)出的最大化。
為了鎖定最理想的位置,Vestas分析了來自各方面的信息:風(fēng)力和天氣數(shù)據(jù)、湍流度、地形圖、公司遍及全球的2.5萬多個(gè)受控渦輪機(jī)組發(fā)回的傳感器數(shù)據(jù)。這樣一套信息處理體系賦予了公司獨(dú)特的競(jìng)爭(zhēng)優(yōu)勢(shì),幫助其客戶實(shí)現(xiàn)投資回報(bào)的最大化。
3. 大數(shù)據(jù)應(yīng)用案例之:通信行業(yè)—通過大數(shù)據(jù)分析挽回核心客戶
法國(guó)電信-Orange集團(tuán)旗下的波蘭電信公司Telekomunikacja Polska是波蘭最大的語音和寬帶固網(wǎng)供應(yīng)商,希望有效的途徑來準(zhǔn)確預(yù)測(cè)并解決客戶流失問題。
他們決定進(jìn)行客戶細(xì)分,方法是構(gòu)建一張“社交圖譜”- 分析客戶數(shù)百萬個(gè)電話的數(shù)據(jù)記錄,特別關(guān)注 “誰給誰打了電話”以及“打電話的頻率”兩個(gè)方面?!吧缃粓D譜”把公司用戶分成幾大類,如:“聯(lián)網(wǎng)型”、“橋梁型”、“領(lǐng)導(dǎo)型”以及“跟隨型”。
這樣的關(guān)系數(shù)據(jù)有助電信服務(wù)供應(yīng)商深入洞悉一系列問題,如:哪些人會(huì)對(duì)可能“棄用”公司服務(wù)的客戶產(chǎn)生較大的影響?挽留最有價(jià)值客戶的難度有多大?運(yùn)用這一方法,公司客戶流失預(yù)測(cè)模型的準(zhǔn)確率提升了47%。
4、大數(shù)據(jù)應(yīng)用案例之:零售業(yè)—大數(shù)據(jù)幫零售企業(yè)制定促銷策略
北美零售商百思買在北美的銷售活動(dòng)非?;钴S,產(chǎn)品總數(shù)達(dá)到3萬多種,產(chǎn)品的價(jià)格也隨地區(qū)和市場(chǎng)條件而異。由于產(chǎn)品種類繁多,成本變化比較頻繁,一年之中,變化可達(dá)四次之多。
結(jié)果,每年的調(diào)價(jià)次數(shù)高達(dá)12萬次。最讓高管頭疼的是定價(jià)促銷策略。公司組成了一個(gè)11人的團(tuán)隊(duì),希望透過分析消費(fèi)者的購(gòu)買記錄和相關(guān)信息,提高定價(jià)的準(zhǔn)確度和響應(yīng)速度。
定價(jià)團(tuán)隊(duì)的分析圍繞著三個(gè)關(guān)鍵維度:
1)數(shù)量:團(tuán)隊(duì)需要分析海量信息。他們收集了上千萬的消費(fèi)者的購(gòu)買記錄,從客戶不同維度分析,了解客戶對(duì)每種產(chǎn)品種類的最高接受能力,從而為產(chǎn)品定出最佳價(jià)位。
2)多樣性:團(tuán)隊(duì)除了分析了購(gòu)買記錄這種結(jié)構(gòu)化的數(shù)據(jù)外,他們也利用社交媒體發(fā)帖這種新型的非結(jié)構(gòu)化數(shù)據(jù)。由于消費(fèi)者需要在零售商專頁上點(diǎn)贊或留言以獲得優(yōu)惠券,團(tuán)隊(duì)利用情感分析公式來分析專頁上消費(fèi)者的情緒,從而判斷他們對(duì)于公司的促銷活動(dòng)是否滿意,并微調(diào)促銷策略。
3)速度:為了實(shí)現(xiàn)價(jià)值最大化,團(tuán)隊(duì)對(duì)數(shù)據(jù)進(jìn)行實(shí)時(shí)或近似實(shí)時(shí)的處理。他們成功地根據(jù)一個(gè)消費(fèi)者既往的麥片購(gòu)買記錄,為身處超市麥片專柜的他/她即時(shí)發(fā)送優(yōu)惠券,為客戶帶來便利性和驚喜。
透過這一系列的活動(dòng),團(tuán)隊(duì)提高了定價(jià)的準(zhǔn)確度和響應(yīng)速度,為零售商新增銷售額和利潤(rùn)數(shù)千萬美元。
5、大數(shù)據(jù)應(yīng)用案例之:網(wǎng)絡(luò)營(yíng)銷行業(yè)(SEM)
很多企業(yè)在做SEM的過程中,都有這樣的感觸:每年都會(huì)花費(fèi)大量的預(yù)算在SEM推廣中,但是因?yàn)殛P(guān)鍵詞投入產(chǎn)出無法可視化,常?;撕芏噱X卻不見具體的回報(bào)。
在競(jìng)爭(zhēng)如此激烈的SEM市場(chǎng)中,企業(yè)需要一個(gè)高效的數(shù)據(jù)分析工具來盡可能地幫企業(yè)優(yōu)化SEM推廣,例如BDP,來幫企業(yè)節(jié)省不必要的支出,提升整體的經(jīng)營(yíng)績(jī)效。
企業(yè)可借助數(shù)據(jù)平臺(tái)提供的網(wǎng)絡(luò)營(yíng)銷整合解決方案,打通各個(gè)搜索引擎營(yíng)銷(SEM)、在線客服系統(tǒng)和CRM系統(tǒng),營(yíng)銷競(jìng)價(jià)人員無需掌握復(fù)雜的編程技術(shù),簡(jiǎn)單拖拽即可生成報(bào)表,觀察每一個(gè)關(guān)鍵詞的投入和產(chǎn)出,分析每一個(gè)頁面的轉(zhuǎn)化,有效降低投放成本。
通過BDP實(shí)況分析數(shù)據(jù),可以快速洞悉對(duì)手關(guān)鍵詞的投放時(shí)段、地域及排名,并對(duì)其進(jìn)行可視化的分析,實(shí)時(shí)監(jiān)控自己和競(jìng)爭(zhēng)對(duì)手的投放情況,了解對(duì)手的投放策略,支持自定義設(shè)置數(shù)據(jù)更新的時(shí)間點(diǎn)、監(jiān)控頻次和時(shí)段,及時(shí)調(diào)整策略。知已知彼,才能百戰(zhàn)不殆。
6、大數(shù)據(jù)應(yīng)用案例之:電商行業(yè)
意料之外:胸部最大的是新疆妹子。曾經(jīng)淘寶平臺(tái)顯示,中國(guó)女性購(gòu)買最多的文胸尺碼為B罩杯。B罩杯占比達(dá)41.45%,其中又以75B的銷量最好,其次是A罩杯,購(gòu)買占比達(dá)25.26%,C罩杯只有8.96%。
雖然淘寶數(shù)據(jù)平臺(tái)不能代表一切,但是結(jié)合現(xiàn)實(shí)來看,這個(gè)也具有普遍的代表性,只能感慨中國(guó)女性普遍size。在文胸顏色中,黑色最為暢銷,黑色絕對(duì)是百搭,每個(gè)女性必備。
從省市排名,胸部最大的是新疆妹子。這些數(shù)據(jù)都對(duì)于文胸店鋪而言是很好的參考,為店鋪的庫(kù)存、定價(jià)、款式選擇等策略都有奠定數(shù)據(jù)基礎(chǔ)。
7、大數(shù)據(jù)應(yīng)用案例之:娛樂行業(yè)
微軟大數(shù)據(jù)成功預(yù)測(cè)奧斯卡21項(xiàng)大獎(jiǎng)。2013年,微軟紐約研究院的經(jīng)濟(jì)學(xué)家大衛(wèi)?羅斯柴爾德(David Rothschild)利用大數(shù)據(jù)成功預(yù)測(cè)24個(gè)奧斯卡獎(jiǎng)項(xiàng)中的19個(gè),成為人們津津樂道的話題。
今年羅斯柴爾德再接再厲,成功預(yù)測(cè)第86屆奧斯卡金像獎(jiǎng)?lì)C獎(jiǎng)典禮24個(gè)獎(jiǎng)項(xiàng)中的21個(gè),繼續(xù)向人們展示現(xiàn)代科技的神奇魔力。
總的來說,大數(shù)據(jù)的終極目標(biāo)并不僅僅是改變競(jìng)爭(zhēng)環(huán)境,而是徹底扭轉(zhuǎn)整個(gè)競(jìng)爭(zhēng)環(huán)境,帶來新機(jī)遇,企業(yè)需要應(yīng)勢(shì)而變。企業(yè)只有認(rèn)識(shí)到這一點(diǎn),使用合適的數(shù)據(jù)分析產(chǎn)品、聰明地使用和管理數(shù)據(jù),才能在長(zhǎng)期競(jìng)爭(zhēng)中成為終極贏家。
數(shù)據(jù)分析的案例
沃爾瑪經(jīng)典營(yíng)銷案例:啤酒與尿布
“啤酒與尿布”的故事產(chǎn)生于20世紀(jì)90年代的美國(guó)沃爾瑪超市中,沃爾瑪?shù)某泄芾砣藛T分析銷售數(shù)據(jù)時(shí)發(fā)現(xiàn)了一個(gè)令人難于理解的現(xiàn)象:在某些特定的情況下,“啤酒”與“尿布”兩件看上去毫無關(guān)系的商品會(huì)經(jīng)常出現(xiàn)在同一個(gè)購(gòu)物籃中,這種獨(dú)特的銷售現(xiàn)象引起了管理人員的注意,經(jīng)過后續(xù)調(diào)查發(fā)現(xiàn),這種現(xiàn)象出現(xiàn)在年輕的父親身上。
在美國(guó)有嬰兒的家庭中,一般是母親在家中照看嬰兒,年輕的父親前去超市購(gòu)買尿布。父親在購(gòu)買尿布的同時(shí),往往會(huì)順便為自己購(gòu)買啤酒,這樣就會(huì)出現(xiàn)啤酒與尿布這兩件看上去不相干的商品經(jīng)常會(huì)出現(xiàn)在同一個(gè)購(gòu)物籃的現(xiàn)象。如果這個(gè)年輕的父親在賣場(chǎng)只能買到兩件商品之一,則他很有可能會(huì)放棄購(gòu)物而到另一家商店, 直到可以一次同時(shí)買到啤酒與尿布為止。沃爾瑪發(fā)現(xiàn)了這一獨(dú)特的現(xiàn)象,開始在賣場(chǎng)嘗試將啤酒與尿布擺放在相同的區(qū)域,讓年輕的父親可以同時(shí)找到這兩件商品,并很快地完成購(gòu)物;而沃爾瑪超市也可以讓這些客戶一次購(gòu)買兩件商品、而不是一件,從而獲得了很好的商品銷售收入,這就是“啤酒與尿布” 故事的由來。
當(dāng)然“啤酒與尿布”的故事必須具有技術(shù)方面的支持。1993年美國(guó)學(xué)者Agrawal提出通過分析購(gòu)物籃中的商品集合,從而找出商品之間關(guān)聯(lián)關(guān)系的關(guān)聯(lián)算法,并根據(jù)商品之間的關(guān)系,找出客戶的購(gòu)買行為。艾格拉沃從數(shù)學(xué)及計(jì)算機(jī)算法角度提 出了商品關(guān)聯(lián)關(guān)系的計(jì)算方法——Aprior算法。沃爾瑪從上個(gè)世紀(jì) 90 年代嘗試將 Aprior 算 法引入到 POS機(jī)數(shù)據(jù)分析中,并獲得了成功,于是產(chǎn)生了“啤酒與尿布”的故事。
Suncorp-Metway使用數(shù)據(jù)分析實(shí)現(xiàn)智慧營(yíng)銷
Suncorp-Metway是澳大利亞一家提供普通保險(xiǎn)、銀行業(yè)、壽險(xiǎn)和理財(cái)服務(wù)的多元化金融服務(wù)集團(tuán), 旗下?lián)碛?個(gè)業(yè)務(wù)部門,管理著14類商品,由公司及共享服務(wù)部門提供支持,其在澳大利亞和新西蘭的運(yùn)營(yíng)業(yè)務(wù)與900多萬名客戶有合作關(guān)系。
該公司過去十年間的合并與收購(gòu),使客戶群增長(zhǎng)了200%,這極大增加了客戶群數(shù)據(jù)管理的復(fù)雜性,如果解決不好,必將對(duì)公司利潤(rùn)產(chǎn)生負(fù)面影響.為此,IBM公司為其提供了一套解決方案,組件包括:IBM Cognos 8 BI、IBMInitiate Master Data Service諛I(yè)BM Unica。
采用該方案后,Suncorp-Metway公司至少在以下三項(xiàng)業(yè)務(wù)方面取得顯著成效:
1、顯著增加了市場(chǎng)份額,但沒有增加營(yíng)銷開支;
2、每年大約能夠節(jié)省1000萬美元的集成與相關(guān)成本;
3、避免向同一戶家庭重復(fù)郵寄相同信函并且消除冗余系統(tǒng),從而同時(shí)降低直接郵寄與運(yùn)營(yíng)成本。
由此可見,Suncorp-Metway公司通過該方案將此前多個(gè)孤立來源的數(shù)據(jù)集成起來,實(shí)現(xiàn)智慧營(yíng)銷,對(duì)控制成本,增加利潤(rùn)起到非常積極的作用。
數(shù)據(jù)分析幫助辛辛那提動(dòng)物園提高客戶滿意度
辛辛那提動(dòng)植物園成立于1873年,是世界上著名的動(dòng)植物園之一,以其物種保護(hù)和保存以及高成活率繁殖飼養(yǎng)計(jì)劃享有極高聲譽(yù)。它占地面積71英畝,園內(nèi)有500種動(dòng)物和3000多種植物,是國(guó)內(nèi)游客人數(shù)最多的動(dòng)植物園之一,曾榮獲Zagat十佳動(dòng)物園,并被《父母》(Parent)雜志評(píng)為最受兒童喜歡的動(dòng)物園,每年接待游客130多萬人。
辛辛那提動(dòng)植物園是一個(gè)非營(yíng)利性組織,是俄亥州同時(shí)也是美國(guó)國(guó)內(nèi)享受公共補(bǔ)貼最低的動(dòng)植物園,除去政府補(bǔ)貼,2600萬美元年度預(yù)算中,自籌資金部分達(dá)到三分之二以上。為此,需要不斷地尋求增加收入。而要做到這一點(diǎn),最好辦法是為工作人員和游客提供更好的服務(wù),提高游覽率。從而實(shí)現(xiàn)動(dòng)植物園與客戶和納稅人的雙贏。
借助于該方案強(qiáng)大的收集和處理能力、互聯(lián)能力、分析能力以及隨之帶來的洞察力,在部署后,企業(yè)實(shí)現(xiàn)了以下各方面的受益:
·幫助動(dòng)植物園了解每個(gè)客戶瀏覽、使用和消費(fèi)模式,根據(jù)時(shí)間和地理分布情況采取相應(yīng)的措施改善游客體驗(yàn),同時(shí)實(shí)現(xiàn)營(yíng)業(yè)收入最大化。
·根據(jù)消費(fèi)和游覽行為對(duì)動(dòng)植物園游客進(jìn)行細(xì)分,針對(duì)每一類細(xì)分游客開展?fàn)I銷和促銷活動(dòng),顯著提高忠誠(chéng)度和客戶保有量。.
·識(shí)別消費(fèi)支出低的游客,針對(duì)他們發(fā)送具有戰(zhàn)略性的直寄廣告,同時(shí)通過具有創(chuàng)意性的營(yíng)銷和激勵(lì)計(jì)劃獎(jiǎng)勵(lì)忠誠(chéng)客戶。
· 360度全方位了解客戶行為,優(yōu)化營(yíng)銷決策,實(shí)施解決方案后頭一年節(jié)省40,000多美元營(yíng)銷成本,同時(shí)強(qiáng)化了可測(cè)量的結(jié)果。
·采用地理分析顯示大量未實(shí)現(xiàn)預(yù)期結(jié)果的促銷和折扣計(jì)劃,重新部署資源支持產(chǎn)出率更高的業(yè)務(wù)活動(dòng),動(dòng)植物園每年節(jié)省100,000多美元。
·通過強(qiáng)化營(yíng)銷提高整體游覽率,2011年至少新增50,000人次“游覽”。
·提供洞察結(jié)果強(qiáng)化運(yùn)營(yíng)管理。例如,即將關(guān)門前冰激淋銷售出現(xiàn)高潮,動(dòng)植物園決定延長(zhǎng)冰激淋攤位營(yíng)業(yè)時(shí)間,直到關(guān)門為止。這一措施夏季每天可增加2,000美元收入。
·與上年相比,餐飲銷售增加30.7%,零售銷售增加5.9%。
·動(dòng)植物園高層管理團(tuán)隊(duì)可以制定更好的決策,不需要 IT 介入或提供支持。
·將分析引入會(huì)議室,利用直觀工具幫助業(yè)務(wù)人員掌握數(shù)據(jù)。
值得膜拜的三個(gè)數(shù)據(jù)分析案例
值得膜拜的三個(gè)數(shù)據(jù)分析案例
今天給大家分享三個(gè)數(shù)據(jù)分析的經(jīng)典案例,主要是學(xué)習(xí)其中的思路,當(dāng)故事看吧,不要拘泥于文中故事的真實(shí)性。每個(gè)故事我簡(jiǎn)單的做一個(gè)點(diǎn)評(píng)吧
1、數(shù)據(jù)分析大神 高手在民間
這天,新上任的邢縣長(zhǎng)到小吃攤吃早餐,剛找個(gè)板凳坐下,就聽炸油條的胡老頭一邊忙活一邊嘮叨:“大家吃好喝好哦,城管要來攆攤兒了,起碼三天你們撈不著吃咱炸的油條了!”
邢縣長(zhǎng)心里一驚:省衛(wèi)生廳領(lǐng)導(dǎo)最近要來視察,昨天下午縣里才決定明后兩天開展突擊整治,這老頭兒怎么今天一早就知道了?
哪料這件事還沒弄明白,另一件事兒讓縣長(zhǎng)腦袋里的問號(hào)更大了。一天,他照例到胡老頭這兒吃油條。沒想到,老頭居然又在發(fā)布消息:“上面馬上要來青天大老爺了!誰有什么冤假,就去縣府賓館等著吧!”
邢縣長(zhǎng)又是吃驚,又是惱怒。省高院的工作組星期三要來清查積案,這個(gè)消息昨天晚上才在常委會(huì)上傳達(dá),這老兒咋這么快就知道了呢?讓他更吃驚的是,這老家伙不但對(duì)大領(lǐng)導(dǎo)們的行程了如指掌,就連派出所要突擊檢查娛樂場(chǎng)所這樣的絕密行動(dòng),他都知道得清清楚楚。
一個(gè)大字不識(shí)的老頭兒,居然能知道這么多政府內(nèi)部消息,毫無疑問,定是某些政府工作人員保密意識(shí)太差,嘴巴不緊。于是,他立即召開會(huì)議,把那些局長(zhǎng)、主任狠批了一通。與會(huì)領(lǐng)導(dǎo)個(gè)個(gè)低著頭、不敢出聲。
還是公安局長(zhǎng)膽大,忍不住問道:“邢縣長(zhǎng),這胡老頭兒的事是您親眼所見,還是道聽途說來的?”
邢縣長(zhǎng)聲色俱厲地一拍桌子:“都是我親耳聽到的!我問你,你們城關(guān)派出所今天晚上是不是要清查娛樂城?”
公安局長(zhǎng)一臉尷尬,楞在那里。邢縣長(zhǎng)氣惱地當(dāng)即下令:“你親自去查查這老頭兒到底什么背景,明天向我匯報(bào)!”公安局長(zhǎng)趕緊換上便裝,立馬跑到胡老頭那兒進(jìn)行暗訪。沒想到,老家伙正在向大伙兒發(fā)布新聞:“城關(guān)鎮(zhèn)的鎮(zhèn)長(zhǎng)最近要倒霉了。大伙等著瞧,事兒不會(huì)小的……”
公安局長(zhǎng)一聽,很是詫異。于是,他運(yùn)了口氣,腆著笑臉,裝傻賣呆似的問道:“你咋知道的?難道你兒子是紀(jì)委書記?”
胡老頭呵呵一笑:“我咋知道的?那孫子以前吃我的油條,都是讓司機(jī)開專車來買,這兩天一反常態(tài),竟然自己步行來吃,還老是一臉愁容。那年他爹死,都沒見他那么難受過。能讓那孫子比死了爹還難受的事,除了丟官兒,還能是啥?”
局長(zhǎng)聽了,暗自吃驚,這老頭兒還真有兩下子。于是他不動(dòng)聲色繼續(xù)問道:“那昨天派出所清查娛樂城,你是咋知道的?”
胡老頭又是一笑:“你沒見那幾家娛樂城一大早就掛出了停業(yè)修繕的牌子?人家有眼線,消息比咱靈通!”
“那衛(wèi)生廳領(lǐng)導(dǎo)來視察,你是咋知道的?”
胡老頭兒說:“除了上面來人檢查,你啥時(shí)見灑水車出來過?”。
最后,局長(zhǎng)問了個(gè)他最想不通的問題:“上次省高院的工作組來指導(dǎo)工作,你咋那么快就得到消息了呢?”
胡老頭撇了撇嘴說:“那就更簡(jiǎn)單了。俺鄰居家有個(gè)案子,法院拖了八年不辦。那天,辦案的法官突然主動(dòng)來訪,滿臉笑容問長(zhǎng)問短,還再三保證案子馬上解決。這不明擺著上面來了人,怕他們上訪嘛!”
局長(zhǎng)佩服得五體投地,連忙一路小跑趕回去,把情況向邢縣長(zhǎng)匯報(bào)。縣長(zhǎng)聽了,大動(dòng)肝火,馬上再次召開會(huì)議,做了四個(gè)小時(shí)的訓(xùn)話:“同志們,一個(gè)炸油條的都能從一些簡(jiǎn)單現(xiàn)象中,看出我們的工作動(dòng)向,這說明了什么?說明我們存在太多的形式主義。這種惡習(xí)不改,怎么能提升政府形象?從今天開始,哪個(gè)部門再因?yàn)檫@種原因泄密,讓那老頭‘未卜先知’,我可就不客氣!”
次日一早,邢縣長(zhǎng)又來到胡老頭兒這兒吃油條,想驗(yàn)證一下開會(huì)的效果。沒想到胡老頭居然又在發(fā)布最新消息:“今天,上面要來大領(lǐng)導(dǎo)了,來的還不止一個(gè)!”
邢縣長(zhǎng)這一驚,真是非同小可。下午,市長(zhǎng)要陪同省領(lǐng)導(dǎo)來檢查工作,自己昨晚才接到通知,這老頭咋又提前知道了?
邢縣長(zhǎng)強(qiáng)壓怒火,問胡老頭:“你說要來大領(lǐng)導(dǎo),到底有多大呢?”
胡老頭兒頭也不抬地回答:“反正比縣長(zhǎng)還大!”
邢縣長(zhǎng)又問:“你說要來的不止一個(gè),能說個(gè)準(zhǔn)數(shù)嗎,到底來幾個(gè)?”
胡老頭兒仰起頭想了想,確定地回答:“四個(gè)!”
邢縣長(zhǎng)目瞪口呆,上級(jí)領(lǐng)導(dǎo)還真是要來四個(gè)!他心里怦怦直跳,又問:“胡……胡師傅,這些事兒你是怎么知道的?而且知道的這么準(zhǔn)確。”
胡老頭兒淡淡一笑:“這還不容易?我早上出攤兒,見縣府賓館的保安都戴上了白手套,一個(gè)個(gè)如臨大敵,肯定是上面來人了。再看看停車場(chǎng),書記、縣長(zhǎng)的車都停在了角落里,肯定是來了比他們大的官兒。再仔細(xì)看看,書記、縣長(zhǎng)停的車位是5號(hào)、6號(hào),說明上面來了四個(gè)領(lǐng)導(dǎo)。你信不信?當(dāng)官兒的和咱老百姓不一樣,上廁所都要講究個(gè)級(jí)別、排個(gè)先后順序呢!”
邢縣長(zhǎng)聽罷,張著塞滿油條的大嘴,一動(dòng)不動(dòng),好像僵化了似的…
(本故事來自于網(wǎng)絡(luò))
啟示:
與其說高手來自于民間,還不如說生活是我們數(shù)據(jù)分析的基本素材,善于觀察、善于整理關(guān)聯(lián)信息才是我們做數(shù)據(jù)分析人員應(yīng)該掌握的基本技能。可是啊,很多人忽略了我們身邊的生活常識(shí),不去思考,人云亦云,就像網(wǎng)上的這個(gè)全國(guó)離婚率排行榜數(shù)據(jù),很多人首先不是思考數(shù)據(jù)的準(zhǔn)確性,而是感嘆世風(fēng)日下。
想想吧,在你的生活圈子中,每3對(duì)夫妻就有1對(duì)離婚的嗎?如果答案為“是”,我只能說,貴圈真亂!哈哈哈
2、林彪的數(shù)據(jù)挖掘本領(lǐng)
1948年遼沈戰(zhàn)役開始之后,在東北野戰(zhàn)軍前線指揮所里面,每天深夜都要進(jìn)行例常的“每日軍情匯報(bào)”:由值班參謀讀出下屬各個(gè)縱隊(duì)、師、團(tuán)用電臺(tái)報(bào)告的當(dāng)日戰(zhàn)況和繳獲情況。
那幾乎是重復(fù)著千篇一律的枯燥無味的數(shù)據(jù):每支部隊(duì)殲敵多少、俘虜多少;繳獲的火炮、車輛多少、槍支、物資多少….
司令員林彪的要求很細(xì),俘虜要分清軍官和士兵,繳獲的槍支,要統(tǒng)計(jì)出機(jī)槍、長(zhǎng)槍、短槍;擊毀和繳獲尚能使用的汽車,也要分出大小和類別。
經(jīng)過一天緊張的戰(zhàn)斗指揮工作,人們都非常疲勞。整個(gè)作戰(zhàn)室里面估計(jì)只有定下這個(gè)規(guī)矩的司令員林彪本人、還有那個(gè)讀電報(bào)的倒霉參謀在用心留意。
1948年10月14日,東北野戰(zhàn)軍以迅雷不及掩耳之勢(shì),僅用了30小時(shí)就攻克了對(duì)手原以為可以長(zhǎng)期堅(jiān)守的錦州并全殲了守?cái)呈嗳f之后,不顧疲勞,揮師北上與從沈陽出援的敵精銳廖耀湘基團(tuán)二十余萬在遼西相遇,一時(shí)間形成了混戰(zhàn)。戰(zhàn)局瞬息萬變,誰勝誰負(fù)實(shí)難預(yù)料。
在大戰(zhàn)緊急中,林彪無論有多忙,仍然堅(jiān)持每晚必作的“功課”。一天深夜,值班參謀正在讀著下面某師上報(bào)的其下屬部隊(duì)的戰(zhàn)報(bào)。說他們下面的部隊(duì)碰到了一個(gè)不大的遭遇戰(zhàn),殲敵部分、其余逃走。與其它之前所讀的戰(zhàn)報(bào)看上去并無明顯異樣,值班參謀就這樣讀著讀著,林彪突然叫了一聲“停!”他的眼里閃出了光芒,問:“剛才念的在胡家窩棚那個(gè)戰(zhàn)斗的繳獲,你們聽到了嗎?”
大家?guī)е獾哪樕铣霈F(xiàn)了茫然,因?yàn)槿绱藨?zhàn)斗每天都有幾十起,不都是差不多一模一樣的枯燥數(shù)字嗎?林彪掃視一周,見無人回答,便接連問了三句:
“為什么那里繳獲的短槍與長(zhǎng)槍的比例比其它戰(zhàn)斗略高”?
“為什么那里繳獲和擊毀的小車與大車的比例比其它戰(zhàn)斗略高”?
“為什么在那里俘虜和擊斃的軍官與士兵的比例比其它戰(zhàn)斗略高”?
人們還沒有來得及思索,等不及的林彪司令員大步走向掛滿軍用地圖的墻壁,指著地圖上的那個(gè)點(diǎn)說:“我猜想,不,我斷定!敵人的指揮所就在這里!”
隨后林彪口授命令,追擊從胡家窩棚逃走的那部分?jǐn)橙?,并?jiān)決把他們打掉。各部隊(duì)要采取分割包圍的辦法,把失去指揮中樞后會(huì)變得混亂的幾十萬敵軍切成小塊,逐一殲滅。司令員的命令隨著無線電波發(fā)向了參戰(zhàn)的各部隊(duì)….
而此時(shí)的廖耀湘,正慶幸自己剛剛從偶然的一場(chǎng)遭遇戰(zhàn)中安全脫身并與自己的另外一支部隊(duì)匯合。他來不及休息就急于指令各部隊(duì)盡快調(diào)整部署,為下一階段作準(zhǔn)備??墒呛镁安婚L(zhǎng),緊追而來的解放軍迅速把他的新指揮部團(tuán)團(tuán)圍住,拼命攻擊,漫山遍野的解放軍戰(zhàn)士中,不斷有人喊著:“矮胖子,白凈臉;金絲眼鏡湖南腔,不要放走廖耀湘!”
把對(duì)方指揮官的細(xì)節(jié)特征琢磨到如此細(xì)微,并變成如此威力巨大的順口溜,穿著滿身油漬伙夫服裝的廖耀湘只好從俘虜群中站出來,無奈的說“我是廖耀湘”,沮喪的舉手投降。
廖耀湘對(duì)自己靜心隱蔽的精悍野戰(zhàn)司令部那么快就被發(fā)現(xiàn)、打掉,覺得實(shí)在不可思議,認(rèn)為那是一個(gè)偶然事件,輸?shù)貌桓市?。?dāng)他得知林彪是如何得出判斷之后,這位出身黃埔軍校并留學(xué)法國(guó)著名的圣西爾軍校,參加過滇緬戰(zhàn)役,在那里把日本鬼子揍得滿地亂爬的新六軍軍長(zhǎng)說,“我服了,敗在他手下,不丟人?!?br/>取得這場(chǎng)重要戰(zhàn)役勝利的其中一個(gè)關(guān)鍵因素,居然出于獲勝方的統(tǒng)帥夜半時(shí)分,對(duì)一份普通遭遇戰(zhàn)之后的戰(zhàn)報(bào)的數(shù)據(jù)分析,來源于他“從紅軍帶兵時(shí)起,身上有個(gè)小本子,上面記載著每次戰(zhàn)斗的繳獲、殲敵數(shù)量”的優(yōu)良軍事素養(yǎng)。
(本故事來源于黃勇-豐沃華的博客)
啟示:
林彪問的三個(gè)問題其實(shí)就是根據(jù)自己的數(shù)據(jù)庫(kù)做的對(duì)比、細(xì)分、溯源。我們很多人把數(shù)據(jù)分析完全交給機(jī)器了,忘了我們自己的大腦也是一臺(tái)緊密的數(shù)據(jù)分析機(jī)器。
數(shù)據(jù)的積累、數(shù)據(jù)的挖掘,分析、歸納、整理,是數(shù)據(jù)分析師所必須俱備的基本素養(yǎng),沒有它,你永遠(yuǎn)是匹夫之勇。
3、蛋撻與曼城隊(duì)
2011年夏天,曼城隊(duì)助理教練大衛(wèi)·普拉特決定利用數(shù)據(jù)分析來解決球隊(duì)在表現(xiàn)方面遇到的一個(gè)棘手難題。普拉特發(fā)現(xiàn),盡管球隊(duì)陣容中擁有多名高大強(qiáng)壯的球員,但他們的角球得分情況卻不盡如人意。
在征求了俱樂部?jī)?nèi)部數(shù)據(jù)分析師的意見后,該隊(duì)增加了對(duì)內(nèi)旋角球(球轉(zhuǎn)向守門員方向)的使用。戰(zhàn)術(shù)轉(zhuǎn)變產(chǎn)生了驚人的效果。在整個(gè)賽季中,曼城隊(duì)依靠角球打入15個(gè)進(jìn)球,成為英超角球得分效率最高的球隊(duì),其中2/3的進(jìn)球采用的是內(nèi)旋角球。
這一實(shí)踐為數(shù)據(jù)驅(qū)動(dòng)型決策提供了強(qiáng)有力的支撐。但是,還有一個(gè)附加因素需要考慮:主教練曼奇尼最初對(duì)數(shù)據(jù)的實(shí)際價(jià)值持懷疑態(tài)度。事實(shí)上,早在兩年前,曼奇尼曾就球隊(duì)角球的使用情況咨詢過俱樂部的數(shù)據(jù)分析師。分析師回應(yīng),他依靠直覺偏愛采用的戰(zhàn)術(shù)——外旋角球(球飛向遠(yuǎn)離守門員的方向)從數(shù)據(jù)統(tǒng)計(jì)上看并不理想。
曼奇尼選擇相信自己的直覺而非數(shù)據(jù)分析的導(dǎo)向性建議。因?yàn)橹庇X告訴他,球旋向遠(yuǎn)離門將的方向減小了門將觸球的概率,同時(shí)增加了進(jìn)攻隊(duì)員沖頂時(shí)爭(zhēng)到頭球的概率。但當(dāng)曼奇尼發(fā)現(xiàn)兩種變數(shù)存在某種聯(lián)系的時(shí)候,直覺卻模糊了他對(duì)兩者關(guān)聯(lián)程度的判斷能力。換句話說,外旋角球和進(jìn)球數(shù)可能存在著某種關(guān)聯(lián),但數(shù)據(jù)表明,內(nèi)旋角球和進(jìn)球數(shù)存在著更為直接的因果關(guān)系。
這一案例研究為我們改善商業(yè)決策帶來哪些啟示?一家美國(guó)零售商最近發(fā)現(xiàn),兩種不同變數(shù)之間存在著某種有趣的聯(lián)系。當(dāng)天氣變冷,肉桂葡式蛋撻的銷量上升500%——并非所有的葡式蛋撻,只是肉桂這一個(gè)品種。面對(duì)這種零星數(shù)據(jù),零售商要做出抉擇。每當(dāng)預(yù)測(cè)天氣即將轉(zhuǎn)冷時(shí),應(yīng)該儲(chǔ)備多少肉桂葡式蛋撻?還有一家零售商發(fā)現(xiàn),羊奶干酪打折似乎能促進(jìn)紅酒的銷售。希望減小紅酒庫(kù)存的時(shí)候,是不是應(yīng)考慮羊奶干酪打折這種方法?
這兩個(gè)問題的答案取決于大數(shù)據(jù)分析的核心問題:弄清相關(guān)性與因果關(guān)系之間的區(qū)別。人類善于發(fā)現(xiàn)事物的相關(guān)性——這是進(jìn)化的特征——但是卻在發(fā)掘直接相關(guān)事物的關(guān)系時(shí)顯得有些笨拙。將相關(guān)性誤解為因果關(guān)系所做出的決策是危險(xiǎn)的,可能會(huì)遭受慘敗,因?yàn)槟闼诖吹降挠绊懣赡懿⒉粫?huì)發(fā)生。
最近的一項(xiàng)研究顯示,某國(guó)的巧克力銷量與諾貝爾獎(jiǎng)的人均比例之間呈現(xiàn)明顯的相關(guān)性。各國(guó)是不是都該鼓勵(lì)公民增加巧克力的消費(fèi)來提高獲得諾貝爾獎(jiǎng)的人數(shù)呢?
為有效利用大數(shù)據(jù),相關(guān)性分析應(yīng)僅作為一個(gè)出發(fā)點(diǎn)去考慮。如果兩個(gè)變量存在關(guān)聯(lián),我們?cè)撊绾螒?yīng)對(duì)?當(dāng)然,政府在推行“巧克力替代教育”的政策之前,應(yīng)當(dāng)首先考慮一下其他因素。比方說,看看那些獲得諾貝爾獎(jiǎng)人數(shù)較多的國(guó)家相對(duì)教育水平和研究預(yù)算,與巧克力消費(fèi)相比,這兩個(gè)變量與獲諾獎(jiǎng)的因果關(guān)系顯然更大。
同樣,那些葡式蛋撻和羊奶干酪的零售商們?cè)趽碛惺惆盐找郧埃枰獙?duì)他們的假設(shè)進(jìn)行驗(yàn)證。比如說,在確定因果關(guān)系存在以前,考察一些商店肉桂葡式蛋撻的“庫(kù)存積壓”情況;或者采取打折銷售羊奶干酪的方式,看看紅酒銷量是否真的增加。
事物之間可能存在著一些簡(jiǎn)單的因果關(guān)系,但公司需要清楚每種因果關(guān)系都可能產(chǎn)生意想不到的結(jié)果。肉桂葡式蛋撻銷量的增加是否意味著其他產(chǎn)品銷量的減少?紅酒銷量的增加是否也意味著啤酒銷量的減少或者牛排銷量的增加?影響現(xiàn)代供應(yīng)鏈的因素很多,而且還在不斷增加:天氣、社交媒體、特價(jià)商品、食品安全新聞等,都會(huì)影響消費(fèi)者的行為,以及零售商應(yīng)該購(gòu)置多大規(guī)模的存貨。這基本上就是一個(gè)混沌系統(tǒng),完全準(zhǔn)確地預(yù)測(cè)將來要發(fā)生的事情是不可能的。但模型越完善,預(yù)測(cè)就越準(zhǔn)確,預(yù)測(cè)越準(zhǔn)確,行動(dòng)結(jié)果就越理想。
數(shù)據(jù)分析就像一幅印象派油畫。當(dāng)你退后觀察,并把各個(gè)部分視作一個(gè)整體時(shí),這幅畫的意境才開始浮現(xiàn),近距離觀察是無法理解其中內(nèi)涵的。這可以幫助我們解釋為什么曼城隊(duì)的新角球戰(zhàn)術(shù)不太可能會(huì)長(zhǎng)久取得良好的結(jié)果。實(shí)施從外旋角球到內(nèi)旋角球的簡(jiǎn)單戰(zhàn)術(shù)轉(zhuǎn)變:多開點(diǎn)內(nèi)旋球,少開點(diǎn)外旋球,這一簡(jiǎn)單的戰(zhàn)術(shù)轉(zhuǎn)變,亦會(huì)忽略了每場(chǎng)比賽中每次出現(xiàn)破門機(jī)會(huì)時(shí)的某些獨(dú)特變數(shù)。
(這部分來源:商業(yè)價(jià)值)
結(jié)尾:
很多人把數(shù)據(jù)分析看的很難,其實(shí)數(shù)據(jù)分析存在于我們生活工作的每個(gè)角落。給大家?guī)讞l建議:
1、多觀察、善積累、勤思考。
2、不懂業(yè)務(wù)就不要做數(shù)據(jù)分析。
3、分析工具不要貪多,精通1-2個(gè)工具就行了。
4、數(shù)據(jù)分析是良心工程(自己理解)
什么是大數(shù)據(jù),大數(shù)據(jù)的典型案例有哪些
"大數(shù)據(jù)"是一個(gè)體量特別大,數(shù)據(jù)類別特別大的數(shù)據(jù)集,并且這樣的數(shù)據(jù)集無法用傳統(tǒng)數(shù)據(jù)庫(kù)工具對(duì)其內(nèi)容進(jìn)行抓取、管理和處理。 "大數(shù)據(jù)"首先是指數(shù)據(jù)體量(volumes)?大,指代大型數(shù)據(jù)集,一般在10TB?規(guī)模左右,但在實(shí)際應(yīng)用中,很多企業(yè)用戶把多個(gè)數(shù)據(jù)集放在一起,已經(jīng)形成了PB級(jí)的數(shù)據(jù)量;其次是指數(shù)據(jù)類別(variety)大,數(shù)據(jù)來自多種數(shù)據(jù)源,數(shù)據(jù)種類和格式日漸豐富,已沖破了以前所限定的結(jié)構(gòu)化數(shù)據(jù)范疇,囊括了半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。接著是數(shù)據(jù)處理速度(Velocity)快,在數(shù)據(jù)量非常龐大的情況下,也能夠做到數(shù)據(jù)的實(shí)時(shí)處理。最后一個(gè)特點(diǎn)是指數(shù)據(jù)真實(shí)性(Veracity)高,隨著社交數(shù)據(jù)、企業(yè)內(nèi)容、交易與應(yīng)用數(shù)據(jù)等新數(shù)據(jù)源的興趣,傳統(tǒng)數(shù)據(jù)源的局限被打破,企業(yè)愈發(fā)需要有效的信息之力以確保其真實(shí)性及安全性。
數(shù)據(jù)采集
數(shù)據(jù)分析經(jīng)典案例:ETL工具負(fù)責(zé)將分布的、異構(gòu)數(shù)據(jù)源中的數(shù)據(jù)如關(guān)系數(shù)據(jù)、平面數(shù)據(jù)
文件等抽取到臨時(shí)中間層后進(jìn)行清洗、轉(zhuǎn)換、集成,最后加載到數(shù)據(jù)倉(cāng)庫(kù)或數(shù)據(jù)集市中,成為聯(lián)機(jī)分析處理、數(shù)據(jù)挖掘的基礎(chǔ)。
數(shù)據(jù)存取
數(shù)據(jù)分析經(jīng)典案例:關(guān)系數(shù)據(jù)庫(kù)、NOSQL、SQL等。
基礎(chǔ)架構(gòu):云存儲(chǔ)、分布式文件存儲(chǔ)等。
數(shù)據(jù)處理:自然語言處理(NLP,NaturalLanguageProcessing)是研究人與計(jì)算機(jī)交互的語言問題的一門學(xué)科。處理自然語言的關(guān)鍵是要讓計(jì)算機(jī)"理解"自然語言,所以自然語言處理又叫做自然語言理解(NLU,NaturalLanguage Understanding),也稱為計(jì)算語言學(xué)(Computational Linguistics。一方面它是語言信息處理的一個(gè)分支,另一方面它是人工智能(AI, Artificial Intelligence)的核心課題之一。
統(tǒng)計(jì)分析:假設(shè)檢驗(yàn)、顯著性檢驗(yàn)、差異分析、相關(guān)分析、T檢驗(yàn)、方差分析、卡方分析、偏相關(guān)分析、距離分析、回歸分析、簡(jiǎn)單回歸分析、多元回歸分析、逐步回歸、回歸預(yù)測(cè)與殘差分析、嶺回歸、logistic回歸分析、曲線估計(jì)、因子分析、聚類分析、主成分分析、因子分析、快速聚類法與聚類法、判別分析、對(duì)應(yīng)分析、多元對(duì)應(yīng)分析(最優(yōu)尺度分析)、bootstrap技術(shù)等等。
數(shù)據(jù)挖掘:分類 (Classification)、估計(jì)(Estimation)、預(yù)測(cè)(Prediction)、相關(guān)性分組或關(guān)聯(lián)規(guī)則(Affinity grouping or association rules)、聚類(Clustering)、描述和可視化、Description and Visualization)、復(fù)雜數(shù)據(jù)類型挖掘(Text, Web ,圖形圖像,視頻,音頻等)
模型預(yù)測(cè):預(yù)測(cè)模型、機(jī)器學(xué)習(xí)、建模仿真。
結(jié)果呈現(xiàn):云計(jì)算、標(biāo)簽云、關(guān)系圖等。
要理解大數(shù)據(jù)這一概念,首先要從"大"入手,"大"是指數(shù)據(jù)規(guī)模,大數(shù)據(jù)一般指在10TB(1TB=1024GB)規(guī)模以上的數(shù)據(jù)量。大數(shù)據(jù)同過去的海量數(shù)據(jù)有所區(qū)別,其基本特征可以用4個(gè)V來總結(jié)(Vol-ume、Variety、Value和Veloc-ity),即體量大、多樣性、價(jià)值密度低、速度快。
第一,數(shù)據(jù)體量巨大。從TB級(jí)別,躍升到PB級(jí)別。
第二,數(shù)據(jù)類型繁多,如前文提到的網(wǎng)絡(luò)日志、視頻、圖片、地理位置信息,等等。
第三,價(jià)值密度低。以視頻為例,連續(xù)不間斷監(jiān)控過程中,可能有用的數(shù)據(jù)僅僅有一兩秒。
第四,處理速度快。1秒定律。最后這一點(diǎn)也是和傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)有著本質(zhì)的不同。物聯(lián)網(wǎng)、云計(jì)算、移動(dòng)互聯(lián)網(wǎng)、車聯(lián)網(wǎng)、手機(jī)、平板電腦、PC以及遍布地球各個(gè)角落的各種各樣的傳感器,無一不是數(shù)據(jù)來源或者承載的方式。
大數(shù)據(jù)技術(shù)是指從各種各樣類型的巨量數(shù)據(jù)中,快速獲得有價(jià)值信息的技術(shù)。解決大數(shù)據(jù)問題的核心是大數(shù)據(jù)技術(shù)。目前所說的"大數(shù)據(jù)"不僅指數(shù)據(jù)本身的規(guī)模,也包括采集數(shù)據(jù)的工具、平臺(tái)和數(shù)據(jù)分析系統(tǒng)。大數(shù)據(jù)研發(fā)目的是發(fā)展大數(shù)據(jù)技術(shù)并將其應(yīng)用到相關(guān)領(lǐng)域,通過解決巨量數(shù)據(jù)處理問題促進(jìn)其突破性發(fā)展。因此,大數(shù)據(jù)時(shí)代帶來的挑戰(zhàn)不僅體現(xiàn)在如何處理巨量
數(shù)據(jù)可視化的16個(gè)經(jīng)典案例
[數(shù)據(jù)可視化]
本文編譯自:Ross Crooks
數(shù)據(jù)可視化是指將數(shù)據(jù)以視覺的形式來呈現(xiàn),如圖表或地圖,以幫助人們了解這些數(shù)據(jù)的意義。通過觀察數(shù)字、統(tǒng)計(jì)數(shù)據(jù)的轉(zhuǎn)換以獲得清晰的結(jié)論并不是一件容易的事。而人類大腦對(duì)視覺信息的處理優(yōu)于對(duì)文本的處理——因此使用圖表、圖形和設(shè)計(jì)元素,數(shù)據(jù)可視化可以幫你更容易的解釋數(shù)據(jù)模式、趨勢(shì)、統(tǒng)計(jì)數(shù)據(jù)和數(shù)據(jù)相關(guān)性,而這些內(nèi)容在其他呈現(xiàn)方式下可能難以被發(fā)現(xiàn)。
數(shù)據(jù)可視化可以是靜態(tài)的或交互的。幾個(gè)世紀(jì)以來,人們一直在使用靜態(tài)數(shù)據(jù)可視化,如圖表和地圖。交互式的數(shù)據(jù)可視化則相對(duì)更為先進(jìn):人們能夠使用電腦和移動(dòng)設(shè)備深入到這些圖表和圖形的具體細(xì)節(jié),然后用交互的方式改變他們看到的數(shù)據(jù)及數(shù)據(jù)的處理方式。
我們必須用一個(gè)合乎邏輯的、易于理解的方式來呈現(xiàn)數(shù)據(jù)。但是,并非所有數(shù)據(jù)可視化作品的效果都一樣好。那么,如何將數(shù)據(jù)組織起來,使其既有吸引力又易于理解?讓我們通過下面的16個(gè)有趣的例子獲得啟發(fā),它們是既注重風(fēng)格也注重內(nèi)容的數(shù)據(jù)可視化經(jīng)典案例。
1:為什么會(huì)有“巴士群”現(xiàn)象
這里有一個(gè)關(guān)于復(fù)雜數(shù)據(jù)集的很好的例子,它看起來感覺像一個(gè)游戲。在這個(gè)例子里,Setosa網(wǎng)站為我們呈現(xiàn)了“巴士群”現(xiàn)象是如何發(fā)生的,即當(dāng)一輛巴士被延遲,就會(huì)導(dǎo)致多輛巴士在同一時(shí)間到站。
只用數(shù)字講述這個(gè)故事是非常困難的,所以取而代之的是,他們把它變成一個(gè)互動(dòng)游戲。當(dāng)巴士沿著路線旋轉(zhuǎn)時(shí),我們可以點(diǎn)擊并按住一個(gè)按鈕來使巴士延遲。然后,我們所要做的就是觀察一個(gè)短暫的延遲如何使巴士在一段時(shí)間以后聚集起來。
2:世界上的語言
這個(gè)由DensityDesign設(shè)計(jì)的互動(dòng)作品令人印象深刻,它將世界上眾多(或者說,我們大多數(shù)人)語言用非語言的方法表現(xiàn)出來,一共有2678種。
這件作品可以讓你瀏覽使用共同語言的家庭,看看哪些語言是最常用的,并查看語言在世界各地的使用范圍。這是一種了不起的視覺敘事方法:將一個(gè)有深度的主題用一種易于理解的方式進(jìn)行解讀。
3:按年齡段分布的美國(guó)人口百分比
應(yīng)該用什么方式去呈現(xiàn)一種單一的數(shù)據(jù)?這是一個(gè)令人信服的好榜樣。
Pew Research創(chuàng)造了這個(gè)GIF動(dòng)畫,顯示人口統(tǒng)計(jì)數(shù)量隨著時(shí)間推移的的變化。這是一個(gè)好方法,它將一個(gè)內(nèi)容較多的故事壓縮成了一個(gè)小的動(dòng)圖包。此外,這種類型的微內(nèi)容很容易在社交網(wǎng)絡(luò)上分享或在博客中嵌入,擴(kuò)大了內(nèi)容的傳播范圍。
4:NFL(國(guó)家橄欖球聯(lián)盟)的完整歷史
體育世界有著豐富的數(shù)據(jù),但這些數(shù)據(jù)并不總是能有效地呈現(xiàn)。然而,F(xiàn)iveThirtyEight網(wǎng)站做得特別好。
在下面這個(gè)交互式可視化評(píng)級(jí)中,他們對(duì)國(guó)家橄欖球聯(lián)盟史上的每一場(chǎng)比賽計(jì)算“等級(jí)分” – – 根據(jù)比賽結(jié)果對(duì)球隊(duì)實(shí)力進(jìn)行簡(jiǎn)單的衡量 ??偣灿谐^30,000個(gè)評(píng)級(jí),觀眾可以通過比較各個(gè)隊(duì)伍的等級(jí)分來了解每個(gè)隊(duì)伍在數(shù)十年間的比賽表現(xiàn)。
5:Google Flights 上的美國(guó)感恩節(jié)
下面是將一段時(shí)間內(nèi)在空中移動(dòng)的物體進(jìn)行可視化的好方法。這是由Google Trends驅(qū)動(dòng)的項(xiàng)目,它跟蹤感恩節(jié)前出發(fā)、到達(dá)和穿越美國(guó)的航班。
可視化始于當(dāng)天很早的時(shí)間,隨著時(shí)間的推移,像播放電影一樣顯示在全國(guó)各地飛行中的航班。不需要顯示時(shí)間外的任何數(shù)字,觀眾即可以看到當(dāng)天哪段時(shí)間是國(guó)際航班、國(guó)內(nèi)航班以及往返于全國(guó)各地不同樞紐的航班的熱門時(shí)間。
6:是什么真正造成了全球變暖?
我們都知道,“不要只簡(jiǎn)單地展示數(shù)據(jù),講個(gè)故事吧”。這正是彭博商業(yè)正在做的可視化 ——用互動(dòng)的方式來講述故事的來龍去脈。。
此圖的關(guān)鍵是要反駁用自然原因解釋全球變暖的理論。首先你會(huì)看到從1880年至今觀測(cè)到的溫度上升情況。為了使故事內(nèi)容更加豐富,當(dāng)你向下滾動(dòng)時(shí),這個(gè)可視化圖會(huì)讓你清楚的了解到相較于已被觀測(cè)到的因素,造成全球變暖的不同因素到底有多少。作者希望觀眾能夠得到非常清晰的結(jié)論。
7:在敘利亞,誰和誰在戰(zhàn)斗?
許多不同的團(tuán)體之間的關(guān)系可能令人很難理解 – 尤其是當(dāng)有11個(gè)這樣的團(tuán)體存在的時(shí)候。這些團(tuán)體之間有的結(jié)盟,有的敵對(duì),反之亦然。這讓人難以理解。
但是,Slate網(wǎng)站通過表格的形式和熟悉的視覺表達(dá),將這些數(shù)據(jù)簡(jiǎn)化為一種簡(jiǎn)單的、易于理解和可交互的形式。觀眾可以點(diǎn)擊任一張臉來查看雙方關(guān)系的簡(jiǎn)要描述。
8:最有價(jià)值的運(yùn)動(dòng)隊(duì)
這是通過疊加數(shù)據(jù)來講述深層故事的一個(gè)典型例子。
這個(gè)交互由Column Five設(shè)計(jì),受福布斯“2014年最具價(jià)值的運(yùn)動(dòng)隊(duì)50強(qiáng)”名單得到的啟發(fā)。但是它不僅將列表可視化,用戶還可以通過它看到每支隊(duì)伍參賽的時(shí)間以及奪得總冠軍的數(shù)量。這為各隊(duì)的歷史和成功提供了更全面的概況信息。
9:美國(guó)風(fēng)圖
下面是一個(gè)類似感恩節(jié)航班的可視化圖,除了圖中顯示的時(shí)刻,它還能實(shí)時(shí)顯示美國(guó)本土的風(fēng)速和風(fēng)向。
它是直觀設(shè)計(jì)的一個(gè)很好的案例:風(fēng)速用線條移動(dòng)的快慢來表示,方向通過線條移動(dòng)的路徑來表示。它會(huì)即時(shí)顯示美國(guó)風(fēng)向的總體趨勢(shì),無需任何數(shù)字,除非你在地圖上點(diǎn)擊鼠標(biāo)。另外,使用時(shí)設(shè)定最多兩個(gè)變量會(huì)使它更容易操作。
10:政治新聞受眾渠道分布圖
據(jù)Pew研究中心稱,當(dāng)設(shè)計(jì)師在信息內(nèi)容很多又不能刪的時(shí)候,他們通常會(huì)把信息放到數(shù)據(jù)表中,以使其更緊湊。但是,他們?cè)谶@里使用分布圖來代替。
為什么呢?因?yàn)榉植紙D可以讓觀眾在頻譜上看到每個(gè)媒體的渠道。在分布圖上,每個(gè)媒體的渠道之間的距離尤為顯著。如果這些點(diǎn)僅僅是在表中列出,那么觀眾就無法看到每個(gè)渠道之間的對(duì)比效果。
11:著名創(chuàng)意人士的日程安排
這個(gè)數(shù)據(jù)可視化圖是用奇特的想法描繪出的一個(gè)簡(jiǎn)單概念。這個(gè)表格利用Mason Currey的《日常慣例》一書中的信息展示了那些著名創(chuàng)意人士的日程安排,解讀其時(shí)間和活動(dòng)安排。這不僅是一個(gè)數(shù)據(jù)分析的例子(因?yàn)槟憧梢酝ㄟ^單獨(dú)的活動(dòng)來瀏覽日程安排),也是一個(gè)品牌宣傳的佳作。
12:今年發(fā)生了哪些新聞?
最好的數(shù)據(jù)可視化方式,就是用直觀和美麗的方式傳達(dá)信息。Echelon Insights致力于這一方式,將2014年Twitter上最受關(guān)注的新聞進(jìn)行了可視化。
1億8450萬條推文是什么樣子?就是如下圖所示的藝術(shù)品。
13:?jiǎn)栴}的深度
當(dāng)你想強(qiáng)調(diào)規(guī)模的時(shí)候,靜態(tài)數(shù)據(jù)可視化是表達(dá)你的觀點(diǎn)的極佳方式。下面這張來自《華盛頓郵報(bào)》的信息圖長(zhǎng)得令人難以置信…這是故意的。他們?cè)趫D中展示了一架飛機(jī)可以探測(cè)到的深海信號(hào)是多么的深,通過比較飛機(jī)的探測(cè)深度與高層建筑、已知哺乳動(dòng)物的最大深度、泰坦尼克號(hào)沉船的深度等。這是簡(jiǎn)單的視覺效果和顏色梯度的極佳使用方式。
最后,將數(shù)據(jù)添加到新聞報(bào)道中(文中為失蹤的馬航)是提供背景的好方式。
14:前沿預(yù)算
上述圖表相對(duì)簡(jiǎn)單,以下是創(chuàng)造設(shè)計(jì)精致的、傳遞大量數(shù)據(jù)的圖表的方法。秘訣何在?——用簡(jiǎn)單和干凈的格式,便于讀者理解數(shù)據(jù)。
這個(gè)由GOOD Magazine 和 Column Five制作的圖表,解讀了NASA的五年預(yù)算,顯示資金將怎么花、花在哪里。此外,它還有一個(gè)主題設(shè)計(jì),這真是一個(gè)全面成功的作品!
15: Kontakladen慈善年報(bào)
不是所有的數(shù)據(jù)可視化都需要用動(dòng)畫的形式來表達(dá)。當(dāng)現(xiàn)實(shí)世界的數(shù)據(jù)通過現(xiàn)實(shí)生活中的例子進(jìn)行可視化,結(jié)果會(huì)令人驚嘆。設(shè)計(jì)師Marion Luttenberger把包含在Kontakladen慈善年報(bào)中的數(shù)據(jù)以一種獨(dú)特的方法表現(xiàn)出來。
該組織為奧地利的吸毒者提供支持,所以Luttenberger就通過現(xiàn)實(shí)生活中的視覺元素來宣傳他們的使命。例如,這輛購(gòu)物車的形象表現(xiàn)出受助者每一天可以負(fù)擔(dān)得起多少生活必需品。
16:奧地利太陽能年報(bào)
雖然有許多方法都能使數(shù)據(jù)可視化,但是其中,使用真實(shí)信息主體去創(chuàng)建數(shù)據(jù)可視化作品的做法非常了不起。這份來自Austria Solar的年度報(bào)告,通過在頁面上使用太陽光感墨水,用真正的太陽能給公司數(shù)據(jù)賦予生命。
一句話總結(jié):他們是天才。

關(guān)于數(shù)據(jù)分析經(jīng)典案例和數(shù)據(jù)分析著名案例的介紹到此就結(jié)束了,不知道你從中找到你需要的信息了嗎 ?如果你還想了解更多這方面的信息,記得收藏關(guān)注本站。
數(shù)據(jù)分析經(jīng)典案例的介紹就聊到這里吧,感謝你花時(shí)間閱讀本站內(nèi)容,更多關(guān)于數(shù)據(jù)分析著名案例、數(shù)據(jù)分析經(jīng)典案例的信息別忘了在本站進(jìn)行查找喔。
版權(quán)聲明:本文內(nèi)容由網(wǎng)絡(luò)用戶投稿,版權(quán)歸原作者所有,本站不擁有其著作權(quán),亦不承擔(dān)相應(yīng)法律責(zé)任。如果您發(fā)現(xiàn)本站中有涉嫌抄襲或描述失實(shí)的內(nèi)容,請(qǐng)聯(lián)系我們jiasou666@gmail.com 處理,核實(shí)后本網(wǎng)站將在24小時(shí)內(nèi)刪除侵權(quán)內(nèi)容。