背景:
閱讀IT學(xué)生網(wǎng)新聞

白話(huà)大數據——用實(shí)例告訴你什么是大數據

[日期:03-16] 來(lái)源:IT學(xué)生網(wǎng)  作者:QQ251048012 計算機培訓學(xué)校

大數據

大數據(big data)目前已然成為IT行業(yè)中最時(shí)髦的詞匯,然而真正了解大數據的人卻不多。大數據的含義可不是僅僅數據量大,很多人對大數據的概念有所誤解,想要從概念上把大數據講清楚就得從理論上講大數據的特征,比如4V(數據體量巨大Volume、數據類(lèi)型繁多Variety、價(jià)值密度低Value、處理速度快Velocity),那就要用到很多理論性和學(xué)術(shù)性的語(yǔ)言和詞匯,相信會(huì )把大家越說(shuō)越糊涂,我在寫(xiě)大數據應用開(kāi)發(fā)工程師專(zhuān)業(yè)課程的時(shí)候,就想寫(xiě)一篇文章來(lái)告訴大家大數據是什么,卻總是組織不起那種能讓外行人秒懂的語(yǔ)言,就先把技術(shù)上的學(xué)習內容給發(fā)了,沒(méi)有學(xué)過(guò)編程的同學(xué)直接看Hadoop學(xué)些什么Spark學(xué)些什么應該難以理解。我是技術(shù)出身并不善寫(xiě)作,我決定就寫(xiě)一些我知道的大數據在方方面面的應用實(shí)例來(lái)向大家說(shuō)明大數據的含義,在這里還請大家諒解我的寫(xiě)作水平。


此圖是大數據的標準概念

 

在我們日常生活當中,我們所做的一切事,不論在線(xiàn)上還是線(xiàn)下,都會(huì )留下數字腳印。每一次刷卡購物,每一次網(wǎng)絡(luò )搜索,手機上的每一次點(diǎn)擊,乃至社交網(wǎng)絡(luò )上的每一個(gè)點(diǎn)贊,都會(huì )被記錄下來(lái)。形成的這些數據被稱(chēng)作非結構化數據,這些數據的存儲分析計算提取處理的一系列行為就是我們說(shuō)的大數據,就像聽(tīng)歌軟件會(huì )分析我們的播放記錄向我們推薦我們愛(ài)聽(tīng)的歌曲一樣,我們打開(kāi)吃飯穿衣的APP也會(huì )看到我們喜愛(ài)的菜單和衣著(zhù)搭配。

 

在出行方面大數據已經(jīng)體現得更是淋漓盡致,網(wǎng)約車(chē)已經(jīng)成為了新的產(chǎn)業(yè),傳統的出租車(chē)行業(yè)已然被顛覆,打車(chē)軟件通過(guò)對出行和車(chē)輛數據的收集和分析,在司機的APP上顯示哪里有潛在乘客,在乘客的APP上顯示哪里可以打到車(chē)。滴滴優(yōu)步這些公司徹底的改革了一個(gè)行業(yè)。就在前段時(shí)間,一元單車(chē)APP風(fēng)靡各大城市,大街小巷的人們都騎著(zhù)黃色、綠色一模一樣的自行車(chē),類(lèi)似這樣的公司做這樣的事情實(shí)際上就是用錢(qián)來(lái)砸數據,實(shí)現原始的數據積累,由此可見(jiàn)大數據的非凡魅力和巨大價(jià)值。

 

在零售方面,全球最大零售連鎖超市沃爾瑪引入大數據技術(shù)之后,在大數據分析了大量的零售數據之后發(fā)現,啤酒與尿不濕經(jīng)常出現在同一張銷(xiāo)售小票上,啤酒和尿不濕在人類(lèi)正常思維當中是沒(méi)有關(guān)聯(lián)的兩件商品,為什么會(huì )有一定的關(guān)聯(lián)度呢,經(jīng)過(guò)調查發(fā)現給寶寶購買(mǎi)尿不濕的通常是爸爸,買(mǎi)完尿不濕之后通常要買(mǎi)啤酒。所以沃爾瑪現在的尿不濕貨架旁邊就是各種啤酒。當然這只是其中的一個(gè)小小的例子,很多大數據給出的商品擺放位置在最有經(jīng)驗的沃爾瑪店員看來(lái)都是驢頭不對馬嘴的,沃爾瑪就是按照大數據分析的結果以人類(lèi)思維看來(lái)是匪夷所思的方式安排各種商品的擺放,靠這種利用大數據技術(shù)分析商品關(guān)聯(lián)度的方式大幅提高了零售營(yíng)業(yè)額。

 

在體育賽事方面,我要說(shuō)一說(shuō)我喜愛(ài)的NBA球隊——金州勇士隊,還有我最喜愛(ài)的球星之一庫里。勇士隊崛起和庫里成名的原因,就要歸功于球隊的管理者和教練相信并且使用了大數據技術(shù)所分析的結果。大數據在分析了有史以來(lái)所有的籃球比賽數據發(fā)現最有效的進(jìn)攻不是突破和扣籃,而是傳球和投籃。在這個(gè)思想的指導下,勇士隊引進(jìn)了像庫里這樣的三分球命中率球員并且瘋狂練習投籃,勇士隊利用大數據制定戰略并且利用實(shí)時(shí)數據制定現場(chǎng)戰術(shù),才得以短時(shí)間里從倒數第二成為NBA冠軍,被奧巴馬戲稱(chēng)為籃球界里的Google。勇士隊庫里

說(shuō)完籃球再講一個(gè)足球界的實(shí)例,在2014年世界杯的時(shí)候,谷歌通過(guò)自己的大數據平臺成功預測了16強比賽的每場(chǎng)比賽的勝利者,預測準確率100%,秒殺章魚(yú)保羅和貝利,我都后悔沒(méi)跟著(zhù)谷歌的預測買(mǎi)足彩……谷歌是靠網(wǎng)絡(luò )上搜集的數據,包括搜索引擎、微博和新聞報道綜合分析這些數據得出的結論,據說(shuō)著(zhù)名的物理學(xué)家霍金也參與到這個(gè)預測算法的設計。

 

在農業(yè)方面,比如以色列人的滴灌技術(shù),采用計算機進(jìn)行自動(dòng)化控制,灌溉系統中的傳感器能夠檢測植物變化和濕度,來(lái)決定對植物的灌溉量,節省人力和水資源,由于有大量的傳感器在采集數據,這種自動(dòng)滴灌系統會(huì )分析這些水量和產(chǎn)量的大數據,從而改進(jìn)灌溉方法,大數據+農業(yè)讓這個(gè)嚴重缺水國土面積還很小的國度成為農業(yè)大國。再說(shuō)一個(gè)事,大家都知道美國的家庭通常都有院落和草地的,在美劇當中我們經(jīng)?吹饺藗兡弥(zhù)水管在澆水,這兩年美國出現了自動(dòng)噴水機器人,不但可以通過(guò)草地濕度調整水量還可以與天氣預報相連,如果明天會(huì )下雨就會(huì )停止澆灌。據說(shuō)這種自動(dòng)噴水機器人可以節省95%的用水量。

 

在商業(yè)金融方面,算法交易越來(lái)越流行,金融機構紛紛利用大數據和算法來(lái)實(shí)現交易自動(dòng)化,以人類(lèi)無(wú)法匹敵的速度和頻率創(chuàng )造利潤。高頻交易就是建立在龐大數據集的基礎之上,通過(guò)分析多個(gè)市場(chǎng),根據當前的市場(chǎng)環(huán)境來(lái)執行交易指令。雖然這創(chuàng )造了巨大的利潤空間,但也讓許多證券經(jīng)紀人丟了飯碗。

 

在教育方面,百度2014年推出一個(gè)百度高考的應用,預測押中了當年全國18套作文考題中的12套,今年參加高考的同學(xué)們可以留意一下百度高考,沒(méi)準可以提前知道今年的高考考題。

 

在媒體方面,《洛杉磯時(shí)報》已經(jīng)開(kāi)發(fā)了機器人寫(xiě)作技術(shù),那里的記者正在同一堆機器人進(jìn)行競爭。在這背后,就是大數據技術(shù)的進(jìn)一步發(fā)展。 記者的許多工作現在已經(jīng)可以利用機器學(xué)習工具自動(dòng)完成,就連許多公司的財務(wù)報表都是大數據直接寫(xiě)出,只需一個(gè)會(huì )打字的人,輸入關(guān)鍵信息,大數據自動(dòng)匹配出相應風(fēng)格的稿件。而大數據的寫(xiě)法,一定更受歡迎,因為它基于的是我們大量的閱讀數據。

 

在法律方面,在訴訟案的發(fā)現階段,律師及其助手們需要篩選成千上萬(wàn)份與案件有關(guān)的文件。而現在,復雜的數據庫可以利用大數據技術(shù),比如同步分析、關(guān)鍵詞識別等,以更少的時(shí)間完成同樣的工作。而在傳統上,這些工作都是律師事務(wù)所充當律師助手的人類(lèi)完成。但是不要認為只有律師助手的工作處于危險中,就連拿著(zhù)高薪、可預測案件結果的大律師也無(wú)法幸免。據說(shuō)IBM研發(fā)的訴訟案件算法已經(jīng)能夠準確預測70%以上的法官判決結果。

 

在醫療方面,目前美國大部分癌癥已被攻破,其做法就是利用了大數據。我們都知道“舉一反三”很了不起,但是美國攻破癌癥用的就是“舉上百萬(wàn)反一”的推算法,用好多病歷算法來(lái)推進(jìn)病情發(fā)展。目前國內的趨勢是盡早實(shí)現病歷大數據共享,這將是一比巨大的財富,中國人多,如果所有患者的病歷上傳云端實(shí)現大數據共享,那么中國的醫療診斷準確率將是世界第一的。到時(shí)候我們看病只需要輸入自己的癥狀,大數據會(huì )馬上給出最好的治療方案。

 

最重要的是在國家政策方面,“十二五”以來(lái),國務(wù)院和相關(guān)部門(mén)先后印發(fā)了《促進(jìn)大數據發(fā)展行動(dòng)綱要》、《大數據產(chǎn)業(yè)發(fā)展規劃(2016-2020)》等指導性文件。特別提出加快推進(jìn)大數據產(chǎn)業(yè)應用能力,相信各位看官也已經(jīng)不止一次在央視的新聞聯(lián)播、在習大大和李克強主席那里聽(tīng)到“大數據”這個(gè)詞了吧,所以請你們相信:大數據的發(fā)展前途無(wú)量! 

附上2016年政府出臺的大數據相關(guān)政策僅供參考
IT學(xué)生網(wǎng)內容分類(lèi)