訊息爆炸時代,大資料統計降臨到商業、經濟、政治等領功能變數,成為備受推崇的決策工具。大資料成為一場基於時代發展的IT洞察,是基於人類出產日子所帶來的資料以及人機、機器與機器之間更緊密通信帶來的資料聚合。甚至有人說:得大資料者得天下。

然而,大資料到底離咱們有多遠,是否只有決策者才需要大資料,或是說大資料只是為決策者服務的?結果顯然是否定的,在這個大資料時代,咱們每一個人都是大資料的創造者,每一個人也都是大資料分析福利的享用者。
跟著網際網路+,工業4.0等概念的提出,咱們更要認清,國家正在加鼎力度讓傳統政府訊息化;大資料使咱們的日子更為舒適,也使咱們的行為更為透明化。
名家定義大資料
Gartner:"大資料"是需要新處理模式才能擁有更強的決策力、洞察發現力以及流程改善能力的海量、高增長率以及多樣化的訊息資產。

大資料科學家John Rauser:大資料就是任何超過了一台電腦處理能力的龐大資料量。
分析師布賴恩·霍普金斯以及鮑裡斯·埃韋爾松提出大資料的4項典型特徵:海量(Volume)、多樣性(Variety)、高速(Velocity)以及易變性(Variability)。(如下圖片來源:網際網路)
定義大資料
《網際網路週刊》:"大資料"的概念是涵蓋了人們在大規模資料的基礎上可以做的事情,而這些事情在小規模資料的基礎上是無法實現的。
有名諮詢公司麥肯錫:大資料指的是大小超越一般的資料庫工具取得、存儲、管理以及分析能力的資料集。但它同時強調,並非說必定要超過特定TB值的資料集才能算是大資料。
假設您聽不慣名家定義的大資料,請隨我來看看,日子中大資料在哪裡?它是否真的像傳說中的那麼神奇?
大資料故事:啤酒與尿布
日子中,處處體現著大資料
"啤酒與尿布"的故事發生於20世紀90年代的美國沃爾瑪超市中,沃爾瑪的超市管理人員分析銷售資料時發現了一個使人難於理解的現象:在某些特定的情況下,"啤酒"與"尿布"兩件看上去毫無關系的商品會時常泛起在同一個購物籃中。
"啤酒"以及"尿布"兩個看上去沒有關系的商品擺放在一塊兒進行銷售、並取得了很好的銷售收益,這種現象就是賣場中商品之間的關聯性,鑽研"啤酒與尿布"關聯的方式就是購物籃分析(market basket analysis)。
商品關聯性分析是購物籃分析中最主要的部份,目前,購物籃分析的計算方式都很成熟,在進入20世紀90年代後,不少分析軟體均將一些成熟的購物籃分析演算法打包在自己的軟體產品中,成為了軟體產品的群組成部份。由此可見,大資料其實體現在日子的每個角落。
啤酒與尿布,看似風馬牛不相及的商品,經由大資料的分析,得出了驚人的結論,通過這個發現,咱們可以制訂與之對應的策略,提高超市事跡,也發現了荒誕暗地裡的邏輯。
大資料故事:紙牌屋
《紙牌屋》這部火遍了全中國的,講述一位美國白宮內的政客,如何不擇手腕的向上攀爬,競選成為美國總統電視劇,到底是如何獲得巨大勝利,它又與大資料擦出了什麼樣的火花呢?
紙牌屋
據外國媒體報導毫無疑惑,《紙牌屋》是「大資料」出來的。據稱,該部電視劇,應用所有採集的大資料,製作了一部觀眾最想看的電視劇。「比你自己還要瞭解你」就是美國視訊公司Netflix做的事。
使用者只要登入Netflix,其每次點擊、播放、暫停、喜歡哪一個橋段、哪裡使用者喜歡轉信甚至看了幾分鐘就關閉視訊,都會被作為資料進入後台分析。
天天使用者在Netflix上發生3000萬多個行為,Netflix的定閱使用者天天還會給出400萬個評分,還會有300萬次搜尋請求,訊問劇集播放時間以及裝置。這樣一來,就能精確定位觀眾的偏好,應用大資料定製《紙牌屋》。
大資料故事:維護早產嬰
醫療訊息化 離不開大資料的支撐
有資料顯示,跟著社會不斷的發展,社會結構不斷變化,產婦的產齡呈上升趨勢,致使早產嬰兒數量正在上升。在加拿大多倫多的一家病院,針對早產嬰兒,每秒鐘有超過3000次的資料讀取。通過這些資料分析,病院能夠提前曉得哪些早產兒泛起問題並且有針對性地採用措施,防止早產嬰兒夭折。
跟著醫療訊息化的深刻發展,病院業務資料呈爆炸式增長,幾乎可以納入大資料範疇。醫療訊息化必然會擁抱大資料,醫療行業本身就是擁有大資料特性的行業。
大資料故事:灌籃分析
籃球大資料 量化分析
專業籃球隊會通過收集大量資料來分析賽事情況,然而他們還在為這些資料的整頓以及實際意義而發愁。通過分析這些資料,可否找到兩三個制勝法寶,或是至少能保證球隊取得高分,做到知己知彼?美國的Krossover公司正致力於此。
教練只需將競賽視訊上傳到網上,在24小時以內,就會有四名Krossover員工群組成份析團隊,該團隊將會從運動員每個動作中作出完整、細緻的分析。
之後,教練只要進入該網站,就能檢查任何他想要的--資料統計、競賽中的個人表現、競賽反映等等。通過分析競賽視訊,毫不誇張地分析所有的可量化的資料。隊員們則可以在Krossover上把他們的一系列灌籃拼接在一個視訊中,分享給親朋好友。
智貴陽 大資料
2015年4月14日,全國首個大資料交易所——貴陽大資料交易所正式掛牌營運並完成首批大資料交易。
貴陽國際大資料產業博覽會
2015年5月26日,在貴陽國際會議展覽中心,舉辦了2015貴陽國際大資料產業博覽會暨全世界大資料時代貴陽峰會。首屆數博會共吸引國內外專業觀眾6萬餘人次參觀、參預,關聯新聞網路點擊量超過4.55億人次。
首屆數博會累計有35家企業與貴陽市達成合作意向,簽約大資料產業關聯項目近40個,投資金額超過200億元¥。預示著,貴州初步形成大資料產業發展的生態環境。
7月15日,科技部正式批複:贊成支撐貴陽省開展"貴陽大資料產業技術立異試驗區"建設試點。貴陽試驗區將加強與北京等發達地區的區功能變數合作,探索優勢互補、共同發展的新路徑。
由此可見,在"網際網路+"背景下,我國的大資料平台建設正在熱火朝天的進行。像上面的例子,數不勝數,大資料不僅融入咱們的日子,更在為社會創造利益。
大資料故事:預測未來
舉一個簡單的例子,2013年年末,亞馬遜取得了一項名為「預判發貨」的專利,亞馬遜未來可能會通過對使用者行為資料的分析,預測顧客的購買行為,在顧客尚未下單以前提前發出包裹,從而最大程度地縮短物流時間。同時,亞馬遜還會在運送途中向潛在顧客舉薦該商品,從而晉陞判斷精準度。
顯然亞馬遜應用的就是自己特有的龐大的使用者群,以及使用者此前的定單、使用者的商品搜尋記錄、心願單、購物車,甚至內含使用者滑鼠在某商品頁面的停留時間的資料訊息;這些資料訊息彙集在一塊兒,就能分析出使用者目前的經濟水平,日子狀況甚至是使用者可能會購買的商品。
亞馬遜「預判發貨」
大資料在「有心人」的分析下,成為了預測未來的風向標;也可以成為創業者的好幫手。咱們斗膽猜測,未來的資料市場有可能會泛起資料現貨,期貨交易。到了那個時候,資料進入資產負債表的時間就真的是為期不遠了。兩岸商貿,在家工作,網路創業,創業賺錢思維,微商平台,賺新台幣
編外話:但究竟該如何應用大資料,防止過度訊息化,以至於日子在透明的社會中;防止軌制不完美而讓犯罪份子有機可乘,防止無序訊息販賣。如何法律先行,讓資料市場樹立在完美的法律基礎之上,是咱們需要迫切斟酌的問題。
