close

市值全世界第2名的阿里巴巴,旗下諸多服務內含阿里巴巴B2B平台、淘寶網C2C平台、天貓商城B2C平台,還有全國最大的第三方支付平台支付寶等, 而這些服務所發生的資料全歸一個人管,他就是阿里巴巴資料技術及產品部副總裁車品覺。

阿里巴巴分析大資料的癥結10誡 企業如何用資料解決問題

車品覺以8年打滾於資料界的經驗,以及在阿里巴巴實務套用下發展出「資料10誡」,現已修正到了4.0版本。作為阿里巴巴集團的資料最高領導人,車品覺說,他是忠誠的資料信仰者,喜歡用資料做決策解決問題。

企業要用資料解決問題,首先要執行資料10誡的第一條,清楚定義欲分析解決的問題是什麼?車品覺舉例,現在中國各大都市都竭力發展智慧城市,然而對于城市來講,什麼樣的建設或是套用才能稱為智慧,他說,若果沒有定義智慧城市,那就難以衡量專案的成效,「定義問題是從曉得到不曉得的過程。」

儘管資料科學議題很熱,企業有許多問題都能從資料中找出謎底,但也「不是每個問題都是資料的問題,不是每個問題都是大資料的問題。」車品覺說,要曉得該問題是否能靠資料解決,必需先思考5件事,以明確瞭解需要解決的問題,「這是什麼問題?誰的問題?這問題你來解決嗎?需要現在解決嗎?資料能解決嗎?」當這5個問題的謎底皆為是,那也許就是當下可以靠資料解決的問題。

阿里巴巴大資料心法:資料10誡 4.0版

1. 一切從定義「問題」開始,已知到不明的過程

2. 先假如資料都能取得來思考問題,內含衍生及迴圈思考

3. 讓資料來說明描寫、診斷、預測以及行徑建議

4.「快+准」的資料能從已知規律中發生價值

5.「廣+亂」的資料能從發現中推翻已知

6. 大資料不是獨奏,而是不斷連線無處不在的資料

7. 大資料技術就是加速以及累積「資料、分析與服務」的能力

8. 資料生態的連線需要樹立標準與規範

9. 大資料是來自不少小資料的組合

10. 資料是一種信仰!

然而不少企業曉得要解決的問題,卻苦無解決問題的資料,車品覺認為,思考問題解法時,不能把沒有資料當做借口,因為現在可以獲得資料的模式太多了。車品覺舉例,調查研討會的品質可以用最傳統的問卷,也能用科技的法子解決,只要在場內跟場外架設手機探測器掃瞄會眾手機ID,便能記錄會眾進出場內外的狀況,進一步分析演講品質。清楚定義分析的問題,不怕沒資料。

車品覺此外舉了「快的打車」App的例子,他們想解決司機拒載乘客的問題,因而提供了評價的機制,當司機拒載的時候乘客得以反映,而這些評價資料也是在思考想解決的問題後才泛起。所以「只要問題定義好, 需要的資料都存在,思考應該凌駕在資料技術之上,思考法子才是發生價值最主要的一點。」

以多面向歸納資料類型

因而資料並不是不存在,重點在於企業能否周全採集資料,為了更清楚理解資料,歸納不同類型資料能施展長處的時機,他用不同面向剖析資料。

首先,車品覺以能否預料以及意見正反作為X與Y軸,畫出四大象限描寫企業所採集的資料。他舉例,餐廳紀錄客人的餐點,這是採集Expect Positive(預料中的正面)的資料,而Expect Negative(預料中的反面)的例子則是客人沒吃完餐點的紀錄。另一個電子商務例子則是,當有人到周大福買珠寶,記錄了客戶買了哪個商品,這就是Expect Positive的紀錄,而調查客戶看了哪5個商品才買到了想要的戒指,則是Expect Negative,車品覺說,Expect Negative對于機器學習是主要的訓練樣本。

此外,他也依可用性將資料分為「快+准」以及「廣+亂」2類。「快+准」的資料是那些企業能很快速地獲得,或是時常性使用的資料,能從已知的規律中發生價值,能做的改善是加速資料更新的頻率,抑或是加速資料整合的速度,以更快速的做出決策,也許過去須3小時才更新資料,改良後指望能進步到即時。他認為,「快+准」的資料要思考的議題是「有無、準不準、細不細、全不全、穩不穩以及快不快。」

相對於於「快+准」則是「廣+亂」,「廣+亂」的資料就是當今稱作大資料的類型,來源廣泛且格式多元¥,特性是能從發現中推翻已知,車品覺認為,從「廣+亂」的資料中,才能發現意料以外的事情,因而從這些資料提煉出來的資訊也對比有顯明價值。

能有意料以外的發現,恰是資料的價值,品覺認為,大部份人思考法子是演繹法形式,從已知推論不詳,然而應用大資料技術可以逆轉這個程式。他以行銷作為例子,過去一項產品的行銷,企業會主動設定目的人群,譬如是三十幾歲的女性等,針對於這群人投放廣告,然而現在的法子,可以透過歷史的銷售資料,找出購買行為的特徵,逆向圈出目的人群。

車品覺也歷時間維度分析資料特性,不同週期的資料所提供的價值也不同樣,以天為週期的資料可以描寫狀況,而1周需要曉得的則是,上禮拜做的決策是正確仍然是過錯的,1個月就必需瞭解競爭對於手的策略與狀況,1季就需要反省組織是否達到設定的KPI。

資料從分析到套用,品質請求大不同

阿里巴巴使用資料最大的分水嶺在於「從看到用」,從資料用來分析現象,到用於節制全自動化的裝置上。車品覺分享前些日子所做的工作,恰是以自動化無人機器取代一整個既有的部門,他說,在那個時候他領悟到,資料的目的直接影響對於資料品質的請求,因為用於分析察看仍然是實際使用,需要的資料屬於不等同級。

他提到,像是無人機器的動作節制,需要多個繁雜模型互動作用,而安定且足量的資料來源是必要前提,在他們找出實際可用資料的過程,發現有不少資料的基本功沒紮穩,像是資料須達高可用性等項目,需要一塊一塊的補上。

而當企業達到沒有資料就無法提供服務的狀況,就如同無人機器沒有足夠的資料就無法運作,車品覺認為,「此時企業就走在對於的道路上」。也因為資料的主要性晉陞,企業看待資料中止應該要等同於IT系統過錯同樣的嚴重,一旦資料犯錯就必需有人負責。

不只是無人機器的節制需要有很完整的資料,在不少情境下,當沒有完整的資料描寫事件發生的細節,企業往往會把事件緣故歸於運氣。在零售業中,顧客的購物願望可能起始於朋友舉薦,經由了商品搜查以及品牌官網採集資訊,顧客逛了電子商務網站,最後卻在大賣場購買,這樣的過程也許看似大賣場對比幸運最後勝利銷售商品給這位顧客,但並不然,過程中有許多企業應該要曉得的資料。像是顧客信用卡的還款時間,因為要繳交信用卡的費用感到肉痛,因而購物願望降低,此時要顧客消費是難題重重,這儘管只是一項小資料,卻也是整個顧客購物鏈很主要的一環,車品覺認為,企業應該檢視所採集的資料是否完整,因為企業忽略顧客的資料,有時候對於結果影響很大。

車品覺直言「大資料是一種能力,企業要有愛因斯坦的大腦以及健壯的身體」,大資料能力組成的因素有思維、血液以及骨骼,思維就是資料運算邏輯或模型等,血液則是企業的資料,而骨骼便是最基礎的硬體裝置。兩岸商貿,在家工作,網路創業,創業賺錢思惟,微商平台,賺新台幣

車品覺說,從以前必需求老闆看看他做的資料,到現在老闆會抉剔他籌備的資料沒有用,他認為,這是企業應用資料進化的結果,他發現美國許多企業不只擁有資料科學家,甚至還多了決策科學家,負責用資料替公司確決策。

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 wechat101 的頭像
    wechat101

    兩岸微商網路創業平台

    wechat101 發表在 痞客邦 留言(0) 人氣()