0

大數據閱讀心得 part 2: 身處數據洪流中,當把握機會

看世界的角度不一樣
 
在過去,我們想要了解這麼世界,往往必須先假設再去收集資料與加以分析。但是現在的時代,資料排山倒海而來。我們有時候要換個角度看這個世界,也許對於這個世界能有更多的理解。這並不是說假設不需要,畢竟數據分析的運作,本身就需要非常多的理論與假設。只是我們有更強大的能力可以去驗證各式各樣光怪陸離的”假設”,這是這個時代的特色。
 

把資訊給資料化(datafication)方能釋放出威力
 
各式各樣的資訊都可以資料化。日本有一位越水重臣教授,在一張汽車座椅上放了360個感應器,每個感應器的數值是0-256。於是乎每一個人的每個坐姿都可以得到一組讀數。這堆讀數可以用來辨識誰坐在上面。辨識率高達98%以上。這很無聊?但是這如果拿來防盜呢?拿來做駕駛安全防護呢?如果汽車座椅可以感應到正確主人的坐姿與讀數,那幾乎不可能被他人竊盜。另外分析這些坐姿的讀數,也可以用來提醒駕駛人是否瀕臨危險。誰說沒有用處呢?
 

另外,像我們現在已經習慣使用的GPS,也是把資訊給資料化後,釋放出巨大威力的典範。在過去,人類就想要把我們所處的空間給定位,繪圖。直到1978年開始有了由24顆衛星組成的GPS系統,讓我們的空間給徹底資料化。以現在的GPS,可以以一公尺的精準度,給每一個位置一組數據。而這些數據就可以作為巨大的應用,像是汽車/飛機/船舶的導航,像是快遞公司用來監測物流,並把路徑最佳化。大家熱愛的”打卡”更是不在話下…。這就是資料化後衍伸出的巨大威力。
 

拜資訊科技之賜,以往難以資料話的東西,也都成為可行。像臉書就是把”人際關係”給資料化的例子。柯P就是去觀測臉書的”讚”,來決定選戰的方向與對策。如果沒有這些”數據”,這個做法就難以實現。
 

在專業領域上,透過科技,也可以把許多事情資料化,像是”震動”。不知道老爹的震動果實測量起來會是什麼概念,帕金森氏症的患者,肢體會有抖動的情形。如果利用智慧型手機內建的三維加速感知器,把患者的抖動情形給記錄下來,是不是能夠幫助診斷?並且把治療的效果給量化,這個對於疾病的治療一定會有巨大的幫助。
 


沒有不能用的資料,就看你怎麼用。

 
google-recaptcha

上圖這個圖形,或者是類似的,大家應該常遇到吧?這就是為了防範機器人攻擊而產生的辨識系統。全球一天大約會有兩億次的使用量。相信大家都會覺得這個很煩,但是您沒想到的是,您每一次打辨認的字母時,都是幫助人類完成偉大的任務。啥米?沒錯,您真的是有巨大的貢獻。Google目前有個偉大的計劃,希望把人類所有的文獻給掃描,保存並且資料化。可以想見,一定很多字詞是電腦無法辨識的。這些無法辨識的字詞,就成為拿來考驗各位的好考題。而全球同時都會有無數人同時使用,同時有五個以上的人輸入一樣的字詞,才會被認為正確。而這種集體智慧,就是在幫助Google完成這個偉大的任務。我真是驚呆了。您還能說這個是沒有用的事情嗎?
 
1.重新檢視資料:換個角度,也許會有新的收穫。像是剛剛提到的GPS,GPS幾十年來一直是那樣的數字,但相信現在GPS的玩法,是前人無法想像的。
2.讓資料彼此組合少林武功+足球,有沒有搞頭?把手機使用時間的資料,跟腦瘤發生率都在一起,是不是可以把這兩件八竿子打不著關係的資料,拿來分析”手機用得多會不會得腦瘤這件事”呢?
3.讓資料有延伸性:監視器就是監視器。拿來防盜外,難道沒有其他價值嗎?有的!如果拿來分析顧客位置,是不是就可以分析顧客的喜好呢?

 

 

回歸到人,我們在數據洪流中,該如何自處?

 
很多人覺得,大數據就是那些工程師,那些科技公司的事情。但我倒是認為,我們這些非數據領域的人,才真正要感到無比開心。因為大數據的威力,將可以幫我們解決很多過去無法解決的問題。而創新往往來自跨領域的結合。用我們本身的專業,搭上數據的洪流,才是正途。就像羅胖說的,我們都應該要能夠自由地與他人協作,才能把產值給最大化。
這邊提個例子。IBM的Dr. Watson,是一台超級電腦。內載上百萬個患者的資料,可以齊全的知道某項疾病各式各樣的表現。人腦要跟他比鑑別診斷,是不可能的…。要跟他比實證醫學,更不可能,那不是人腦擅長的。事實上,Dr. Watson就跟腫瘤名醫PK過。大勝,毫無懸念。說到這裡,可能有的人會開始跳腳,開始舉電腦當醫生的100萬個缺點。電腦來幹這件事情,當然有缺點,但是我們何妨不多看看他的優點呢?你有聽過達文西嗎?
 

 


大數據的黑暗面

 
說了很多大數據的好話,接下來要說大數據的壞話。大數據時代,最大的風險就在於
 
1.隱私的保護。在過去,把名字/身分證字號/地址/電話等”個資”拿掉,大概就無法辨認資訊了。但是在大數據之下,某位40-50歲男性,住在一個有花園的別墅,開著一台藍色的車,喜歡穿凡賽斯的西裝。這樣也可能可以找到人。很多細細碎碎的痕跡,是可以找出一個人的。還記得Z9嗎?他可從來都不知道那些正妹的名字/帳號啊!

2.預測=結果?大數據的運算可以去預測很多事情。但是可以用來預測某個人犯罪的可能性嗎?可以用來判斷一個犯人是否該假釋嗎?這是個巨大的爭議。如果要更有感覺,請觀賞阿湯哥的電影”關鍵報告”。您會更有感。
 

 

結論:

 
數據可以造假,而導致判斷錯誤。但是你能做假一千筆,一萬筆,但是你能做假100億筆嗎?文明進步所產生的可能問題,只能靠文明繼續往前來解決,而不是倒退回過去。身處數據洪流之中,掌握好機會的人將站在風口浪尖,而只會排斥的人,就會…。望向台北市長第一高票落選人。
 
 
參考資料:
 

medarchies

發表迴響