2016年4月16日 星期六

札記-統計-推薦讀<不要讓大數據的相關性主宰我們的生活>

我蠻喜歡看一些「推翻似是而非」的故事,例如最近讀到一個。
日本有間7-11店鋪,
每天下午5點到7點,店裡的絲襪賣得特別好。
於是店經理就和CEO說:
「老闆,我發現5點到7點絲襪賣得好,
 所以我們決定把化妝品和絲襪放在一起賣,
 這樣就能帶動化妝品的銷售了。」

CEO說:
「你給我看的只是量化的數據,
 你到店裡看過是誰在買絲襪嗎?」

經理就說:「好,那我去看看。」
結果,經理發現,原來每天買絲襪的不是女人,而是男人。

男人在下班路上接到老婆電話說,你幫我帶一雙絲襪回來,
男人們就晃到711買了。
所以很少有女孩子專門去711買絲襪,
全部都是男人順手買回去的。
因此,7-11絲襪旁邊就不放化妝品,改放啤酒了。
 
 
(店經理)原結論,顯然是個觀察不夠細膩所致,
不求證事實,只想靠用數據"推論"來找出答案。
有人說:數據會說話。是嗎?
就這麼確定,看數據就能知道因果關係喔?

微信上,我有讀到分析大數據的文章,
近來最好的,應該是這一篇