互聯網IDC圈8月31日報道,數據從何而來,這個問題看似簡單,卻是數據應用最基礎的一步,正因為信息爆炸時代產生的海量數據前提,我們才進入了真正的大數據時代,《大數據時代》這本書是國外大數據研究的先河之作,本書的作者舍恩伯格被譽為大數據應用第一人,在多個互聯網重鎮任教的經理,早在2012年就在經濟學人發布了14頁的大數據研究。8月29日-30日七牛D-Future數據時代峰會上維克托•邁爾•舍恩伯格讓我們再一次感受數據全新的洗禮。
維克托•邁爾•舍恩伯格
以下是舍恩伯格演講內容(根據速記整理):
舍恩伯格:非常榮幸能出席今天的盛會,今天上午我們聽到了很多技術的演講,技術實際上給我們帶來了變革,這些變革也給我們帶來了一些前所未有的成功,比如在商業界,還有各個公司,大公司小公司,給他們帶來了成功,在接下來的30分鐘,我想要讓大家思考一下,數據實際上給我們帶來了工具,這些工具給我們帶來了成功。但是我們真正取得成功,還是要取決于我們利用這個工具的能力。這就需要我們要好好的了解什么是數據,還有未來的數據到底是怎么樣的。首先我給大家講一個故事吧。這個故事實際上是我的同事凱爾(音)所發現的一個非常有意思的故事。
大數據時代要改變傳統思維
好象出了一點技術問題,好象有一點變化,但是我還是我。我的朋友凱爾(音)跟我講了接下來的這樣一個小故事。在美國的超市,很多年前他們銷售這些蛋糕,這些蛋糕有不同的口味,巧克力蛋糕、香蕉蛋糕、桃子味的蛋糕,這個蛋糕的尺寸大概是30厘米那么大,就像一個餡餅一樣。如果你問一下這些美國的超市,他們銷售的這些蛋糕當中,最受歡迎的銷量最好的,大家覺得在美國最受歡迎的是什么餡餅呢?蘋果餡餅,是的。但是如果你要真正去問一下,他們是不是真的喜歡蘋果餡餅,實際上可能很多人并不是真的喜歡蘋果餡餅,他們為什么不是最喜歡蘋果餡餅,卻買它呢?為什么呢?因為想一想,它有30厘米那么大,那全家人呢?買一個蘋果派就夠了。那家里的所有人可以達成一致,他們起碼比較喜歡的就是蘋果派,比如像巧克力派、香蕉派、桃派,就是蘋果派不是他們最喜歡吃的,但是他們可以吃,這個可以達成共識。因此很多年以來,世界上的這些超市,賣的派可能未必是人們最喜歡的口味,之后他們發現了問題所在,就是尺寸問題。如果你讓它尺寸變小的話,也就是說,每一個家庭可以不止買一個派,每一個家庭成員都可以買一個自己喜歡吃的口味。如果你把尺寸變一下,他們可能就不是買蘋果派,可能他們根據自己的口味買香蕉派、梨派、桃派,這個問題就很簡單了。
因為在之前,很多年以來,這些超市的策略是不對的。實際上是尺寸的問題,而不是口味的問題,他們的尺寸太大了,之后他們進行了調查,問用戶到底喜歡吃什么口味的,他們肯定喜歡說,我想要吃蘋果派,因為只有那個尺寸的蘋果派。大家可能說等一下,我們一直做研究數據,我們一直看周圍的環境是什么樣的情況,是的,是這樣的。但是幾百年前幾千年前,我們看當時的世界,觀察它,了解這個世界。那么在過去我們一直以來,都是這樣做的,我們一直也在搜集數據。搜集數據,分析數據,是需要花費很多的時間,有時候也是非常困難的,需要做大量的工作,有時候也是非常昂貴的。我們有了幾千年的歷史,也在不停的搜集數據,代價是非常昂貴的。但是我們可能用到的數據只有一小部分,有是有限的,我們花了那么多錢,搜集這個數據,但是我們處理的量是很小的。因此我們之前擁有的數據規模是非常小的。每天我們所處理的數據,實際上規模、數據是非常小的。大家可以想一下,我們現在的數據分析,或者是一些小的樣本。它們都是一些小的數據。我們是把數據縮小到一定的規模,然后從這些小的規模數據上找到一些理論。當然了,那是小數據時代,也是我所成長的一個時代。
但是現在一切都變了。我們現在搜集數據分析數據的能力越來越強了。而且現在搜集數據的成本也下降了。現在數據價格成本已經不貴了。便宜了。因此我們周圍一切都變化了。那這時候我們就需要改變自己的思維,因為我們所處的是大數據時代。如果我們找到新的方法,就可以有新的理念。
隨時隨地的搜集數據,在未來,可能它就起作用
在過去我們希望可以利用數據,來回答問題,首先可能是先是假設,這就是一個問題,然后搜集數據,最后進行分析,這就是一個流程。首先我們從問題切入。最后這個問題可能會給我們帶來這個答案。那么這個問題,比如說大家最喜歡的口味的派是什么,是蘋果還是桃味的?最后我們拿到了問題的答案,可能就是蘋果派,最后我們就覺得蘋果派是最受歡迎的,但是反而我們得到了這個問題的答案是錯誤的。那么現在我們其實可以做一些改變,改變一下我們的方式,我們不是從問題開始著手,因為有可能我們的問題本身就是錯誤的。我們先從數據著手,然后從數據開始搜集數據,進行分析。然后通過分析,我們可以提出一些非常棒的問題。比如說這個派的尺寸,最合適的尺寸是什么,這是正確的問題。根據這個分析,我們可以獲得這樣的一個假設。最后我們可以得到問題的答案,就是我們需要一個尺寸合適大小合適的派。我給大家拍張照片,后面的兩位請微笑。好了,非常棒。現在我就要做一個決定,我拍了這個照片,什么是重要的,比如說如果你是非常重要的,我們就聚焦在你身上,后面的人就變成模糊的影像,我可能決定你是我的焦點,我不能讓你成為一個模糊的影像。或者是我的焦點放在你這個人,那么你后面的人可能會變成模糊的影像,這意味著什么呢?我現在在照一個照片,我首先要清楚,我感興趣的事物是什么,人是什么。我的焦點在哪里,我需要知道這個問題,知道了這個問題之后,我才能知道答案。但是如果我現在不知道焦點聚集在誰身上,那怎么辦呢?實際上這個聚焦也是屬于小數據,如果現在你現在已經決定了你聚焦在誰身上,這個就是小數據,如果現在還沒有決定那怎么辦呢?大家可以看這張照片,有一個牙刷,后面是我四歲的兒子,可以看到這里牙刷是我聚焦的位置,我兒子就變得模糊了。但是現在我想改變焦點,讓我兒子成為焦點,那怎么辦呢?那我們這張照片實際上是用大數據的攝象頭來設想的,它實際上可以捕捉到各種各樣的數據,現在我們想要讓我的兒子變成焦點,我用這個大數據攝像機拍完了之后,就可以調節這個焦點,在牙刷和我兒子之間切換焦點,因為這個攝像機搜集到了所有的數據,不是小的數據,而是大的數據,因此我可以改變聚焦的位置。所以我們搜集所有的數據,不需要先定義問題,可以先把數據搜集起來,再聚焦問題是什么。也就是說如果你可以搜集到全面的數據的話,可以發現創新性的問題。而且你可能完全不需要回答這些問題,大家可能聽說過這個品牌,多林國(音),實際上這是一個學習的應用,你可以用Iphone或是安卓系統來學習外國的語言。非常有意思,而且很酷。如果有興趣的話,我也鼓勵大家使用這個應用,全世界范圍內有很多的人,每天都在使用多林國這個應用。我們使用數碼設備,來使用這個應用,這個應用實際上可以捕捉我們的數據,捕捉我們的信息,可以捕捉我們學習語言的習慣,而且進行分析。多林國(音)這個公司,西班牙語的這些人,他們學習英語的方法是錯誤的,他們學習順序是錯誤的,如果你可以改變一下這個順序的話,西班牙人學習英語的速度就會越來越快。實際上他們一開始不是為了回答這個問題而搜集數據,他們先是搜集數據之后,然后分析數據,這個問題就出現了。他們通過分析,他們就調節了一下西班牙人學習英文的數據,幫助他們更好的學習英文,因此取得了成功。大學為什么不用這種方法呢?為什么我的教授同事們沒有想到這一點呢?因為他們沒有數據,而多林國(音)公司搜集到了這些數據。多林國(音)一開始并不知道怎么使用這些數據,但是他們逐漸逐漸的發現了可以如何應用這些數據,提升了用戶的體驗,也就是說,他們實際上可以實現很大的價值。他們不僅可以為客戶提供更好的價值,而且可以帶來利潤。在過去,在以前,我們首先是提出問題,然后開始搜集數據,然后進行分析,最后拿到答案,最后把數據給扔了,因為數據已經完成了任務了,所以就把它扔到了。你要存儲數據的話也是非常貴的,但是現在儲存數據是不貴的。現在你可以應用數據實現更多的價值。你可以反復利用它,實現其他的目的。實際上我們看到的數據只是冰山一角而已。我們看到的是海洋之上的數據,大部分的數據是隱藏在海洋之下的。如果你重復使用這些數據,就可以發現潛在的價值。
文章標題:YourData,YourFuture
網址分享:http://vcdvsql.cn/article2/soiiic.html
成都網站建設公司_創新互聯,為您提供域名注冊、全網營銷推廣、定制網站、標簽優化、網頁設計公司、服務器托管
聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯