悄悄來臨的大數據時代
- 時間:2012-12-25
- 來源:
遠光軟件(來源:光明日報 作者:張蕾)
如今,網購已在悄悄改變著人們許多年以來形成的購物方式。對于剛剛過去的11月11日,人們仍記憶猶新,知名電商阿里巴巴通過旗下的天貓和淘寶,將“光棍節”變成“購物狂歡節”。
阿里巴巴是做什么的?很多人會說“電子商務”。但如果看電商交易的實質,實際上是“海量的信息和數據服務”一句話,阿里巴巴的所作所為符合“大數據時代”的潮流特征。
繼“物聯網”、“云計算”之后,進入2012年,“大數據”一詞被越來越多地提及。人們用它來描述、定義信息爆炸時代產生的海量數據,并命名與之相關的技術發展與創新。
“大數據并非突然產生的,實際上,IBM、谷歌和亞馬遜等大企業早已開始利用它。這個概念之所以能夠為更多行業所認知,還是因為人們越發看重它的應用。”中國工程院院士、工信部通信科技委主任鄔賀銓表示。
“大數據時代”已經來臨
最早提出“大數據”時代到來的是管理咨詢公司麥肯錫:“數據,已經滲透到當今每一個行業和業務職能領域,成為重要的生產因素。人們對于海量數據的挖掘和運用,預示著新一波生產率增長和消費者盈余浪潮的到來。”
什么是大數據?鄔賀銓引用了維基百科的定義:沒有辦法在允許的時間里用常規的軟件工具對內容進行抓取、管理和處理的數據集合。“當然,大數據規模的標準是持續變化的,當前泛指單一數據集的大小在幾十個TB(萬億字節)和幾個PB(千萬億字節)之間。”
大數據到底有多大?以下這組“互聯網上一天”的數據告訴我們:一天之中,百度大約要處理60億次搜索請求,達到幾十PB數據;淘寶網站的交易達數千萬筆,單日數據量超過20TB;聯通的用戶上網記錄一天達到10TB……
“如果說第三次工業革命有各種各樣的標記,那么信息技術發展到今天,大數據也是其中的一個標記。”鄔賀銓評價道。
大數據雖然孕育于信息通信技術的日漸普遍和成熟,但各行各業的有識之士認為,它對社會經濟生活產生的影響絕不僅限于技術層面。
挖掘“數據財富”
當你仍把微博等社交平臺當作抒情或者大發議論的工具時,一些商界精英卻正在挖掘“數據財富”,先人一步用其判斷市場走勢,從中獲得了不菲的收益。
通過分析網民的情感數據,社交媒體監測平臺DataSift發現,社交網站臉譜(Facebook)申請上市發行股票的當天,微博推特(Twitter)上的情感傾向與Facebook股價波動基本上呈正相關:在Facebook開盤前,如果Twitter上的情感逐漸轉向負面,25分鐘之后Facebook的股價便開始下跌;而當Twitter上的情感轉向正面時,Facebook股價在8分鐘后也隨之回彈……當然,僅憑這些并不能證明Twitter的情感傾向會對股價產生影響,不過確實已經有人試圖據此發現預測股價走勢的方法。
大數據的影響并不僅限于信息通信產業,它還在“吞噬”、重構一些傳統行業從這個意義上講,廣泛運用數據分析手段管理和優化運營的公司其實質都是一個數據公司。
鄔賀銓舉了個有趣的例子。美國target超市將女性顧客中的孕婦視作購物的黃金消費者。為了將這部分目標人群在懷孕前就爭取過來,該超市通過調查羅列出幾十種購物偏好,當某位顧客的收銀條上集中呈現這類商品時,就會被認定為可能是孕婦或家中有孕婦,并隨后向其發送孕婦產品廣告。一次,當有人以“家中并無孕婦卻總是收到相關產品廣告”為由控告這家超市后,卻發現原來是自己還在上高中的女兒懷孕了。“這個例子告訴我們,利用購物信息這個大數據,商家可以進一步分析、細分購物群體,從而提升銷售額。”
此外,利用搜索關鍵詞,疾控部門可以預測、判斷某地流感暴發情況;通過關注社交網絡上“糖友”的交流與感悟,醫院和醫生可以獲得更好的糖尿病診療和康復經驗……據鄔賀銓介紹,不僅在商業方面,大數據在電網運營、交通管控、醫療服務等社會領域同樣存在著巨大的利用空間。
拿什么迎接“大數據時代”
如何利用這些大數據,從而開發出其中的商業價值,已經成為投資者、IT界人士以及政府公共管理部門普遍關心的問題。
2012年3月29日,美國政府宣布投資兩億美元拉動大數據相關產業發展,將“大數據戰略”上升為國家意志。
最積極的當屬眾多IT企業。IBM提出,繼上一個十年拋棄私人電腦業務成功轉向軟件和服務后,這次將更多地專注于大數據分析軟件帶來的全新業務增長點。此外,有關“大數據”主題的并購案層出不窮,并購數量和規模都呈逐步上升態勢。其中,Oracle對Sun、惠普對Autonomy兩大并購案總金額高達176億美元。
當眾多國外企業競相追逐大數據帶來的產業價值時,還鮮有一家中國公司能夠躋身大數據開發的領先行列。
鄔賀銓表示,雖然現在國家從科技項目上開始重視大數據,安排了一些研究,但感覺整體差距還很大。“這并非一些簡單的科技項目就能解決的,應該鼓勵擁有資源和能力的企業、部門去開發大數據,因為他們才是真正的應用需求者,才是牽引技術的最重要力量。”
為了縮小在這場時代競爭中的“起跑”差距,政府的主導作用顯得尤為重要。
“除特殊情況外(例如涉及國家機密和安全),政府部門應該盡可能及時地發布、公開信息,鼓勵數據共享,幫助需求主體了解各行各業的整體情況。”鄔賀銓認為,我國目前的狀況不是數據收集太少,而是共享太少。“擁有數據的部門沒有能力去分析,有分析能力的部門沒有數據,各部門之間缺少協調合作,這實際上涉及一個體制問題。”
此外,擁有數據的企業或部門不知如何在保護好用戶隱私與安全的情況下使用大數據,也是妨礙我國緊跟“大數據時代”的一大羈絆。
既然收集、整理、存儲大數據的門檻這么高,為什么不利用國外的平臺去做點什么?對此,鄔賀銓特別提示,國內企業和相關部門要避免將自己的重要數據放到國外的分析應用平臺。“這些看似無關的數據,其實都跟企業發展策略、國家經濟運行狀況相關,我們不能因為國外的東西免費好用而失去了對信息安全的警覺。”
上一篇:大數據的四個典型特征