產品中心 |
|
常州市大創電子有限公司 手機:13915077376 座機:0519-85606622 傳真:0519-85607968 郵箱: sales@czdacan.com 網址:http://www.oudz.cn/ 地址:江蘇省常州市新北區長江中路25號 |
最近關于大數據應用的討論比較熱門,但什么是“大數據”?很遺憾沒有公認的、標準量化的定義。就好像“大時代”一樣,不知道要發生過什么才能稱之為“大時代”。亞馬遜網絡服務專家、大數據科學家約翰?勞賽爾提到一個簡單的定義:大數據就是任何超過了一臺計算機處理能力的龐大數據量?;旧洗髷祿牧恳呀浭浅^了TB級別上升到PB級別了。要處理這么龐大的數據,必須有相應的、聚合多人的大智慧。
為什么我們需要大數據?
首先設想這樣一個情景,10年前和現在,當你在思考一個難題的解決方案,會有怎么樣不同的方式?如果在10年前,你會去翻書,會歷經百般周折問專家,又或者不知所措。但是現在,你只需要通過一個神奇的工具來作為核心達到這個目的——網絡和背后的數據。
這說明我們進入了一個時代:這個時代絕對不缺乏技術,不缺乏專家,多的是善于研究發現的人。網絡的產生,讓無數的專業和業余愛好者在主動的傳播著自己的知識和技術,也同時留下了自身的很多行為信息。這些信息零零散散。如果設想我們可以把這些信息組合起來,他們不就是每一種技術、每一個人、每一個事物的DNA和血液嗎,如果掌握了DNA,我們不就能掌握這個人/技術/事物了嗎?這個想法放在過去,實際操作中我們是無法實現的,因為信息每天在產生,無法采集,再說我們也沒有那么多科學家去處理和分析這些數據。但是,當我們進入了科學發展的第四個階段——資料時代,這個想法依賴科技的進一步變革,將被實現。
第四階段的說法是由資料庫專家詹姆士?格雷提出的,他曾經獲得過有“電腦界諾貝爾獎”之稱的圖靈獎。他在個人傳記中寫到:“科學發展已經走過了‘實驗、理論、計算’三個階段,而進入了第四個以‘資料’為重點的階段。過去幾十年來是計算科學大行其道的時代,各種重要的數據庫技術和算法,都在過去幾十年漸漸成熟;而現在由于全世界物聯化(instrument-ed)以及互連化(inter-connected)的關系,讓全世界的資料在任何領域都以非??斓乃俣仍诶鄯e,而且累積的速度遠遠超過現在所有企業所能處理的速度。由于資料累積的量和速度都是前所未見,而且其中的確蘊含寶貴的信息金礦,因此在科學研究或是其他各種領域,大家都轉而以資料分析來為科學研究或是企業組織提供發展方向、尋求突破?!辟Y料的全面分析,給我們所想要了解的事物一個全貌的解釋。
當然,“通過數據了解某個人或者技術或者事物”,這樣的想法還不能驅使微軟、IBM、高盛等等這樣的全球領銜的以商業至上的企業大肆為其搖旗吶喊。他們真正感興趣的,是大數據時代下,依托云計算的計算機通過解析人/技術/事物的過去和現在的特質,所能實現的對未來的“預測功能”。比如谷歌公司根據用戶數據分析,成功預測四項奧斯卡大獎。僅僅擁有單一數據渠道來源(也就是只有本公司的)的百度、谷歌、基金公司、Twitter等通過數據已經實現了震撼我們的預測,那么當我們努力實現讓所有類型的數據都整合在一起,交給計算機,他將帶來多大的小宇宙力量!那么關于人類的國家資源調配、商業活動趨勢、自然災害預測……所有問題雖然不能在短時間內完全掌握,但是可以確保的是,他一定能優化現有所有的資源,協助解決一切我們想解決的問題。背后蘊藏的,是無限的可能,不論是政治、文化、還是商業。這就是為什么一呼百應,所有企業都在呼吁的原因。數據,代表了信心,給了我們想要理解但不了解事物的信心。
我們該怎么用大數據?
大數據應用雖然前景誘人,但絕非想做就能做得了的。首先我們需要采集龐大的數據量(采集技術),然后考慮放在哪(存儲技術)、怎么放才好拿(分布和架構技術)、放好后怎么讓計算機去處理(自然語言轉換技術和數據處理技術)、處理完怎么歸類(統計分析),然后發現這些數據是否足夠用于預測,是否需要更多數據或者轉換數據(數據挖掘技術),接著還要看是否能變成可預測或可掌控的模型(模型預測技術),最后還要讓人看得懂和會用(結果呈現技術,如圖表和云計算等)。以上八個環節哪怕任一環節是難以憑一人之力去完成的。在龐大的數據面前個人的智慧如此渺小,如同讓螞蟻去了解何為“恒河沙數”一般。這需要巨大的智慧聚合,需要先進的技術、人才和高度的統籌安排,做到這一切實在不容易,簡單來說,我們人類僅僅是站在如前所述的“第四階段”的入口而已。
欣喜的是,我們在這個初始階段也看到了許多成功應用的例子。在我們所熟悉的能源系統,智能電網現在歐洲已經做到了終端,也就是所謂的智能電表。在德國,為了鼓勵利用太陽能,會在家庭安裝太陽能,除了賣電給你,當你的太陽能有多余電的時候還可以買回來。通過電網每隔五分鐘或十分鐘收集一次數據,收集來的這些數據可以用來預測客戶的用電習慣等,從而推斷出在未來2~3個月時間里,整個電網大概需要多少電。有了這個預測后,就可以向發電或者供電企業購買一定數量的電。因為電有點像期貨一樣,如果提前買就會比較便宜,買現貨就比較貴。通過這個預測后,可以降低采購成本。維斯塔斯風力系統,依靠的是BigInsights軟件和IBM超級計算機,然后對氣象數據進行分析,找出安裝風力渦輪機和整個風電場最佳的地點。利用大數據,以往需要數周的分析工作,現在僅需要不足1小時便可完成。
在醫療行業,在加拿大多倫多的一家醫院,針對早產嬰兒,每秒鐘有超過3000次的數據讀取。通過這些數據分析,醫院能夠提前知道哪些早產兒出現問題并且有針對性地采取措施,避免早產嬰兒夭折。此外,它讓更多的創業者更方便地開發產品,比如通過社交網絡來收集數據的健康類App。也許未來數年后,它們搜集的數據能讓醫生給你的診斷變得更為精確,比方說不是通用的成人每日三次一次一片,而是檢測到你的血液中藥劑已經代謝完成會自動提醒你再次服藥。
在通訊行業,NTTdocomo把手機位置信息和互聯網上的信息結合起來,為顧客提供附近的餐飲店信息,接近末班車時間時,提供末班車信息服務。當然這一點,國內許多數據量足夠大的App也能做到。
此外大數據應用目前在零售業、網絡服務業這幾個行業也有比較頻繁的應用,但相對其應有的繁榮,目前確實還是在起步階段,但這個趨勢是不可逆轉的。大數據給整個人類打開了想象力和理解力的新大門,而且將永不停止。