到底要用多少個“V”來描述大數據呢?2001年的一份研究報告顯示,大數據有三維屬性:容量(volume)、速度(volocity)以及類型(variety)。在此之后,人們又添加了新的屬性,即精確性(veracity),缺乏精確性的數據毫無意義與價值性(例如數據的價值隨時間推移呈下行趨勢)。然而,盡管供應商們嘗試各種手段在這熱門潮流中撈金,關于大數據的定義卻仍然模糊。所以,我們不妨再給它一條“V”描述,也就是“Vague”。
盡管有關大數據的炒作不斷,其真實性卻是不可置疑的。像開源軟件Apache Hadoop分布式文件系統(tǒng)越來越為人們接受。據Hadoop數據分析公司Karmasphere的調查,26%機構已經開始使用它,還有45%的機構正在認真考慮。另一項由Tachaisle在市場中端企業(yè)間進行的調查發(fā)現,18%的機構正投資大數據,還有25%的機構正計劃投資。預計對于大數據的年投入將于2016年超過36億美元,這僅僅是來自中端企業(yè)的數據。
不管真實與否,不可否認的是已經有部分公司認為大數據能成為數據分析有效的、低成本的
解決方案。正如數據整合公司Informatica的首席執(zhí)行官Sohaib Abbasi所言,許多大數據公司“正在大力宣傳他們自己的技術”。
業(yè)內人士指出,從分析師的角度看世界,你發(fā)現世界很復雜?,F在我們有6種分析方法從傳統(tǒng)的數據倉庫中獲取數據;或從專用分析數據庫獲取數據,如MC Pivotal,Greenplum;或從內存數據庫,如SAP HANA獲取數據;或從Hadoop獲取數據,這是目前最熱門的數據技術。此外,還可以從云網得到服務。每一個供應商都在竭力宣傳自己的優(yōu)勢,讓人們相信他們能夠勝任所有任務。
需要明確的是數據分析僅僅是大數據項目中的一部分。若要在Hadoop中分析數據,必須將數據載入Hadoop中。若要讓那些數據與生產數據同步,又必須將數據從Hadoop中轉移到另一個系統(tǒng)。忽視了這一關鍵點,對于任何企業(yè)而言都是極不明智的。
未來,人們希望集成來自多渠道的數據,并希望在不同的系統(tǒng)中對這些數據進行分析。過去,我們稱這種做法為ETL——即抽取、轉換與加載。預計在不久的將來,BDI(大數據集成)將成為大數據領域中的新興熱點。
河南億恩科技股份有限公司(www.allwellnessguide.com)始創(chuàng)于2000年,專注服務器托管租用,是國家工信部認定的綜合電信服務運營商。億恩為近五十萬的用戶提供服務器托管、服務器租用、機柜租用、云服務器、網站建設、網站托管等網絡基礎服務,另有網總管、名片俠網絡推廣服務,使得客戶不斷的獲得更大的收益。
服務器/云主機 24小時售后服務電話:
0371-60135900
虛擬主機/智能建站 24小時售后服務電話:
0371-55621053
網絡版權侵權舉報電話:
0371-60135995
服務熱線:
0371-60135900