關(guān)于大數(shù)據(jù):您如何理解它? |
發(fā)布時(shí)間: 2012/9/13 19:23:59 |
關(guān)于大數(shù)據(jù):您如何理解它?“大數(shù)據(jù)”技術(shù),據(jù)稱是對(duì)數(shù)據(jù)中心的所謂重塑。當(dāng)然,數(shù)據(jù)中心不會(huì)像iPad的這樣的主題那么有趣,但是,如果沒有數(shù)據(jù)中心提供云服務(wù)等應(yīng)用程序,ipad也必將失去很多樂趣。大數(shù)據(jù)也是一種新興的和不斷增長(zhǎng)的行業(yè)的中堅(jiān)力量,其可以說(shuō)是為計(jì)算業(yè)務(wù)的終端注入了急需的腎上腺素。它是非常重要的。今年3月,美國(guó)奧巴馬總統(tǒng)通過了聯(lián)邦政府價(jià)值2億美元的大數(shù)據(jù)項(xiàng)目的財(cái)政預(yù)算案。但到底什么是大數(shù)據(jù)呢? 數(shù)百萬(wàn)納稅人的稅金支持、耗資數(shù)十億美元的資本投資和運(yùn)營(yíng)支出、平面媒體網(wǎng)絡(luò)媒體整天轟炸似的討論。一切都在吸引著我們來(lái)好好探討一下究竟大數(shù)據(jù)實(shí)際上是什么。但大量新的證據(jù),其中包括RWW的布瑞恩?普羅菲特上周的甲骨文研究報(bào)告、同樣還有沙倫費(fèi)希爾上周發(fā)布的凱捷調(diào)查,以及有受SAP委托進(jìn)行的哈里斯互動(dòng)調(diào)查,所有這一切都為我們揭示了一個(gè)令人不安的趨勢(shì):無(wú)論是企業(yè)還是政府部門都在向他們所認(rèn)為的任何與大數(shù)據(jù)相關(guān)的領(lǐng)域砸錢。而如何定義這些與大數(shù)據(jù)相關(guān)的領(lǐng)域,則可能取決于誰(shuí)是他們的供應(yīng)商,誰(shuí)在向他們兜售這些營(yíng)銷概念,以及他們多久之后才開始意識(shí)到問題,并開始調(diào)查此事。 那些即使已經(jīng)在大數(shù)據(jù)方面進(jìn)行大規(guī)模投資的企業(yè)也表示,他們投資于大數(shù)據(jù)部分原因其實(shí)是因?yàn)榇髷?shù)據(jù)概念的營(yíng)銷,而真正對(duì)于大數(shù)據(jù)其實(shí)則可能是相對(duì)缺乏理解的。到今天為止,網(wǎng)絡(luò)媒體對(duì)于何謂大數(shù)據(jù)的解釋工作其實(shí)做點(diǎn)很不好。正如SAP業(yè)務(wù)分析執(zhí)行副總裁史蒂夫?盧卡斯所說(shuō):“事實(shí)上,當(dāng)我看到這些調(diào)查結(jié)果,我所想到的第一句話就是,哇。我們連一個(gè)關(guān)于何為大數(shù)據(jù)的準(zhǔn)確的定義都還沒有。這還真是一個(gè)大問題!” 5億美元的金字塔 問題是,現(xiàn)在許多公司都面臨著傳統(tǒng)數(shù)據(jù)庫(kù)的進(jìn)化道路,尤其是現(xiàn)在成千上萬(wàn)的用戶同時(shí)通過移動(dòng)設(shè)備應(yīng)用程序進(jìn)行訪問已成為一項(xiàng)任務(wù)。Hadoop框架興起于雅虎的一個(gè)開源項(xiàng)目,目前已經(jīng)成為其自身的商業(yè)行業(yè),提出了可行的解決方案。但是,大數(shù)據(jù)對(duì)于那些已經(jīng)有數(shù)據(jù)中心的客戶來(lái)說(shuō)相當(dāng)難以理解,難怪調(diào)查發(fā)現(xiàn),企業(yè)的大數(shù)據(jù)戰(zhàn)略各個(gè)方向,五花八門。 “我從調(diào)查結(jié)果的有關(guān)統(tǒng)計(jì)中發(fā)現(xiàn)了一個(gè)相當(dāng)令人驚訝的結(jié)果是,18%的年收入低于5億美元的中小企業(yè)均認(rèn)為大數(shù)據(jù)是由社交網(wǎng)絡(luò)和機(jī)器產(chǎn)生的。”盧卡斯繼續(xù)說(shuō)道。“規(guī)模較小的公司正在從他們當(dāng)前的網(wǎng)絡(luò)處理大量的交易,而移動(dòng)設(shè)備的采購(gòu),向他們提出了挑戰(zhàn)。規(guī)模較大的公司有相應(yīng)的基礎(chǔ)設(shè)施和處理能力。因此,他們集中了諸如機(jī)器生成的數(shù)據(jù)、來(lái)自手機(jī)、移動(dòng)設(shè)備、傳感器,以及社交網(wǎng)絡(luò)的數(shù)據(jù)。” 倉(cāng)促的判斷 去年四月,哈里斯針對(duì)美國(guó)的154名跨國(guó)公司的企業(yè)高層管理人員進(jìn)行了一系列問題的調(diào)研,調(diào)研的問題之一便是要求這些受訪的企業(yè)高管們根據(jù)自己所在企業(yè)的戰(zhàn)略簡(jiǎn)單地定義一下“大數(shù)據(jù)”。其結(jié)果可謂五花八門。有28%的受訪者認(rèn)可“大量增長(zhǎng)的交易數(shù)據(jù)”最接近自己的理解(認(rèn)可這一概念的比例越來(lái)越大);24%的受訪者認(rèn)可“旨在解決數(shù)量、品種,和速度挑戰(zhàn)問題的新技術(shù)即為大數(shù)據(jù)”(這一概念使得數(shù)據(jù)庫(kù)系統(tǒng)變得更復(fù)雜);19%的受訪者贊同“需要存儲(chǔ)并進(jìn)行監(jiān)管的數(shù)據(jù)”的概念;18%的受訪者選擇了“爆炸的新數(shù)據(jù)來(lái)源”;11%的人選擇了“其他”。 上述所有這些定義選項(xiàng)似乎達(dá)成一個(gè)共同的主題,數(shù)據(jù)庫(kù)的發(fā)展超出了我們目前的技術(shù)能力。但是,當(dāng)這些高管們?cè)俅伪粏柕,給出一個(gè)策略來(lái)解決這一問題時(shí),結(jié)果再次變得五花八門。 當(dāng)SAP的盧卡斯進(jìn)一步對(duì)調(diào)研結(jié)果進(jìn)行探究。他發(fā)現(xiàn),以年收入5億美元為分界點(diǎn)。年?duì)I收低于該數(shù)值的公司(約占總受訪者的60%),多認(rèn)為大數(shù)據(jù)主要集中諸如Twitter這樣網(wǎng)站。年?duì)I收高于該數(shù)值的企業(yè)有可能已經(jīng)開始在處理社會(huì)網(wǎng)絡(luò)的數(shù)據(jù),而他們的問題是集中處理大量的來(lái)自新的移動(dòng)設(shè)備應(yīng)用程序的數(shù)據(jù),以及他們正在使用的用于與他們的客戶連接所產(chǎn)生的數(shù)據(jù)的問題,這些應(yīng)用程序規(guī)模較小的企業(yè)還不太熟悉。 “以5億美元年?duì)I收為臨界點(diǎn),不同的企業(yè)其基礎(chǔ)設(shè)施投資優(yōu)先次序方面的思路也很不同。”盧卡斯說(shuō)。“他們還指出,云的一個(gè)關(guān)鍵部分是其大數(shù)據(jù)策略。我們將其作為第一大優(yōu)先投資選項(xiàng)。” 那么什么是正確的答案?這里是一個(gè)對(duì)于“大數(shù)據(jù)”的解釋,我相信,適用于任何人: 鑒于數(shù)據(jù)庫(kù)技術(shù)無(wú)法擴(kuò)大規(guī)模,已成為了業(yè)務(wù)邏輯的一種阻礙。這種邏輯使用效率不高的方法來(lái)訪問和操縱數(shù)據(jù)。但這些低下的效率往往被硬件的增長(zhǎng)速度和能力,以及存儲(chǔ)的價(jià)格下降所掩蓋。當(dāng)然,這種低效直到2007年左右,都沒有人真正注意或關(guān)心。 效率低下,最終納入開放新的應(yīng)用程序時(shí),發(fā)現(xiàn)大量數(shù)據(jù)推斷的重要成果(經(jīng)常是分析的一種)的新的和實(shí)際用途。我們總是用傳統(tǒng)的數(shù)據(jù)庫(kù)系統(tǒng)的方法,不能擴(kuò)大。大數(shù)據(jù)技術(shù)的建立是為了使應(yīng)用程序可以擴(kuò)大,但更重要的一點(diǎn),其解決了過去30年來(lái)一直困擾我們的系統(tǒng)效率低下的問題。效率低下與尺寸或規(guī)模幾乎沒有關(guān)系,而是源于懶惰,我們更傾向于一拖再拖的不解決這些不愉快的細(xì)節(jié),直到他們真正成為我們的麻煩。 從本質(zhì)上講,大數(shù)據(jù)工具解決的是大量數(shù)據(jù)的存儲(chǔ)、訪問、操縱和分析的方式。他們代替了傳統(tǒng)數(shù)據(jù)庫(kù)。至少,代替了存儲(chǔ)系統(tǒng)(Hadoop),但他們也可以代替存取方法。 本文出自:億恩科技【www.allwellnessguide.com】 服務(wù)器租用/服務(wù)器托管中國(guó)五強(qiáng)!虛擬主機(jī)域名注冊(cè)頂級(jí)提供商!15年品質(zhì)保障!--億恩科技[ENKJ.COM] |