亚洲Aⅴ无码Av红楼在线观看_国产午夜福利涩爱AⅤ_国产sm调教一区二区三区_精品人妻一区二区三区不卡毛片

始創(chuàng)于2000年 股票代碼:831685
咨詢熱線:0371-60135900 注冊(cè)有禮 登錄
  • 掛牌上市企業(yè)
  • 60秒人工響應(yīng)
  • 99.99%連通率
  • 7*24h人工
  • 故障100倍補(bǔ)償
全部產(chǎn)品
您的位置: 網(wǎng)站首頁(yè) > 幫助中心>文章內(nèi)容

網(wǎng)站數(shù)據(jù)分析:多維交叉分析(二)

發(fā)布時(shí)間:  2012/8/17 9:37:12
 

交叉分析的基礎(chǔ)

這里不得不再說(shuō)一下交叉分析基于的底層基礎(chǔ)數(shù)據(jù)模型,因?yàn)槿绻麤]有設(shè)計(jì)好底層的數(shù)據(jù)模型,上層的交叉分析是很難實(shí)現(xiàn)的,或者多維的交叉受到限制而使分析存在局限性。

從技術(shù)層面來(lái)看,交叉分析基于多維模型,數(shù)據(jù)的維度越豐富,所能實(shí)現(xiàn)的交叉也越豐富和靈活,通過各種交叉分析能夠更加有效地發(fā)現(xiàn)問題;但相應(yīng)的,如果要盡可能地豐富各維度的交叉分析,對(duì)基層模型的要求也就越高。所以如何設(shè)計(jì)好數(shù)據(jù)的底層模型非常關(guān)鍵,還是引用數(shù)據(jù)立方體與OLAP文中的那個(gè)數(shù)據(jù)立方看個(gè)簡(jiǎn)單的例子:

data-cube

如果一張網(wǎng)站分析的報(bào)表只包含以月度為單位的日期維和相應(yīng)的指標(biāo),那么數(shù)據(jù)的存儲(chǔ)就是每個(gè)月一條記錄,但顯然這種高度聚合的數(shù)據(jù)不利于分析,我們需要構(gòu)建如上圖的數(shù)據(jù)立方體來(lái)獲取更加細(xì)節(jié)的數(shù)據(jù)。用數(shù)據(jù)立方來(lái)拓展數(shù)據(jù)細(xì)節(jié)有兩種方向,一類是縱深拓展,也就是基于一個(gè)維度的細(xì)分,比如將一個(gè)月細(xì)分到每一天,那么一條記錄將會(huì)被拓展成30條;還有一種是橫向的拓展,就是多個(gè)維度的交叉,就像上面立方中添加了產(chǎn)品維和地域維。這樣存儲(chǔ)的數(shù)據(jù)就從原本單一的時(shí)間維度擴(kuò)展成了時(shí)間、產(chǎn)品和地域三個(gè)維度,也就是三維立方體所能展現(xiàn)的形式,當(dāng)然維度可以繼續(xù)擴(kuò)展,四個(gè)五個(gè)直到N個(gè),理論上都是可行的,這里只要以三個(gè)維度進(jìn)行舉例就可以。對(duì)于數(shù)據(jù)存儲(chǔ)而言,橫向的拓展與縱深拓展的影響是一樣的,記錄數(shù)都是以倍乘的方式增長(zhǎng),假設(shè)這里產(chǎn)品維是產(chǎn)品大類,有20個(gè)產(chǎn)品大類,再加上32個(gè)省份或直轄市,那么經(jīng)過縱深和橫向拓展之后,原先每月的1條記錄就變成了:

1 × 30 × 20 × 32 = 19200

而我們?cè)跇?gòu)建多維模型的時(shí)候很多維度中包含的數(shù)據(jù)量絕對(duì)不像上面例舉的那么小,想象一下網(wǎng)站的商品或者頁(yè)面的數(shù)量可能是成百上千甚至成千上萬(wàn)的,那么一旦以倍乘的形式擴(kuò)展之后,數(shù)據(jù)量就會(huì)一下子劇增。雖然豐富的多維立方能夠給分析帶來(lái)便利,但也同時(shí)給數(shù)據(jù)的存儲(chǔ)和查詢帶來(lái)的壓力。

所以,更加豐富和靈活的分析需求的實(shí)現(xiàn)基于更加復(fù)雜的多維模型或者數(shù)據(jù)立方,同時(shí)會(huì)帶來(lái)更大的系統(tǒng)開銷。Google Analytics很好地權(quán)衡了靈活的數(shù)據(jù)分析與復(fù)雜數(shù)據(jù)模型之間的關(guān)系,這也是Google Analytics強(qiáng)大功能的基本保障,GA的高級(jí)細(xì)分(Advanced Segments)和自定義Dashboard是其他同類免費(fèi)網(wǎng)站分析工具所無(wú)法比擬的,這也正是為什么我們將GA劃分到網(wǎng)站數(shù)據(jù)分析工具,而其他的大部分只能算作網(wǎng)站數(shù)據(jù)統(tǒng)計(jì)工具的原因。而GA正是基于其構(gòu)建的強(qiáng)大的底層數(shù)據(jù)模型和高效的數(shù)據(jù)計(jì)算和響應(yīng)能力,使很多分析功能可以得到擴(kuò)展,其中很多就涉及交叉分析,這里截圖了其中的兩個(gè)功能,Secondary Dimension和Pivot:

GA-secondary-dimension

Google Analytics新版本增加了很多令人心動(dòng)的功能,Secondary dimension的功能從老版本得到了延續(xù),上圖在Content模塊的Page報(bào)表中選擇了流量來(lái)源作為第二維度,這樣我們就可以查看每個(gè)頁(yè)面的流量是從何而來(lái),每個(gè)流量來(lái)源在該頁(yè)面的數(shù)據(jù)表現(xiàn),同時(shí)可能還可以發(fā)現(xiàn)一些有趣的現(xiàn)象,比如某些頁(yè)面的流量基本都是一個(gè)來(lái)源帶來(lái)的,比如我的博客的某些文章基本都是通過搜索引擎進(jìn)來(lái)的,而另外一些文章基本通過直接流量帶來(lái)。

在GA的各類報(bào)表中可以在右上角選擇展現(xiàn)的形式,最后的一種就是Pivot,Pivot的形式對(duì)表格的表頭進(jìn)行了擴(kuò)展,可以分層次放置另外的維度,如上圖還是使用了頁(yè)面與流量來(lái)源的交叉,將Source維度放到了指標(biāo)的上方。同時(shí)GA支持在兩個(gè)維度的基礎(chǔ)上最多選擇兩個(gè)度量Metric,我這里選擇了Pageviews和Bounce Rate,來(lái)衡量每個(gè)頁(yè)面中各類流量來(lái)源所帶來(lái)的“量”和“質(zhì)”,同樣對(duì)于分析非常有價(jià)值。

多維的交叉分析我們?cè)谌粘V袧撘颇亟?jīng)常會(huì)用到,交叉分析對(duì)于問題的排查和定位額外有效,所以我們需要想辦法用更好的形式去展現(xiàn)數(shù)據(jù),以便于更有利于進(jìn)行交叉分析,其實(shí)這里介紹的透視表的方式是最常用的,也是比較好用的,但這類方式太少,不知道大家有沒有其他更加有效的交叉分析展現(xiàn)方式。


本文出自:億恩科技【www.allwellnessguide.com】

服務(wù)器租用/服務(wù)器托管中國(guó)五強(qiáng)!虛擬主機(jī)域名注冊(cè)頂級(jí)提供商!15年品質(zhì)保障!--億恩科技[ENKJ.COM]

  • 您可能在找
  • 億恩北京公司:
  • 經(jīng)營(yíng)性ICP/ISP證:京B2-20150015
  • 億恩鄭州公司:
  • 經(jīng)營(yíng)性ICP/ISP/IDC證:豫B1.B2-20060070
  • 億恩南昌公司:
  • 經(jīng)營(yíng)性ICP/ISP證:贛B2-20080012
  • 服務(wù)器/云主機(jī) 24小時(shí)售后服務(wù)電話:0371-60135900
  • 虛擬主機(jī)/智能建站 24小時(shí)售后服務(wù)電話:0371-60135900
  • 專注服務(wù)器托管17年
    掃掃關(guān)注-微信公眾號(hào)
    0371-60135900
    Copyright© 1999-2019 ENKJ All Rights Reserved 億恩科技 版權(quán)所有  地址:鄭州市高新區(qū)翠竹街1號(hào)總部企業(yè)基地億恩大廈  法律顧問:河南亞太人律師事務(wù)所郝建鋒、杜慧月律師   京公網(wǎng)安備41019702002023號(hào)
      0
     
     
     
     

    0371-60135900
    7*24小時(shí)客服服務(wù)熱線