網(wǎng)站數(shù)據(jù)分析:多維交叉分析(一) |
發(fā)布時(shí)間: 2012/8/17 9:33:42 |
我們?cè)谶M(jìn)行數(shù)據(jù)分析的時(shí)候,大部分時(shí)間都在使用趨勢(shì)分析、比較分析、細(xì)分分析這三類方法,但其實(shí)還有一個(gè)方法我們也會(huì)經(jīng)常使用——交叉分析,尤其是在排查數(shù)據(jù)異常的問(wèn)題時(shí),交叉分析就能展現(xiàn)其強(qiáng)大的威力。另外要跟大家說(shuō)聲抱歉的是博客的更新頻率可能沒(méi)有那么頻繁了,但是盡量每個(gè)月至少能發(fā)布一篇,希望文章的質(zhì)量有所保證,還是歡迎大家留言討論,能夠發(fā)起一些有趣的話題,一起拓展在網(wǎng)站數(shù)據(jù)分析方面的思路。
什么是交叉分析? 交叉分析是指對(duì)數(shù)據(jù)在不同維度進(jìn)行交叉展現(xiàn),進(jìn)行多角度結(jié)合分析的方法,彌補(bǔ)了獨(dú)立維度進(jìn)行分析沒(méi)法發(fā)現(xiàn)的一些問(wèn)題。 交叉分析以多維模型和數(shù)據(jù)立方為基礎(chǔ),也可以認(rèn)為是一種特殊的細(xì)分方式,但跟細(xì)分的概念有點(diǎn)差異。細(xì)分的方法更多的是基于同一維度的縱深展開,也就是OLAP中的鉆。―rill-down),比如從月匯總的數(shù)據(jù)細(xì)分來(lái)看每天的數(shù)據(jù),就是在時(shí)間維度上的細(xì)分,或者從省份的數(shù)據(jù)細(xì)分查看省份中各城市的數(shù)據(jù),是基于地域維的下鉆。交叉分析不再局限于一個(gè)維度,就像數(shù)據(jù)立方體與OLAP文章中的立方體,是基于不同維度的交叉,時(shí)間維、地域維和產(chǎn)品維交叉在一起分析每個(gè)小立方的數(shù)據(jù)表現(xiàn),可以通過(guò)OLAP的切片(Slice)和切塊(Dice)操作查看例如上海市在3月份的電子產(chǎn)品的銷售情況,這會(huì)幫助我們發(fā)現(xiàn)很多在單個(gè)維度中無(wú)法發(fā)現(xiàn)的問(wèn)題。所以,交叉分析是基于不同維度橫向地組合交叉,而不是細(xì)分在同一維度的縱向展開。 交叉分析的展現(xiàn)形式 交叉分析涉及多維度的組合,雖然圖表和表格都可以進(jìn)行展現(xiàn),但因?yàn)閳D表所能表達(dá)的數(shù)據(jù)有限,且比較不容易把多個(gè)維度的交叉關(guān)系展現(xiàn)出來(lái),在交叉分析中不太常用,通常以表格為主。我們平常在看的表格通常被叫做二維表,一般第一列放置一個(gè)維度,如日期,表頭羅列各類指標(biāo)(其實(shí)所有指標(biāo)也可以被認(rèn)為是一種特殊的維度——指標(biāo)維),這樣行列的兩個(gè)維就組成了最常見的二維表。二維表可以進(jìn)行擴(kuò)展,進(jìn)而展現(xiàn)更加豐富的維度: 如上圖就是典型的基于表格的多維度交叉分析的布局,在行列中分層次放置多個(gè)維度,如果我們只顯示一個(gè)指標(biāo),那么這里的指標(biāo)維就沒(méi)有顯示的必要了。其實(shí)Excel的數(shù)據(jù)透視表(Pivot Table)就是交叉分析的利器,我在數(shù)據(jù)的報(bào)表和報(bào)告這篇文章中提到過(guò)數(shù)據(jù)透視表,這里還是基于那篇文章截圖的原始數(shù)據(jù),如果我們將各維度按照上面的布局形式進(jìn)行展現(xiàn)的話,會(huì)是怎么樣的效果: 看起來(lái)還不錯(cuò),顯示的信息非常豐富,左邊包含了以天為單位時(shí)間維和產(chǎn)品維,可以使用展開按鈕進(jìn)行匯總和展開,就像是細(xì)分的操作;上面的表頭部分分兩層羅列了地域維和指標(biāo)維,Excel的透視表提供了豐富的設(shè)置,默認(rèn)展現(xiàn)基于各個(gè)維度的匯總數(shù)據(jù),讓我們可以從“總-分”的角度觀察數(shù)據(jù),這對(duì)數(shù)據(jù)分析非常有用。假如我們使用上面的透視表進(jìn)行交叉分析發(fā)現(xiàn)數(shù)據(jù)是否存在異常? 使用從總體到細(xì)節(jié)的分析方法,首先可以從查看每天銷售額和轉(zhuǎn)化率的匯總數(shù)據(jù)開始,折疊產(chǎn)品維之后觀察最右側(cè)的指標(biāo)匯總列就可以看到每日匯總數(shù)據(jù);如果某一天的銷售額或轉(zhuǎn)化率出現(xiàn)了大幅的下滑,我們就可以結(jié)合各種維度尋找問(wèn)題的原因,就是基于各種維度的細(xì)節(jié)數(shù)據(jù),展開產(chǎn)品維觀察當(dāng)天的哪類產(chǎn)品銷售出現(xiàn)了問(wèn)題,然后結(jié)合地域維的交叉數(shù)據(jù),可以定位哪類商品在哪個(gè)省份的銷售出現(xiàn)了問(wèn)題,這樣就有效地將問(wèn)題定位到了細(xì)節(jié)的層面,能夠更好地發(fā)現(xiàn)問(wèn)題,進(jìn)而解決問(wèn)題。所以交叉分析其實(shí)正是體現(xiàn)了分析“分而析之”的本意。 上面的方法一般是比較常用的基于問(wèn)題的分析方法,但我們很少可以一次就定位到問(wèn)題,往往我們會(huì)根據(jù)推測(cè)多次查詢數(shù)據(jù)庫(kù)或查看Dashboard上的各類報(bào)表來(lái)定位問(wèn)題。而結(jié)合透視表的交叉分析,我們使用一張報(bào)表就快速地定位了問(wèn)題所在,從總體到細(xì)節(jié),邏輯非常清晰,問(wèn)題的定位也非常準(zhǔn)確和到位,所以合理地利用交叉分析可以幫助我們更加高效地排查問(wèn)題。 本文出自:億恩科技【www.allwellnessguide.com】 服務(wù)器租用/服務(wù)器托管中國(guó)五強(qiáng)!虛擬主機(jī)域名注冊(cè)頂級(jí)提供商!15年品質(zhì)保障!--億恩科技[ENKJ.COM] |