文章內(nèi)容

扼殺IIS服務(wù)器性能的十條規(guī)則

發(fā)布時間: 2012/8/9 15:28:03

下面的每一條戒律都將有效地影響代碼的性能和可伸縮性。換句話說，盡可能不要照著戒律去做!下面，我將解釋如何破壞他們以便提高性能和可伸縮性。

1、應(yīng)該分配和釋放多個對象

你應(yīng)該盡量避免過量分配內(nèi)存，因為內(nèi)存分配可能是代價高昂的。釋放內(nèi)存塊可能更昂貴，因為大多數(shù)分配算符總是企圖連接臨近的已釋放的內(nèi)存塊成為更大的塊。直到Windows NT? 4.0 service pack 4.0，在多線程處理中，系統(tǒng)堆通常都運行得很糟。堆被一個全局鎖保護，并且在多處理器系統(tǒng)上是不可擴展的。

2.不應(yīng)該考慮使用處理器高速緩存

大多數(shù)人都知道由虛擬內(nèi)存子系統(tǒng)導(dǎo)致的hard 頁錯誤代價很高，最好避免。但是許多人認為其他內(nèi)存訪問方法沒有什么區(qū)別。自從80486以后，這一觀點就不對了�，F(xiàn)代的CPUs比RAM要快得多，RAM至少需要兩級內(nèi)存緩存，高速L1 緩存能保存8KB數(shù)據(jù)和8KB指令，而較慢的L2 緩存能保存幾百KB的數(shù)據(jù)和代碼，這些數(shù)據(jù)和代碼混合在一起。L1 緩存中內(nèi)存區(qū)域的一個引用需要一個時鐘周期，L2 緩存的引用需要4到7個時鐘周期，而主內(nèi)存的引用需要許多個處理器時鐘周期。后一數(shù)字不久將會超過100個時鐘周期。在許多方面，緩存像一個小型的，高速的，虛擬內(nèi)存系統(tǒng)。

至于和緩存有關(guān)的基本內(nèi)存單元不是字節(jié)而是緩存列。Pentium 緩存列有32個字節(jié)寬。Alpha 緩存列有64個字節(jié)寬。這意味著在L1 緩存中只有512個slot給代碼和數(shù)據(jù)。如果多個數(shù)據(jù)一起使用（時間位置）而并不存儲在一起（空間位置），性能會很差。數(shù)組的空間位置很好，而相互連接的列表和其他基于指針的數(shù)據(jù)結(jié)構(gòu)的位置往往很差。

把數(shù)據(jù)打包到同一個緩存列中通常會有利于提高性能，但是它也會破壞多處理器系統(tǒng)的性能。內(nèi)存子系統(tǒng)很難協(xié)調(diào)處理器間的緩存。如果一個被所有處理器使用的只讀數(shù)據(jù)，和一個由一個處理器使用并頻繁更新的數(shù)據(jù)共享一個緩存列，那么緩存將會花費很長時間更新這個緩存列的拷貝。這個Ping-Pong高速游戲通常被稱為"緩存 sloshing"。如果只讀數(shù)據(jù)在一個不同的緩存列中，就可以避免sloshing。

對代碼進行空間優(yōu)化比進行速度優(yōu)化效率更高。代碼越少，代碼所占的頁也越少，這樣需要的運行設(shè)置和產(chǎn)生的頁錯誤也會更少，同時占據(jù)的緩存列也會更少。然而，某些核心函數(shù)應(yīng)該進行速度優(yōu)化。可以利用profiler去識別這些函數(shù)。

3.決不要緩存頻繁使用的數(shù)據(jù)。

軟件緩存可以被各種應(yīng)用程序使用。當(dāng)一個計算代價很高時，你會保存結(jié)果的一個拷貝。這是一個典型的時空折中方法：犧牲一些存儲空間以節(jié)省時間。如果做得好，這種方法可能非常有效。

你必須正確地進行緩存。如果緩存了錯誤數(shù)據(jù)，就會浪費存儲空間。如果緩存得太多，其他操作可以使用的內(nèi)存將會很少。如果緩存得太少，效率又會很低，因為你必須重新計算被緩存遺漏的數(shù)據(jù)。如果將時間敏感數(shù)據(jù)緩存得時間過長，這些數(shù)據(jù)將會過時。一般，服務(wù)器更關(guān)心的是速度而不是空間，所以他們要比桌面系統(tǒng)進行更多的緩存。一定要定期去除不用的緩存，否則將會有運行設(shè)置問題。

4.應(yīng)該創(chuàng)建多個線程，越多越好。

調(diào)整服務(wù)器中起作用的線程數(shù)目是很重要的。如果線程是I/O-bound的，將會花費很多時間用來等待I/O的完成-一個被阻塞的線程就是一個不做任何有用工作的線程。加入額外的線程可以增加通量，但是加入過多的線程將會降低服務(wù)器的性能，因為上下文交換將會成為一個重大的overhead。上下文交換速度應(yīng)該低的原因有三個：上下文交換是單純的overhead，對應(yīng)用程序的工作沒有任何益處；上下文交換用盡了寶貴的時鐘周期；最糟的是，上下文交換將處理器的緩存填滿了沒用的數(shù)據(jù)，替換這些數(shù)據(jù)是代價高昂的。

有很多事情是依靠你的線程化結(jié)構(gòu)的。每個客戶端一個線程是絕對不合適的。因為對于大量用戶端，它的擴展性不好。上下文交換變得難以忍受，Windows NT用盡了資源。線程池模型會工作得更好，在這種方法中一個工人線程池將處理一條請求列，因為Windows 2000提供了相應(yīng)的APIs，如QueueUserWorkItem。

5.應(yīng)該對數(shù)據(jù)結(jié)構(gòu)使用全局鎖

使數(shù)據(jù)線程安全的最簡單方法是把它套上一把大鎖。為簡單起見，所有的東西都用同一把鎖。這種方法會有一個問題：序列化。為了得到鎖，每一個要處理數(shù)據(jù)的線程都必須排隊等候。如果線程被一把鎖阻塞，它沒有在做任何有用的事。當(dāng)服務(wù)器的負載較輕時，這個問題并不常見，因為一次可能只有一個線程需要鎖。在負載很重的情況下，對鎖的激烈爭奪可能就會成為一個大問題。

設(shè)想在多車道高速公路上發(fā)生了一個意外事故，這條高速公路上的所有車輛都被轉(zhuǎn)向一條狹窄的道路。如果車輛很少，這一轉(zhuǎn)換對交通流的速率的影響可以忽略。如果車輛很多，當(dāng)車輛慢慢并入那條單通道時，交通阻塞會延伸幾英里。

有幾種技術(shù)能夠減少鎖競爭。

· 不要過分保護，也就是說，不是非常必要不要鎖住數(shù)據(jù)。只有需要時才去持有鎖，而且時間不要過長。不要在大段代碼周圍或頻繁執(zhí)行的代碼中沒必要地使用鎖，這一點很重要。

· 對數(shù)據(jù)進行分割，使它能夠用一套獨立的鎖保護。例如，一個符號表可以按標(biāo)識符的第一個字母分割，這樣在修改名字以Q開頭的符號的值時，就不會去讀名字以H開頭的符號的值。

· 使用APIs的Interlocked 系列（InterlockedIncrement，InterlockedCompareExchangePointer等）自動修改數(shù)據(jù)而不需要鎖。

· 當(dāng)數(shù)據(jù)不是經(jīng)常被修改時可以使用多讀者/單作者（multi-reader/single-writer）鎖。你將獲得更好的并發(fā)性，盡管鎖操作的代價將更高并且你可能會冒餓死作者的危險。

· 在關(guān)鍵部分使用循環(huán)計數(shù)器。參見Windows NT 4.0 service pack 3中的SetCriticalSectionSpinCount API。

· 如果你不能得到鎖，使用TryEnterCriticalSection并做一些其他的有用的工作。

高競爭導(dǎo)致serialization，serialization導(dǎo)致降低CPU的利用率，這促使用戶加入更多的線程，結(jié)果事情變得更糟。
6.不必注意多處理器機器

你的代碼在多處理器系統(tǒng)上比在單處理器系統(tǒng)上運行得還要糟，這可能是件令人惡心的事。一個很自然的想法是，在一個N維系統(tǒng)上運行N次會更好。性能很差的原因是競爭：鎖競爭，總線競爭，和/或緩存列競爭。處理器都在是爭奪共享資源的所有權(quán)，而不是做更多的工作。

如果你一定要編寫多線程應(yīng)用程序的話，你應(yīng)該在多處理器盒上對你的應(yīng)用程序進行強度測試和性能測試。單處理器系統(tǒng)通過時間分片地執(zhí)行線程而提供一個并發(fā)性的假象。多處理器盒具有真正的并發(fā)性，競爭環(huán)境和競爭更容易發(fā)生。

7.應(yīng)該始終使用模塊化調(diào)用；他們很有趣。

利用同步模塊化調(diào)用來執(zhí)行I/O操作對大多數(shù)桌面應(yīng)用程序來說是合適的。但是，他們不是使用服務(wù)器上的CPU（s）的好方法。I/O操作要花費上百萬個時鐘周期來完成，這些時鐘周期本來可以被更好地利用。利用異步I/O你能得到顯著提高的用戶請求率和I/O通量，不過增加了額外的復(fù)雜性。

如果你有需要花費很長時間的模塊化調(diào)用或I/O操作，你應(yīng)該考調(diào)撥多少資源給他們。你想使用所有的線程還是有個限制？一般地，使用有限的幾個線程要好些。構(gòu)建一個小的線程池和隊列，利用隊列來安排線程的工作完成模塊化調(diào)用。這樣，其他線程就可以拾取和處理你的非模塊化的請求。

8.不要進行測量

當(dāng)你能夠測量你所談?wù)摰氖虑椴⒂脭?shù)字表達它時，這就表示你對他有了一定的了解；但是如果你不能用數(shù)字表達時，你的知識是貧瘠的不能令人滿意的；這可能是知識的開始，但這時你簡直不可能將你的思想提高到科學(xué)的水平。

- Lord Kelvin (William Thomson)

如果不測量你就不能了解應(yīng)用程序的特性。你在黑暗中摸索，一半是靠猜測。如果不識別性能問題，你就不能做任何改進或做出工作量計劃。

測量包括黑匣子測量和profiling。黑匣子測量的意思是收集由性能計數(shù)器（內(nèi)存使用，上下文交換，CPU利用等）和外部檢測工具（通量，反映時間等）所顯示的數(shù)據(jù)。為了profile你的代碼，你編譯代碼的一個工具版，然后在各種條件下運行它，并收集關(guān)于執(zhí)行時間和過程調(diào)用頻率的統(tǒng)計數(shù)據(jù)。

測量如果不用于分析的話就一點用都沒有。測量將不僅告訴你有問題，而且甚至能幫助你找到問題發(fā)生在哪，但它不能告訴你為什么會有問題。對問題進行分析以便你能正確地改正他們。要從根本上解決問題而不是停留在表面現(xiàn)象。

本文出自：億恩科技【www.allwellnessguide.com】

服務(wù)器租用/服務(wù)器托管中國五強！虛擬主機域名注冊頂級提供商！15年品質(zhì)保障！--億恩科技[ENKJ.COM]