內(nèi)存技術(shù)篇 |
發(fā)布時(shí)間: 2012/7/26 16:30:53 |
如今大容量高速度的內(nèi)存技術(shù)已經(jīng)相當(dāng)成熟了,但對(duì)于服務(wù)器而言,穩(wěn)定性勝過(guò)一切,然而服務(wù)器內(nèi)存之所以能承擔(dān)服務(wù)器穩(wěn)定性的重任,其中之一的關(guān)鍵技術(shù)就是“內(nèi)存查糾錯(cuò)技術(shù)”。服務(wù)器中的內(nèi)存我們都知道一般采用帶有ECC技術(shù)的(ECC的英文全稱是“ Error Checking and Correcting”,中文名為“錯(cuò)誤檢查和糾正”),從這個(gè)名稱就可以看出它的主要功能就是“發(fā)現(xiàn)并糾正錯(cuò)誤”。ECC比以前的奇偶校正技術(shù)更先進(jìn)的方面體現(xiàn)在它不僅能發(fā)現(xiàn)錯(cuò)誤,而且能糾正這些錯(cuò)誤。但ECC技術(shù)只能糾正單比特的內(nèi)存錯(cuò)誤, 當(dāng)有多比特錯(cuò)誤發(fā)生的時(shí)候,ECC內(nèi)存會(huì)生成一個(gè)不可隱藏(non-maskable interrupt)的中斷 (NMI),系統(tǒng)會(huì)中止運(yùn)行。IBM還有一種更先進(jìn)的特殊內(nèi)存糾錯(cuò)技術(shù),那就是ChipKill內(nèi)存技術(shù)。而這些技術(shù)是如何使服務(wù)器內(nèi)存進(jìn)行錯(cuò)誤檢查并糾正呢?在下面這篇文章中將詳細(xì)為您介紹…… [技術(shù)]服務(wù)器內(nèi)存技術(shù)知識(shí)充電 看完了上面的文章后,我相信我們對(duì)服務(wù)器內(nèi)存已經(jīng)有了個(gè)大概的認(rèn)識(shí),或許你認(rèn)為內(nèi)存已經(jīng)為服務(wù)器提供了很大的保險(xiǎn)了,但面臨著一些意外的內(nèi)存錯(cuò)誤,有另外一種技術(shù)比內(nèi)存錯(cuò)誤糾正技術(shù)有效得多。IBM的內(nèi)存保護(hù)技術(shù)就是保護(hù)由于意外的內(nèi)存錯(cuò)誤而帶來(lái)的損失,它使用的是標(biāo)準(zhǔn)的ECC 168內(nèi)存。它的工作方式有點(diǎn)像在Windows NT的NTFS文件系統(tǒng)下的在線備份磁盤(pán)扇區(qū)一樣,當(dāng)操作系統(tǒng)在磁盤(pán)上檢測(cè)到壞的磁盤(pán)扇區(qū)時(shí),它將在另外的扇區(qū)中寫(xiě)下這些數(shù)據(jù)放一邊留作備用,我們可以認(rèn)為內(nèi)存保護(hù)就是提供在線備份數(shù)據(jù)位。這內(nèi)存錯(cuò)誤的糾正是通過(guò)內(nèi)存控制器來(lái)完成的,所以不會(huì)增加操作系統(tǒng)的工作量,也不需要操作系統(tǒng)來(lái)提供支持,完全與操作系統(tǒng)無(wú)關(guān)。因?yàn)檫@是在標(biāo)準(zhǔn)的ECC 168線內(nèi)存起作用的,無(wú)需為這種保護(hù)增加另外的開(kāi)支。 內(nèi)存保護(hù)(在其它系統(tǒng)中也有稱“多余的數(shù)據(jù)位”)技術(shù)最初的發(fā)展是在IBM大型機(jī)上,而且在Z系列和I系列服務(wù)器上使用了許多年。在一個(gè)2路交叉存取的內(nèi)存系統(tǒng)中,每2片168線ECC內(nèi)存包含144位,但是只有140位是用于數(shù)據(jù)存取和校驗(yàn)的。余下的4位是沒(méi)有用上的,標(biāo)準(zhǔn)的ECC內(nèi)存可以檢測(cè)出2位的數(shù)據(jù)錯(cuò)誤,但它只能糾正一位錯(cuò)誤。如果在同時(shí)內(nèi)存上有多位出錯(cuò),那么這整個(gè)內(nèi)存讀取就失敗了,此時(shí)唯有使系統(tǒng)臨時(shí)掛起來(lái),以盡量減少內(nèi)存容量的需求,直到這個(gè)節(jié)點(diǎn)被更換。如果具有內(nèi)存保護(hù),那么就可以立即隔離這個(gè)失效的內(nèi)存,重寫(xiě)數(shù)據(jù)在空余的數(shù)據(jù)位。通過(guò)這種方法可以在每4對(duì)(1個(gè)內(nèi)存控制器,有的服務(wù)器不止包括一個(gè)內(nèi)存控制器)168線內(nèi)存中修復(fù)4個(gè)4位連續(xù)的內(nèi)存錯(cuò)誤。當(dāng)服務(wù)器下次重啟就會(huì)重新檢查內(nèi)存的狀態(tài),如果是內(nèi)存軟錯(cuò)誤(臨時(shí)的),系統(tǒng)重啟后內(nèi)存的這些用于在線數(shù)據(jù)備份的數(shù)據(jù)位就重新釋放了,恢復(fù)空的狀態(tài)。如果是屬于硬故障,這些在線備份數(shù)據(jù)位還會(huì)繼續(xù)用來(lái)備份,直到更換為止。這種先進(jìn)技術(shù)可以使減少停機(jī)機(jī)時(shí)間,使服務(wù)器持續(xù)保持高效的計(jì)算平臺(tái)。這對(duì)于大型的數(shù)據(jù)庫(kù)系統(tǒng)中尤其重要。 前面提到的在線內(nèi)存?zhèn)浞菔橇硪环N更高級(jí)別的內(nèi)存保護(hù)。需要注意的是由于系統(tǒng)使用了雙路交叉(2-way Interleaving)訪問(wèn)技術(shù),所以必須成對(duì)安裝雙列直插式內(nèi)存模塊(Dual In-line Memory Module,DIMM)的內(nèi)存條。每個(gè)DIMM必須是同一型號(hào)的,而且容量相同,否則內(nèi)存系統(tǒng)的性能會(huì)受到影響。如果一共有三組內(nèi)存條組,把C組作為在線備份內(nèi)存,其內(nèi)存容量總合要是A、B兩組的容量總合之和。這種技術(shù)特別適用于沒(méi)有足夠的計(jì)算機(jī)系統(tǒng)維護(hù)后人員或者手頭沒(méi)有多余的內(nèi)存可以方便替換的場(chǎng)所,像HP ProLiant服務(wù)器的ML 370、DL 380系列產(chǎn)品均采用在線備份模式。 本文出自:億恩科技【www.allwellnessguide.com】 服務(wù)器租用/服務(wù)器托管中國(guó)五強(qiáng)!虛擬主機(jī)域名注冊(cè)頂級(jí)提供商!15年品質(zhì)保障!--億恩科技[ENKJ.COM] |