久久久久国产精品一区二区_午夜福利欧美视频_日本三级一区二区中文字幕_国产精品系列亚洲蜜芽_97成人一区二区

加入收藏 設(shè)為首頁 聯(lián)系我們 歡迎光臨本網(wǎng)站!

服務(wù)熱線 010-63550645

專注于數(shù)據(jù)中心第三方驗證測試服務(wù)行為公正、方法科學(xué)、結(jié)果準(zhǔn)確、服務(wù)高效

聯(lián)系我們
服務(wù)熱線:010-63550645

郵箱:support@zcecs.com

地址:北京市西城區(qū)南濱河路27號貴都國際中心A座1111室

采用電源循環(huán)測試查找硬件故障
來源:未知 發(fā)布時間:2017-01-10 18:26 點擊:

如今,企業(yè)采取各種措施不讓意外停機時間中斷其數(shù)據(jù)中心業(yè)務(wù)。而進(jìn)行電源循環(huán)測試,以主動監(jiān)控系統(tǒng)并以有條不紊,有序的方式識別硬件故障是一種很好的措施。

由于在數(shù)據(jù)中心日常操作期間可能不會使用IT系統(tǒng)的所有部分,因此IT組件可能會失效或軟件模塊可能崩潰,但系統(tǒng)可能會正常運行數(shù)月甚至數(shù)年。在系統(tǒng)重新啟動(通常意外)之前,故障可能無法顯示,從而導(dǎo)致意外的工作負(fù)載中斷和停機時間。而企業(yè)需要通過周期性電源循環(huán)測試,以識別可能出現(xiàn)的問題并主動解決問題。

如果沒有看到任何問題,為什么要執(zhí)行電源循環(huán)測試?

數(shù)據(jù)中心所采用的系統(tǒng)管理工具包括MicrosoftSystemCenter,SolarWinds,Nagios和Zabbix這些強大的多功能平臺。幾乎所有的系統(tǒng)管理工具都可以提供故障,配置,會計,性能和安全管理等功能,使其成為現(xiàn)代企業(yè)不可或缺的一部分。

但是,某些故障可能發(fā)生在硬件級別,但可能不會立即影響系統(tǒng)或工作負(fù)載。例如,可能在服務(wù)器的雙列直插存儲器模塊(DIMM)中檢測到存儲器故障。但是,如果沒有工作負(fù)載使用該內(nèi)存空間,或者故障DIMM采用了故障糾正技術(shù)保護(hù),則服務(wù)器可以繼續(xù)工作,很少向系統(tǒng)管理報告其直接錯誤。在大多數(shù)情況下,現(xiàn)代服務(wù)器的智能平臺管理界面或基板管理系統(tǒng)可以報告這些錯誤,但是該信息通常只是記錄,系統(tǒng)及其工作負(fù)載將繼續(xù)運行。

而那些未檢測到的和未解決的硬件問題才是最大的問題。如果意外的系統(tǒng)崩潰或電源中斷導(dǎo)致計劃外的系統(tǒng)重新啟動,則系統(tǒng)的內(nèi)部固件可能會看到這些問題并拒絕完成引導(dǎo)過程。例如,如果服務(wù)器的南橋芯片出現(xiàn)故障,并且USB或板載磁盤控制器功能未初始化或響應(yīng),則引導(dǎo)過程將停止,即使企業(yè)可能不使用服務(wù)器的USB端口,而是通過網(wǎng)絡(luò)訪問存儲,F(xiàn)在,IT部門必須嘗試從意外中斷中恢復(fù),并同時解決有缺陷的系統(tǒng)。

為了避免出這種情況,請進(jìn)行定期現(xiàn),并主動進(jìn)行電源循環(huán)測試,以強制在低級別硬件中重新啟動系統(tǒng)。除了在計劃外中斷或停機期間進(jìn)行加擾,還可以使用計劃的重新啟動來確保數(shù)據(jù)保護(hù),并以有組織的方式將虛擬機或存儲實例遷移到目標(biāo)設(shè)備之外。接下來,循環(huán)上電,并允許硬件系統(tǒng)完全啟動,以顯示潛在的未知或未解決的問題。系統(tǒng)電源循環(huán)通常作為組織現(xiàn)有關(guān)閉文檔的一部分。如果在重新啟動過程中出現(xiàn)問題,企業(yè)將采取更好的準(zhǔn)備采取糾正措施。

應(yīng)該如何接近電源循環(huán)測試,以及應(yīng)該多久進(jìn)行一次?

具有高質(zhì)量設(shè)計的服務(wù)器可以運行多年。當(dāng)企業(yè)在彈性配置(例如服務(wù)器集群)中部署這些服務(wù)器設(shè)計時,這些系統(tǒng)上支持的工作負(fù)載幾乎是不可破壞的。事實上,強調(diào)系統(tǒng)彈性和正常運行時間常常導(dǎo)致許多組織放棄周期性的功率循環(huán)。

但是如果一個服務(wù)器或存儲子系統(tǒng)運行了幾年,你怎么知道它會正常啟動?如果不知道,那么希望系統(tǒng)能夠成功冷啟動的唯一方法是定期進(jìn)行測試。

電源循環(huán)測試需要什么樣的依賴關(guān)系?

企業(yè)的數(shù)據(jù)中心根據(jù)需要進(jìn)行電源循環(huán)測試,以便為其業(yè)務(wù)需求達(dá)到合理的置信水平。通常,可以每幾個月或每年進(jìn)行幾次電源循環(huán)。將電源循環(huán)測試與常規(guī)災(zāi)難恢復(fù)和關(guān)閉測試保持同步,以便同時處理這兩個目標(biāo)可能是一個好主意。

有時,也有一些外部因素影響數(shù)據(jù)中心的正常運行,例如變電站升級改造或重要的建筑物改造,迫使企業(yè)使數(shù)據(jù)中心離線一段時間。如今,計劃停機可以減少業(yè)務(wù)中斷,因為企業(yè)的數(shù)據(jù)中心可以輕松地將工作負(fù)載遷移到輔助數(shù)據(jù)中心或云計算。所以任何IT團隊準(zhǔn)備處理計劃內(nèi)的設(shè)施關(guān)閉也應(yīng)該能夠進(jìn)行常規(guī)電源循環(huán)。

服務(wù)器硬件有任何風(fēng)險嗎?

當(dāng)數(shù)據(jù)中心啟動和運行服務(wù)器或存儲陣列時,總是有一定程度的電,熱和機械應(yīng)力。當(dāng)允許電子元件冷卻并再次升溫時,可能會導(dǎo)致熱應(yīng)力,可能會導(dǎo)致邊緣連接失效,并導(dǎo)致過早的系統(tǒng)故障。類似地,如果讓老化的磁盤或冷卻風(fēng)扇冷卻,它可能因潤滑劑耗盡而卡住,并導(dǎo)致磁盤/風(fēng)扇主軸或產(chǎn)生其他微妙機制的問題。

另外,還存在潛在的邏輯風(fēng)險。意外的配置更改可能會使IT系統(tǒng)超出范圍,并導(dǎo)致由于系統(tǒng)配置管理工具的警告或應(yīng)用程序啟動問題。例如,如果系統(tǒng)重新啟動并嘗試安裝意外或未批準(zhǔn)的修補程序,則配置管理工具可能會暫停工作負(fù)載或服務(wù)器集群啟動,直到系統(tǒng)的批準(zhǔn)配置恢復(fù)為止。

這樣的問題是罕見的,特別是在現(xiàn)代的數(shù)據(jù)中心節(jié)能系統(tǒng)中。雖然一些IT專家認(rèn)為電源循環(huán)可以減少這種故障的可能性,但是計劃的電源循環(huán)測試正是沉淀,隔離和解決這些類型問題的辦法。早期暴露任何問題最好等到意外的電源故障或應(yīng)用程序崩潰,并發(fā)現(xiàn)系統(tǒng)未正常啟動的隱患。

隨著數(shù)據(jù)中心使用虛擬化和群集,其工作負(fù)載將繼續(xù)運行,同時識別和修復(fù)故障系統(tǒng)。


tag標(biāo)簽:測試(233)硬件故障(3)電源(29)采用(1)循環(huán)(1)查找(1)
北京中測信通科技發(fā)展有限公司 版權(quán)所有
京ICP備15039513號-1
服務(wù)熱線:010-63550645 傳真:010-63550645 郵 箱:support@zcecs.com
企業(yè)云:首選線路 備用線路
地址:北京市豐臺區(qū)花鄉(xiāng)高立莊616號新華國際中心D座3層315室
浪卡子县| 葫芦岛市| 石狮市| 巴彦淖尔市| 静乐县| 花莲市| 金山区| 潜山县| 新竹县| 波密县| 凌海市| 南充市| 喀什市| 乌拉特中旗| 安龙县| 青阳县| 乌鲁木齐县| 来宾市| 岚皋县| 沙田区| 沂南县| 侯马市| 佛坪县| 平塘县| 南安市| 共和县| 万安县| 庆城县| 南漳县| 礼泉县| 彩票| 虞城县| 天气| 房产| 武邑县| 南宫市| 吴旗县| 嵊泗县| 涟源市| 黔西| 石家庄市|