歡迎您光臨本站 登入註冊首頁

概述

據中心網路進行監控和管理如何操作任何數據中心中最重要的任務之一都是對網路設備,伺服器和數據中心本身的監控。企業通常要制定很多的規劃來選擇有效的監控解決方案和研究數據中心網路設備的管理方法。 ……

數據中心網路進行監控和管理如何操作

任何數據中心中最重要的任務之一都是對網路設備,伺服器和數據中心本身的監控。企業通常要制定很多的規劃來選擇有效的監控解決方案和研究數據中心網路設備的管理方法。

    有效的監控解決方案對於維護數據中心網路是至關重要的,部分原因是出於數據中心長期以來都處在被忽略的地位。在過去數年前筆者曾經在數家數據中心工作過,筆者的經驗是專門駐守數據中心監控這些問題的崗位幾乎從未有過。事實上,可能也沒有人整天待在數據中心裡。畢竟數據中心寒冷而且嘈雜,因此網路管理員通常寧願在別處度過大部分時間。有時管理員甚至都沒有待在數據中心所在的建築里。在筆者職業生涯的早期,筆者曾經在一家大型保險公司工作,這家保險公司的數據中心坐落在地下的掩體里。儘管數據中心設計精巧,但通常只有安保人員在那裡工作。其他人都在幾公裡外的辦公樓里上班。

    無論管理性是否在數據中心裡面工作,他們都必須設置有效的報警裝置。你無法假設某人走進數據中心去注意控制屏上顯示的故障提示。這也是為什麼說管理員要確保應用了完善的網路管理和監控解決方案是如此重要。沒有到位的網路管理和監控解決方案,你可能只有到電話響起才知道發生了問題。

    你必須監控什麼?

    監控數據中心要制定很多規劃,這是因為有許多不同的方面都需要進行監控。你很容易將數據中心監控看做是伺服器上的製表工作,但實際上數據中心監控比這要複雜的多。舉例來說,微軟出品的System Center Operations Manager可以在監控Windows Servers上做大量工作,這樣所需的規劃配置就比較少。但如果你的伺服器運行的不是Windows操作系統,那麼ystem Center Operations Manager就沒有用武之地。

    除了伺服器操作系統和應用軟體之外,還有其他的要素需要進行監控。舉例來說,保持數據中心溫度恆定的監控就很重要。多數伺服器都有內置的安全裝置,如果伺服器的溫度超出了特定的臨界值,安全裝置就會在危險發生之前關閉伺服器。好的監控解決方案應該能夠告訴你數據中心周圍環境的溫度,如果指定伺服器的溫度開始接近臨界值時,監控解決方案就會向你發出警報。

    能量管理也是如此。如果電源發生故障,備份電池應該能讓伺服器在線維繫一定的時間。規格更高的數據中心可能還會配備備份發電機。無論如何,你都必須對電源故障提高警惕,你還需要有到位的解決方案來了解在某個指定時間能提供多少備份電源。

    一項好的監控解決方案必須向管理員發出有關伺服器硬體,操作系統錯誤,應用軟體錯誤,網路硬體和環境改變的各項警報。這是一項苛刻的要求,退一步說,這也是為什麼說正確的規劃如此重要的原因。就筆者所知,沒有單一的監控解決方案能執行所有的這些功能。網路架構師典型的做法是購買幾種監控解決方案,對他們進行設置以統一的方式發出警報。這種警告可能是以文本信息的方式發送到管理員的移動設備或者電子郵箱,或者是以其他類型的警報形式發送到技術支持。重要的事情是所有的警報都到達同一地點。

    虛擬化讓數據中心網路監控複雜化

    當你採購監控解決方案時,記住某些因素是很重要的,諸如虛擬化,它會讓監控流程變得複雜。舉例來說,在市場上有各種監控應用軟體能夠監控伺服器硬體的故障情況。這種應用軟體可能會對超標的伺服器溫度,SMART磁碟警告或者伺服器內的製冷風扇故障做出提示。問題是如果監控解決方案無法獲知他們監控的是虛擬機,它也不可能知道硬體系統會對伺服器可用性存在潛在影響。

    監控軟體處理的應該是主伺服器硬體出現的問題。但是如果主伺服器處於危險之中,那麼任何在主機上運行的虛擬機也面臨同樣的問題。因此如果你的企業想部署虛擬機,你就必須要辦法能區分物理伺服器和虛擬伺服器,了解那個虛擬機在那個主伺服器上運行。在硬體發生故障時,你還必須具備將客戶端伺服器快速遷移到不同主伺服器上的能力。

    最後,管理和監控是息息相關的。只有企業具備完善的管理能力能才保證監控發揮作用。舉例來說,如果管理員沒有辦法解決出現狀況的伺服器發生的故障,監控軟體又告訴你就要發生故障該如何是好呢?因此將監控和將數據中心內每台伺服器與每個硬體的主要組件的遠程管理相結合是非常重要的。

[admin via 研發互助社區 ] 數據中心網路進行監控和管理如何操作已經有3873次圍觀

http://cocdig.com/docs/show-post-152.html