ROSE HA、LAN&WAN HA雙機熱備份解決方案
隨著計算機網絡信息化日新月異的發展,各個領域都認識到信息化的重要性,從企業的電子商務到政府的電子政務,無不說明信息化對人們的生活越來越緊密。顧客就是上帝,人民就是國家的主人。如果一個企業電子商務平臺經常出現宕機,這個企業將失去一些寶貴的顧客和合作伙伴。如何給顧客和人民提供一個高可用、高性能的信息化平臺是一個重要的問題。美國Rose Datasystem lnc公司的ROSE HA雙機熱備軟件為企業,政府,教育,醫療等領域提供高可用,高性能,不間斷解決方案。
【什么是雙機】
就是對于重要的服務,使用兩臺服務器,互相備份,共同執行同一服務。當一臺服務器出現故障時,可以由另一臺服務器承擔服務任務,從而在不需要人工干預的情況下,自動保證系統能持續提供服務。
【為什么需要雙機熱備】
雙機熱備針對的是服務器的故障。服務器的故障可能由各種原因引起,如設備故障、操作系統故障、軟件系統故障等等。一般地講,在技術人員在現場的情況下,恢復服務器正??赡苄枰保胺昼?、幾小時甚至幾天。從實際經驗上看,除非是簡單地重啟服務器(可能隱患仍然存在),否則往往需要幾個小時以上。而如果技術人員不在現場,則恢復服務的時間就更長了。 而對于一些重要系統而言,用戶是很難忍受這樣長時間的服務中斷的。因此,就需要通過雙機熱備,來避免長時間的服務中斷,保證系統長期、可靠的服務。
ROSE HA雙機熱備解決方案
ROSEHA 根據不同的行業及各行業不同的需求設計多種備援模式以彈性的調適用戶的最佳組合及選擇。Rose HA 雙機熱備軟件(或稱雙機容錯)
1. ROSE HA 雙機熱備系統運作方式
在正常的運作情形之下,主機之間透過冗余偵測線路互相偵測,當任一主機有錯誤產生時, ROSE HA 提供嚴謹的判斷與分析,確認主機出錯之后,才完全啟動備援接管動作。
支持各種操作系統平臺,包括 Windows NT/2000/2003 、 SCO Openserver/Unixware 、 Linux 、 Solaris 等。
RoseHA 支持各種數據庫: MS-SQL 、 Oracle 、 Informix 、 Sybase 、 Lotus/Nose 、 DB2 等
2. Rose HA 的容錯備援運作過程
自動偵測 (Auto-Detect) 階段 由主機上的軟件通過冗余偵測線,經由復雜的監聽程序。邏輯判斷,來相互偵測對方運行的情況,所檢查的項目有:
主機硬件 (CPU 和周邊 )
主機網絡
主機操作系統
數據庫引擎及其它應用程序
主機與磁盤陣列連線
為確保偵測的正確性,而防止錯誤的判斷,可設定安全偵測時間,包括偵測時間間隔,偵測次數以調整安全系數,并且由主機的冗余通信連線,將所匯集的訊息記錄下來,以供維護參考。
自動切換 (Auto-Switch) 階段 某一主機如果確認對方故障,則正常主機除繼續進行原來的任務,還將依據各種容錯備援模式接管預先設定的備援作業程序,并進行后續的程序及服務。
自動恢復 (Auto-Recovery) 階段 在正常主機代替故障主機工作后,故障主機可離線進行修復工作。在故障主機修復后,透過冗余通訊線與原正常主機連線,自動切換回修復完成的主機上。整個回復過程完成由 ROSE HA 自動完成,亦可依據預先配置,選擇回復動作為半自動或不回復。
3. 產品特征:
ROSE HA軟件可將兩臺主機構建為相互備援的高可用性主機群集,亦支持主服務器和備援服務器工作方式。
當作一臺活動服務器宕機時,其IP地址、服務器名稱及運作的作業會自動轉移至另一臺服務器,客戶端軟件不須重新設定,只要重新連接至原先的IP地址及服務器名稱即可繼續作業。
兩臺服務器的信息交換可通過:RS-232、TCP/IP。
ROSE HA采取高可靠的錯誤檢測和故障恢復機制減少系統宕機時間并防范錯誤,提供故障警告。
ROSE HA可設定故障排除后自動或手動回復。
ROSE HA安裝時不需要修改操作系統的核心,更改應用軟件,也無需特殊的硬件。
ROSE HA提供基于GUI的監控中心,管理員能查看ROSE HA的狀態、檢查錯誤信息和警告、修改系統參數及從遠程工作站管理ROSE HA系統。
ROSE HA不需要復雜的設定與操作,維護方便。
4產品優勢:
接近零系統資源的占用。
快速反應,錯誤檢測時間小于10秒,故障切換及恢復時間一般在10-120秒。
GUI與SERVER分離,可隨時中斷GUI而不影響SERVER的運行。
支持JOB和BRINGIN/BRINGOUT、在一臺SERVER上停止JOB不會導致FAILOVER.
在同一塊網卡上建立多個活動的IP地址,支持多個JOB的運行。
主服務器網絡連接故障時會自動FAILOVER,而備援服務器失敗時不會進行誤切換。
采用C++面向對象的方法設計,程序的穩定性、可維護性、擴充性得到提高。
●友好的界面
RoseHA 提供了友好直觀的圖形安裝界面和監控管理界面。通過直觀而又方便的Java Applet管理界面,用戶可以交互式地對集群系統進行配置、監控和管理,并可以利用Applet的網絡特性,通過網絡對系統進行遠程管理,實時地顯示出主機系統及服務的狀態。
●靈活的Active-Active模式和Active-Standby模式
RoseHA支持Actve-Active模式和Active-Standby模式。用戶可指定每臺服務器的作用(active or standby),指定要監控的服務和硬件部分,定義指定的服務發生故障后要采取的進一步行動(如是否重新啟動該服務、允許的最大啟動時間等)。
●支持多條心跳路徑
可以將網線和RS-232串口線作為RoseHA軟件的心跳路徑。配置多條心跳路徑可以避免系統的單點故障。
●支持虛擬MAC地址
在網絡環境中,每個IP與唯一的MAC綁定在一起。而傳統的集群結構下,將致使集群的活動IP在不同時刻綁定不同的MAC地址,導致跨網段通信出現問題。為了使集群軟件更好的支持這種網絡安全級別較高的網絡環境,RoseHA提供了支持虛擬MAC地址的功能,使集群環境lP地址實現與唯—MAC地址綁定。
●自動切換
當系統出現故障時(如:系統宕機、HA進程/應用進程被殺掉、RS-232、SCSI、光纖、網絡線纜斷開),RoseHA將確定故障原因,并采取相應對策,并將這些應用切換到備份服務器上。而故障服務器中未受影響的應用不會被切換,即不會受任何影響。不需要系統管理員干預。
在集群系統的每一臺服務器內,RoseHA具有兩個核心進程,它們互相監控,如果其中一個進程失敗,另一個進程會立即進行恢復,避免了RoseHA自身服務的單點故障。
●服務器可靠性
在主服務器出現故障(如掉電或宕機)時,另外—臺服務器接管故障服務器上運行的所有的關鍵性應用。
如果服務器的網絡部分發生故障,會導致客戶不能連接和訪問到服務器,這同樣是致命的故障。如果該服務器配備了冗余的網? 絡接口,RoseHA會使用它來恢復網絡連接。在沒有配備冗余的網絡接口,或者所有的網絡接口均出現故障時,HA會將該應用切換到另外—臺服務器上。切換完成后,客戶在短暫的切換過程后能夠繼續訪問所需的服務。
在高可用性系統中可以運行多個應用。每一個應用是作為一個服務而存在的。在服務器中,當某個服務失敗而其它服務正常運行時,RoseHA將處理這個失敗的服務。在將這個服務切換到另一臺服務器上時,該服務器上運行的服務也不會受到影響。對于與網絡不相關的純數據應用,只需要切換數據存儲和數據處理軟件。而對于與網絡相關的客戶機/服務器應用,除了要切換數據存儲和數據處理軟件外,還需要切換相關的虛擬IP。如果希望兩個服務獨立地進行切換,則此兩個虛擬IP地址不能相同。如果使用了相同的IP地址,在發生切換時,RoseHA會將所有使用該IP的服務都切換到另外一臺服務器上去。
提供不同的針對特定應用的Agent程序,使服務監控更切實際,更加有效;提供用于開發Agent程序的應用程序界面(API),使用者可針對特定的服務編寫Agent程序,執行與特定服務相關的狀態診斷及錯誤恢復工作。