Keepalived基本原理
本文分享自天翼云開(kāi)發(fā)者社區《Keepalived基本原理》,作者:Ujnrfc
Keepalived簡(jiǎn)介
Keepalived是Linux下一個(gè)輕量級別的高可用解決方案。高可用:廣義來(lái)講,是指整個(gè)系統的高可用行;狹義的來(lái)講就是主機的冗余和接管。
它與HeartBeat實(shí)現類(lèi)似的功能,都可以實(shí)現服務(wù)或者網(wǎng)絡(luò )的高可用,但是又有差別,HeartBeat是一個(gè)專(zhuān)業(yè)的、功能完善的高可用軟件,它提供HA軟件所需的基本功能,比如:心跳檢測、資源接管,檢測集群中的服務(wù),在集群節點(diǎn)轉移共享IP地址的所有者等等。HeartBeat功能強大,但是部署和使用相對比較麻煩,與HeartBeat相比,Keepalived主要是通過(guò)虛擬路由冗余來(lái)實(shí)現高可用功能,雖然它沒(méi)有HeartBeat功能強大,但是Keepalived部署和使用非常的簡(jiǎn)單,所有配置只需要一個(gè)配置文件即可以完成。
Keepalived起初是為L(cháng)VS設計的,專(zhuān)門(mén)用來(lái)監控集群系統中各個(gè)服務(wù)節點(diǎn)的狀態(tài),它根據TCP/IP參考模型的第三、第四層、第五層交換機制檢測每個(gè)服務(wù)節點(diǎn)的狀態(tài),如果某個(gè)服務(wù)器節點(diǎn)出現異常,或者工作出現故障,Keepalived將檢測到,并將出現的故障的服務(wù)器節點(diǎn)從集群系統中剔除,這些工作全部是自動(dòng)完成的,不需要人工干涉,需要人工完成的只是修復出現故障的服務(wù)節點(diǎn)。
Keepalived又加入了VRRP的功能,VRRP(VritrualRouterRedundancyProtocol,虛擬路由冗余協(xié)議)出現的目的是解決靜態(tài)路由出現的單點(diǎn)故障問(wèn)題,通過(guò)VRRP可以實(shí)現網(wǎng)絡(luò )不間斷穩定運行,因此Keepalvied一方面具有服務(wù)器狀態(tài)檢測和故障隔離功能,另外一方面也有HAcluster功能。
目前健康檢查和失敗切換是keepalived的兩大核心功能。所謂的健康檢查,就是采用tcp三次握手,icmp請求,http請求,udp echo請求等方式對負載均衡器后面的實(shí)際的服務(wù)器(通常是承載真實(shí)業(yè)務(wù)的服務(wù)器)進(jìn)行?;?;而失敗切換主要是應用于配置了主備模式的負載均衡器,利用VRRP維持主備負載均衡器的心跳,當主負載均衡器出現問(wèn)題時(shí),由備負載均衡器承載對應的業(yè)務(wù),從而在最大限度上減少流量損失,并提供服務(wù)的穩定性。
VRRP協(xié)議與工作原理
在現實(shí)的網(wǎng)絡(luò )環(huán)境中。主機之間的通信都是通過(guò)配置靜態(tài)路由或者(默認網(wǎng)關(guān))來(lái)完成的,而主機之間的路由器一旦發(fā)生故障,通信就會(huì )失效,因此這種通信模式當中,路由器就成了一個(gè)單點(diǎn)瓶頸,為了解決這個(gè)問(wèn)題,就引入了VRRP協(xié)議。
VRRP協(xié)議是一種容錯的主備模式的協(xié)議,保證當主機的下一跳路由出現故障時(shí),由另一臺路由器來(lái)代替出現故障的路由器進(jìn)行工作,通過(guò)VRRP可以在網(wǎng)絡(luò )發(fā)生故障時(shí)透明的進(jìn)行設備切換而不影響主機之間的數據通信。
虛擬路由器:虛擬路由器是VRRP備份組中所有路由器的集合,它是一個(gè)邏輯概念,并不是正真存在的。從備份組外面看備份組中的路由器,感覺(jué)組中的所有路由器就像一個(gè) 一樣,可以理解為在一個(gè)組中:主路由器+所有備份路由器=虛擬路由器。虛擬路由器有一個(gè)虛擬的IP地址和MAC地址。主機將虛擬路由器當作默認網(wǎng)關(guān)。虛擬MAC地址的格式為00-00-5E-00-01-{VRID}。通常情況下,虛擬路由器回應ARP請求使用的是虛擬MAC地址,只有虛擬路由器做特殊配置的時(shí)候,才回應接口的真實(shí)MAC地址。
主路由器(MASTER):虛擬路由器通過(guò)虛擬IP對外提供服務(wù),而在虛擬路由器內部同一時(shí)間只有一臺物理路由器對外提供服務(wù),這臺提供服務(wù)的物理路由器被稱(chēng)為主路由器。一般情況下Master是由選舉算法產(chǎn)生,它擁有對外服務(wù)的虛擬IP,提供各種網(wǎng)絡(luò )功能,如:ARP請求,ICMP數據轉發(fā)等。
備份路由器(BACKUP):虛擬路由器中的其他物理路由器不擁有對外的虛擬IP,也不對外提供網(wǎng)絡(luò )功能,僅接受MASTER的VRRP狀態(tài)通告信息,這些路由器被稱(chēng)為備份路由器。當主路由器失敗時(shí),處于BACKUP角色的備份路由器將重新進(jìn)行選舉,產(chǎn)生一個(gè)新的主路由器進(jìn)入MASTER角色,繼續提供對外服務(wù),整個(gè)切換對用戶(hù)來(lái)說(shuō)是完全透明的。
VRRP選舉機制
VRRP路由器在運行過(guò)程中有三種狀態(tài):Initialize、Master、Backup。一般主路由器處于Master狀態(tài),備份路由器處于Backup狀態(tài)。
VRRP使用選舉機制來(lái)確定路由器的狀態(tài),優(yōu)先級如下:
1.VRRP組中IP擁有者。如果虛擬IP地址與VRRP組中的某臺VRRP路由器IP地址相同,則此路由器為IP地址擁有者,這臺路由器將被定位主路由器。
2.比較優(yōu)先級。如果沒(méi)有IP地址擁有者,則比較路由器的優(yōu)先級,優(yōu)先級的范圍是0~255,優(yōu)先級大的作為主路由器
3.比較IP地址。在沒(méi)有Ip地址擁有者和優(yōu)先級相同的情況下,IP地址大的作為主路由器。
如下圖所示,虛擬IP為10.1.1.254,在VRRP組中沒(méi)有IP地址擁有者,則比較優(yōu)先級,很明顯router_a和router_b的優(yōu)先級要大于router_c,則比較router_a和router_b的IP地址,router_a的IP地址大。所以router_a為組中的主路由器。
VRRP工作過(guò)程
路由器使用VRRP 功能后,會(huì )根據優(yōu)先級確定自己在備份組中的角色。優(yōu)先級高的路由器成為Master 路由器,優(yōu)先級低的成為Backup 路由器。Master 擁有對外服務(wù)的虛擬IP,提供各種網(wǎng)絡(luò )功能,并定期發(fā)送VRRP 報文,通知備份組內的其他設備自己工作正常;Backup 路由器只接收Master 發(fā)來(lái)的報文信息,用來(lái)監控Master 的運行狀態(tài)。當Master 失效時(shí),Backup 路由器進(jìn)行選舉,優(yōu)先級高的Backup 將成為新的Master 。
主備切換邏輯如下:在搶占方式下,當Backup 路由器收到VRRP 報文后,會(huì )將自己的優(yōu)先級與報文中的優(yōu)先級進(jìn)行比較。如果大于通告報文中的優(yōu)先級,則成為Master 路由器;否則將保持Backup狀態(tài);在非搶占方式下,只要Master 路由器沒(méi)有出現故障,備份組中的路由器始終保持Master 或Backup 狀態(tài),Backup 路由器即使隨后被配置了更高的優(yōu)先級也不會(huì )成為Master 路由器;如果Backup 路由器的定時(shí)器超時(shí)后仍未收到Master 路由器發(fā)送來(lái)的VRRP報文,則認為Master 路由器已經(jīng)無(wú)法正常工作,此時(shí)Backup 路由器會(huì )認為自己是Master 路由器,并對外發(fā)送VRRP報文。備份組內的路由器根據優(yōu)先級選舉出Master 路由器,承擔報文的轉發(fā)功能。
Keepalvied的工作原理
Keepalived 包含以下組件:
core:是keepalived的核心,復雜主進(jìn)程的啟動(dòng)和維護,全局配置文件的加載解析等
check:負責healthchecker(健康檢查),包括了各種健康檢查方式,以及對應的配置的解析包括LVS的配置解析
vrrp:vrrpd子進(jìn)程,VRRPD子進(jìn)程就是來(lái)實(shí)現VRRP協(xié)議的
libipfwc:iptables(ipchains)庫,配置LVS
libipvs:配置LVS
Keepalived 啟動(dòng)后會(huì ) 通過(guò)healthchecker組件負責檢查各自服務(wù)器的健康狀態(tài),如果MASTER節點(diǎn)上服務(wù)不可用就會(huì )通過(guò)vrrpd組件切換到BACKUP狀態(tài)。
Keepalived工作在TCP/IP參考模型的三層、四層、五層(物理層,鏈路層):
網(wǎng)絡(luò )層(3):Keepalived通過(guò)ICMP協(xié)議向服務(wù)器集群中的每一個(gè)節點(diǎn)發(fā)送一個(gè)ICMP數據包(有點(diǎn)類(lèi)似與Ping的功能),如果某個(gè)節點(diǎn)沒(méi)有返回響應數據包,那么認為該節點(diǎn)發(fā)生了故障,Keepalived將報告這個(gè)節點(diǎn)失效,并從服務(wù)器集群中剔除故障節點(diǎn)。
傳輸層(4):Keepalived在傳輸層里利用了TCP協(xié)議的端口連接和掃描技術(shù)來(lái)判斷集群節點(diǎn)的端口是否正常,比如對于常見(jiàn)的WEB服務(wù)器80端口?;蛘逽SH服務(wù)22端口,Keepalived一旦在傳輸層探測到這些端口號沒(méi)有數據響應和數據返回,就認為這些端口發(fā)生異常,然后強制將這些端口所對應的節點(diǎn)從服務(wù)器集群中剔除掉。
應用層(5):Keepalived的運行方式也更加全面化和復雜化,用戶(hù)可以通過(guò)自定義Keepalived工作方式,例如:可以通過(guò)編寫(xiě)程序或者腳本來(lái)運行Keepalived,而Keepalived將根據用戶(hù)的設定參數檢測各種程序或者服務(wù)是否允許正常,如果Keepalived的檢測結果和用戶(hù)設定的不一致時(shí),Keepalived將把對應的服務(wù)器從服務(wù)器集群中剔除。
*博客內容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀(guān)點(diǎn),如有侵權請聯(lián)系工作人員刪除。