探討如何在自建 Kubernetes 環境中實現災難恢復和高可用性,確保系統穩定和持續運行。內容包括災難恢復與高可用性的基本概念及其重要性,設計多主節點架構以實現高可用性,組態負載均衡與故障轉移機制,透過 Velero 數據備份,以及使用 Kubernetes 原生工具(如 kubeadm、kubespray)進行自動化部屬及節點恢復。這次講座將幫助運維與 DevOps 團隊提升系統的可靠性與運行效率。
參加的聽眾將掌握在自建 Kubernetes 環境中實現災難恢復和高可用性的關鍵策略和建構方式,包括如何設計和部署高可用性的多主節點架構,組態負載均衡與故障轉移機制,實施 K8s 數據備份策略,以及使用開源工具進行安裝及故障恢復。這些知識和技能將提升系統的可靠性和運行效率,應對各種運維挑戰。
目前在台灣人工智慧實驗室擔任 DevOps,負責地端自建 K8s Cluster 維護及管理、K8s 管理工具程式開發及維護、CUDA 設定及更新。在此期間積極處理各項 K8s 應用程式更新及除錯,進行雲端下雲可行性的驗證,處理 GPU Driver 更新,並新增 GPU 異常告警機制增加穩定度,同時也對既有 CI/CD 流程進行優化。
個性熱愛追求學習新技術,同時也常藉由學習新技術來補足原來不足的知識,在工作之餘,也自學 Golang、Python,期待在未來的工作上,可以透過各種技術的交互使用,來解決工作上遇到的各種挑戰及問題。
中階
ROOM6F 603+604 會議室
FORM現場演講
LANGUAGE中文
TAGS K8s 維運
K8s 架構設計