• 2024-10-24
  • 14:20 - 14:50

自建 K8s 環境中的災難恢復和高可用性設計

探討如何在自建 Kubernetes 環境中實現災難恢復和高可用性,確保系統穩定和持續運行。內容包括災難恢復與高可用性的基本概念及其重要性,設計多主節點架構以實現高可用性,組態負載均衡與故障轉移機制,透過 Velero 數據備份,以及使用 Kubernetes 原生工具(如 kubeadm、kubespray)進行自動化部屬及節點恢復。這次講座將幫助運維與 DevOps 團隊提升系統的可靠性與運行效率。

聽眾收穫

參加的聽眾將掌握在自建 Kubernetes 環境中實現災難恢復和高可用性的關鍵策略和建構方式,包括如何設計和部署高可用性的多主節點架構,組態負載均衡與故障轉移機制,實施 K8s 數據備份策略,以及使用開源工具進行安裝及故障恢復。這些知識和技能將提升系統的可靠性和運行效率,應對各種運維挑戰。

邱泯淇 (Minchi)

Taiwan AI Labs
DevOps Engineer

目前在台灣人工智慧實驗室擔任 DevOps,負責地端自建 K8s Cluster 維護及管理、K8s 管理工具程式開發及維護、CUDA 設定及更新。在此期間積極處理各項 K8s 應用程式更新及除錯,進行雲端下雲可行性的驗證,處理 GPU Driver 更新,並新增 GPU 異常告警機制增加穩定度,同時也對既有 CI/CD 流程進行優化。

個性熱愛追求學習新技術,同時也常藉由學習新技術來補足原來不足的知識,在工作之餘,也自學 Golang、Python,期待在未來的工作上,可以透過各種技術的交互使用,來解決工作上遇到的各種挑戰及問題。

LEVEL

中階

ROOM

6F 603+604 會議室

FORM

現場演講

LANGUAGE

中文

TAGS

K8s 維運
K8s 架構設計