探討如何在自建 K8s 環境中實現高可用性與災難復原設計,內容涵蓋 HA 和 DR 的基本概念,K8s 架構的核心組件及其功能作用,並分享如何避免單點故障和提升系統穩定性,還將介紹常見的自建 K8s 方法及災難復原實踐。
目前在台灣人工智慧實驗室擔任 DevOps,負責地端自建 K8s Cluster 維護及管理、K8s 管理工具程式開發及維護、CUDA 設定及更新。在此期間積極處理各項 K8s 應用程式更新及除錯,進行雲端下雲可行性的驗證,處理 GPU Driver 更新,並新增 GPU 異常告警機制增加穩定度,同時也對既有 CI/CD 流程進行優化。
個性熱愛追求學習新技術,同時也常藉由學習新技術來補足原來不足的知識,在工作之餘,也自學 Golang、Python,期待在未來的工作上,可以透過各種技術的交互使用,來解決工作上遇到的各種挑戰及問題。
通識
ROOM6F 603+604 會議室
FORM現場演講
LANGUAGE中文
TAGS K8s 維運
K8s 架構設計