• 2024-10-24
  • 14:20 - 14:50

在地端 K8s 的排障故事分享

我們在銀行業中使用全地端 Kubernetes(K8s)進行日常運維和故障排除,分享過去幾年遇到的實際案例。這些事件從簡單的 502/504 錯誤、監控數據、網路流量問題、數據庫異常,一直到硬體故障等多個面向的排查。我們希望通過分享這些經驗,幫助其他人避免重複我們的痛苦,並提升系統穩定性,早點解決問題回家。

聽眾收穫

  • 地端 Kubernetes 的運維挑戰和解決方案
  • 學習如何從 monitor 不足的情況下,挖掘出潛藏的 root cause
  • 學習 K8s 網路與 container 上的優化調教

李啓維 (Kiwi)

玉山銀行
副主任工程師

我是金融業 ML k8s 平台的管理者,致力於提升服務效能及監控透明性。目前,我主要專注於平台的 trace、metrics 和 log 的大結合,確保在部署運作時的資安。同時,我也積極探索新技術,以優化平台的整體表現,並提供更穩定、安全的服務體驗。

LEVEL

中階

ROOM

6F DE會議室

FORM

現場演講

LANGUAGE

中文

TAGS

企業 K8s 實例
K8s 失敗經驗