클라우드와 컨테이너 기술의 확산 속에서, 많은 기업이 레거시 시스템을 현대화하고 확장성 있는 디지털 서비스를 구축하려는 도전에 직면하고 있습니다. Generali Malaysia도 예외는 아니었는데요, 증가하는 디지털 서비스 수요를 충족시키면서도 복잡한 컨테이너 환경을 효율적으로 운영해야 하는 과제를 안고 있었습니다. 이 글에서는 Generali가 Amazon EKS Auto Mode를 중심으로 AWS 서비스들을 통합하여 어떻게 운영 부하를 줄이고, 보안을 강화하며, 비용을 최적화했는지 그 실제 적용 사례를 깊이 있게 살펴봅니다. 자세한 근거자료는 AWS Architecture Blog에서 확인할 수 있습니다.

Architecture diagram of Amazon EKS cluster integrated with AWS services like GuardDuty and CloudWatch Development Concept Image

핵심 전환: 수동 운영에서 자동화된 운영으로

Generali의 주요 고민은 여러 비즈니스 유닛의 다양한 컨테이너화된 애플리케이션을 관리하면서도 운영 팀의 부담을 최소화하는 것이었습니다. Amazon EKS Auto Mode는 이 문제에 대한 해답이 되었습니다.

EKS Auto Mode가 가져온 변화:

  • 인프라 관리 자동화: 노드, 로드 밸런서, 스토리지 구성이 자동으로 관리됩니다.
  • 동적 스케일링: 워크로드 수요에 따라 클러스터 리소스가 자동으로 확장/축소되며, 사전 정의된 노드 풀 내에서 비용 최적화가 이루어집니다.
  • 확장된 공동 책임 모델: 기본 OS(보틀러켓) 패치, EKS 애드온 업데이트, 클러스터 업그레이드까지 AWS가 관리합니다.

운영 팀의 역할 변화: 이러한 자동화로 인해 Generali의 DevOps 팀은 인프라 유지보수에서 애플리케이션 팀 지원 및 전략적 과제에 더 집중할 수 있게 되었습니다. 특히, 자동 노드 교체 시 서비스 중단을 방지하기 위해 **Pod 중단 예산(PDB)**과 **Node 중단 예산(NDB)**을 설정하고, 피크 시간 외 유지 관리 기간을 구성하는 등 '자동화된 운영을 위한 제어'에 역량을 집중하게 되었죠.

DevOps team monitoring Kubernetes cluster metrics on Amazon Managed Grafana dashboard Programming Illustration

통합 보안 및 관찰 가능성(Observability) 구축

보안과 모니터링은 멀티테넌트 환경에서 특히 중요합니다. Generali는 여러 AWS 서비스를 통합하여 방어층을 구축했습니다.

보안 강화를 위한 조치:

  1. Amazon GuardDuty EKS 보호: 런타임 모니터링을 통해 컨테이너 탈취, 권한 상승 등 복잡한 공격 패턴을 탐지하고 MITRE ATT&CK 프레임워크에 매핑된 상세 타임라인을 제공받습니다.
  2. Amazon Inspector: Amazon ECR 이미지와 실행 중인 컨테이너를 매핑하여, 저장소 내 모든 취약점이 아닌 현재 실행 환경에서 실제 위협이 되는 취약점을 우선순위로 삼아 조치할 수 있게 했습니다.
  3. AWS 네트워크 방화벽: EKS 클러스터의 아웃바운드 HTTPS 트래픽을 SNI(서버 이름 표시) 호스트명 기반으로 필터링하여, IP 주소 변경에 구애받지 않는 안전한 이그레스 통제를 구현했습니다.
  4. AWS Secrets Manager + External Secrets Operator: 시크릿을 Kubernetes 외부에서 중앙 관리하고, 애플리케이션 코드 변경 없이 자동으로 동기화하여 보안성과 운영 편의성을 동시에 높였습니다.

관찰 가능성과 비용 최적화:

  • Amazon Managed Grafana: CloudWatch를 데이터 소스로 연결해, 각 EKS 네임스페이스별 맞춤형 대시보드를 생성하여 프로젝트별 세분화된 모니터링을 가능하게 했습니다.
  • 비용 할당 태그 & Savings Plans: aws:eks:cluster-name, aws:eks:namespace 등의 태그를 통해 비즈니스 라인별 EKS 비용을 정확히 추적하고, Amazon EC2 Savings Plans 및 **Graviton 기반 인스턴스(최대 20% 비용 절감)**를 활용해 비용을 최적화했습니다.

이처럼 보안과 운영 효율을 동시에 잡는 접근법은, Netflix가 JDK 벡터 API로 추천 시스템을 최적화한 실제 사례에서도 볼 수 있듯, 최신 기술을 실무에 안정적으로 적용하는 데 있어 통합적 시각이 얼마나 중요한지 보여줍니다.

Cost optimization chart showing savings from Amazon EC2 Graviton instances and Savings Plans Developer Related Image

국내 적용 시 고려사항 및 결론

Generali의 사례는 AWS 생태계를 최대한 활용한 이상적인 모델이지만, 국내 SI 환경이나 레거시 시스템 비중이 높은 조직에 바로 적용하기에는 몇 가지 고려할 점이 있습니다. 첫째, EKS Auto Mode의 완전한 자동화는 기존의 세밀한 수동 제어 방식을 포기해야 함을 의미합니다. 변경 관리 프로세스와 자동 업데이트 정책을 사전에 철저히 정의해야 합니다. 둘째, Graviton ARM64 아키텍처 전환은 모든 애플리케이션과 컨테이너 이미지의 호환성을 사전에 검증해야 하는 부담이 따릅니다.

다음 단계 학습 방향: 이 사례가 흥미로웠다면, AWS Well-Architected Framework의 다른 원칙들을 클라우드 아키텍처에 적용하는 방법을 깊이 공부해보는 것을 추천합니다. 또한, 컨테이너 환경의 보안은 지속적인 관심이 필요한 분야입니다. "리액트 서버 컴포넌트, DoS 및 소스코드 노출 취약점 주의보 (CVE-2025-55184 등)" 글에서 다루는 것처럼, 새로운 기술 도입 시 보안 취약점에 대한 선제적 대응 체계를 마련하는 것도 중요합니다.

결론적으로, Generali의 여정은 단순한 기술 도입을 넘어 운영 모델의 근본적인 전환을 보여줍니다. 클라우드 네이티브 서비스의 자동화 기능을 믿고 활용함으로써, 팀은 더 높은 가치를 창출하는 일에 집중할 수 있게 되었습니다. 복잡성과 보안 위협이 증가하는 현대 IT 환경에서, 이처럼 통합적이고 자동화된 플랫폼 접근법은 지속 가능한 운영의 핵심이 될 것입니다.

본 콘텐츠는 신뢰할 수 있는 출처를 바탕으로 AI 도구를 활용하여 초안이 작성되었으며, 편집자의 검토를 거쳐 발행되었습니다. 전문가의 조언을 대체하지 않습니다.