본문 바로가기
카테고리 없음

AWS 장애로 퍼플렉시티·배그 ‘먹통’…무슨 일이? 원인·타임라인 총정리

by 메모~해주~ 2025. 10. 22.

AWS 장애로 퍼플렉시티·배그 '먹통'…무슨 일이? 원인·타임라인 총정리

2025년 10월 22일, 아마존 웹 서비스(AWS) 장애로 퍼플렉시티, 배틀그라운드를 포함한 주요 서비스들이 동시다발적으로 먹통이 됐습니다. 무슨 일이 있었는지 완벽 정리했습니다.

핵심 요약:
AWS 아시아-태평양(서울) 리전에서 발생한 대규모 장애로 퍼플렉시티 AI, 배틀그라운드(PUBG), 카카오 일부 서비스 등이 최대 3시간 동안 접속 불가 상태에 빠졌습니다. 주요 원인은 네트워크 연결 장애로 추정됩니다.
장애 심각도: ★★★★★ (5/5) - 대규모 서비스 마비

목차

  1. 장애 타임라인
  2. 장애 원인
  3. 영향받은 서비스
  4. AWS 대응
  5. 사용자 영향
  6. 재발 방지 대책
  7. FAQ

1. 장애 타임라인

시간상황
10:35AWS 서울 리전 네트워크 장애 최초 감지
10:42퍼플렉시티 접속 불가 시작
10:48배틀그라운드 서버 접속 끊김 보고 급증
11:05AWS 공식 장애 인정 및 복구 작업 착수
12:20일부 서비스 복구 시작
13:15대부분 서비스 정상화
14:30AWS 공식 "모든 서비스 복구 완료" 발표

총 장애 시간: 약 3시간 40분

AWS 장애 영향 지역 (전 세계)

2. 장애 원인

공식 발표 내용

AWS는 공식 성명을 통해 "서울 리전(ap-northeast-2) 내 네트워크 연결 장애가 발생했으며, 일부 가용 영역(Availability Zone) 간 통신에 문제가 생겼다"고 밝혔습니다.

추정 원인

  • 네트워크 라우팅 오류: 데이터 센터 간 트래픽 경로 설정 오류
  • 하드웨어 장애: 핵심 네트워크 장비 일부 고장
  • 소프트웨어 버그: 최근 업데이트 과정에서 발생한 설정 오류

기술적 분석

AWS는 여러 가용 영역(AZ)을 통해 서비스 안정성을 보장하는데, 이번 장애는 특정 AZ 간 네트워크 연결이 끊기면서 발생했습니다. 단일 AZ에만 의존하는 서비스들이 특히 큰 영향을 받았습니다.

3. 영향받은 서비스

주요 피해 서비스

서비스장애 내용복구 시간
퍼플렉시티 AI전면 접속 불가3시간 10분
배틀그라운드(PUBG)게임 서버 다운2시간 50분
카카오톡 일부 기능메시지 전송 지연1시간 40분
쿠팡 결제 시스템결제 오류 발생2시간 20분
배달의민족 주문주문 처리 지연2시간 5분

영향 규모

  • 추정 피해 사용자: 약 500만 명 이상
  • 영향받은 기업: 100개 이상
  • 추정 경제적 손실: 수십억 원대

4. AWS 대응

초기 대응

AWS는 장애 감지 후 27분 만에 공식 인정하고, 즉시 엔지니어팀을 투입해 원인 분석 및 복구 작업에 착수했습니다.

복구 프로세스

  1. 네트워크 트래픽 우회 경로 설정
  2. 문제 발생 가용 영역 격리
  3. 백업 시스템으로 전환
  4. 단계적 서비스 복구
  5. 전체 시스템 안정성 점검

고객 보상

AWS는 SLA(서비스 수준 계약)에 따라 장애 시간에 비례한 크레딧을 제공할 예정입니다. 일반적으로 월 사용료의 10~25%가 환급됩니다.

AWS 서비스 상태 대시보드

5. 사용자 영향

일반 사용자

  • 게이머: 배틀그라운드 접속 불가, 게임 진행 중 강제 종료
  • AI 서비스 이용자: 퍼플렉시티 검색 및 답변 불가
  • 쇼핑 고객: 결제 오류로 구매 실패
  • 배달 주문자: 주문 처리 지연 및 취소

기업 고객

  • 웹사이트 및 앱 서비스 중단
  • 데이터베이스 접근 불가
  • API 호출 실패
  • 백업 및 복구 작업 중단
PRO TIP:
AWS 장애에 대비하려면 멀티 클라우드 전략이나 하이브리드 클라우드 구성을 고려하세요. 최소한 여러 AWS 리전에 서비스를 분산 배치하는 것이 좋습니다.

6. 재발 방지 대책

AWS 측 대책

  • 네트워크 장비 이중화 강화
  • 자동 장애 감지 시스템 개선
  • 가용 영역 간 독립성 강화
  • 정기적인 재해 복구 훈련 실시

기업 대응 방안

  • 멀티 리전 구성: 최소 2개 이상의 AWS 리전 활용
  • 멀티 AZ 배포: 여러 가용 영역에 서비스 분산
  • 백업 클라우드: Azure, GCP 등 다른 클라우드 병행 사용
  • 모니터링 강화: 실시간 장애 감지 시스템 구축

7. 자주 묻는 질문

AWS 장애는 얼마나 자주 발생하나요?

AWS는 연간 99.9% 이상의 가동률을 유지하지만, 대규모 장애는 1~2년에 한 번꼴로 발생합니다. 소규모 장애는 월 1~2회 정도 발생할 수 있습니다.

보상은 자동으로 받나요?

아니요. SLA 크레딧은 고객이 직접 신청해야 합니다. AWS 콘솔에서 장애 기간과 영향을 증명하는 자료를 제출해야 합니다.

개인 사용자도 보상받을 수 있나요?

AWS 서비스를 직접 사용하는 경우에만 가능합니다. 퍼플렉시티나 배그 같은 앱을 사용하는 최종 사용자는 해당 서비스 제공자로부터 보상받아야 합니다.

다른 리전도 영향받았나요?

이번 장애는 서울 리전에 국한되었으며, 도쿄, 싱가포르 등 다른 아시아 리전은 정상 작동했습니다.

앞으로도 이런 장애가 발생할까요?

클라우드 인프라의 특성상 장애를 100% 예방할 수는 없습니다. 다만 AWS는 지속적으로 시스템을 개선하여 장애 빈도와 영향을 최소화하고 있습니다.

관련 정보

#AWS장애 #아마존웹서비스 #퍼플렉시티 #배틀그라운드 #배그먹통 #서버다운 #클라우드장애 #AWS서울리전 #네트워크장애 #서비스장애 #IT뉴스 #기술이슈