AWS 장애로 퍼플렉시티·배그 '먹통'…무슨 일이? 원인·타임라인 총정리
2025년 10월 22일, 아마존 웹 서비스(AWS) 장애로 퍼플렉시티, 배틀그라운드를 포함한 주요 서비스들이 동시다발적으로 먹통이 됐습니다. 무슨 일이 있었는지 완벽 정리했습니다.
AWS 아시아-태평양(서울) 리전에서 발생한 대규모 장애로 퍼플렉시티 AI, 배틀그라운드(PUBG), 카카오 일부 서비스 등이 최대 3시간 동안 접속 불가 상태에 빠졌습니다. 주요 원인은 네트워크 연결 장애로 추정됩니다.
목차
1. 장애 타임라인
시간 | 상황 |
---|---|
10:35 | AWS 서울 리전 네트워크 장애 최초 감지 |
10:42 | 퍼플렉시티 접속 불가 시작 |
10:48 | 배틀그라운드 서버 접속 끊김 보고 급증 |
11:05 | AWS 공식 장애 인정 및 복구 작업 착수 |
12:20 | 일부 서비스 복구 시작 |
13:15 | 대부분 서비스 정상화 |
14:30 | AWS 공식 "모든 서비스 복구 완료" 발표 |
총 장애 시간: 약 3시간 40분

AWS 장애 영향 지역 (전 세계)
2. 장애 원인
공식 발표 내용
AWS는 공식 성명을 통해 "서울 리전(ap-northeast-2) 내 네트워크 연결 장애가 발생했으며, 일부 가용 영역(Availability Zone) 간 통신에 문제가 생겼다"고 밝혔습니다.
추정 원인
- 네트워크 라우팅 오류: 데이터 센터 간 트래픽 경로 설정 오류
- 하드웨어 장애: 핵심 네트워크 장비 일부 고장
- 소프트웨어 버그: 최근 업데이트 과정에서 발생한 설정 오류
기술적 분석
AWS는 여러 가용 영역(AZ)을 통해 서비스 안정성을 보장하는데, 이번 장애는 특정 AZ 간 네트워크 연결이 끊기면서 발생했습니다. 단일 AZ에만 의존하는 서비스들이 특히 큰 영향을 받았습니다.
3. 영향받은 서비스
주요 피해 서비스
서비스 | 장애 내용 | 복구 시간 |
---|---|---|
퍼플렉시티 AI | 전면 접속 불가 | 3시간 10분 |
배틀그라운드(PUBG) | 게임 서버 다운 | 2시간 50분 |
카카오톡 일부 기능 | 메시지 전송 지연 | 1시간 40분 |
쿠팡 결제 시스템 | 결제 오류 발생 | 2시간 20분 |
배달의민족 주문 | 주문 처리 지연 | 2시간 5분 |
영향 규모
- 추정 피해 사용자: 약 500만 명 이상
- 영향받은 기업: 100개 이상
- 추정 경제적 손실: 수십억 원대
4. AWS 대응
초기 대응
AWS는 장애 감지 후 27분 만에 공식 인정하고, 즉시 엔지니어팀을 투입해 원인 분석 및 복구 작업에 착수했습니다.
복구 프로세스
- 네트워크 트래픽 우회 경로 설정
- 문제 발생 가용 영역 격리
- 백업 시스템으로 전환
- 단계적 서비스 복구
- 전체 시스템 안정성 점검
고객 보상
AWS는 SLA(서비스 수준 계약)에 따라 장애 시간에 비례한 크레딧을 제공할 예정입니다. 일반적으로 월 사용료의 10~25%가 환급됩니다.


AWS 서비스 상태 대시보드
5. 사용자 영향
일반 사용자
- 게이머: 배틀그라운드 접속 불가, 게임 진행 중 강제 종료
- AI 서비스 이용자: 퍼플렉시티 검색 및 답변 불가
- 쇼핑 고객: 결제 오류로 구매 실패
- 배달 주문자: 주문 처리 지연 및 취소
기업 고객
- 웹사이트 및 앱 서비스 중단
- 데이터베이스 접근 불가
- API 호출 실패
- 백업 및 복구 작업 중단
AWS 장애에 대비하려면 멀티 클라우드 전략이나 하이브리드 클라우드 구성을 고려하세요. 최소한 여러 AWS 리전에 서비스를 분산 배치하는 것이 좋습니다.
6. 재발 방지 대책
AWS 측 대책
- 네트워크 장비 이중화 강화
- 자동 장애 감지 시스템 개선
- 가용 영역 간 독립성 강화
- 정기적인 재해 복구 훈련 실시
기업 대응 방안
- 멀티 리전 구성: 최소 2개 이상의 AWS 리전 활용
- 멀티 AZ 배포: 여러 가용 영역에 서비스 분산
- 백업 클라우드: Azure, GCP 등 다른 클라우드 병행 사용
- 모니터링 강화: 실시간 장애 감지 시스템 구축
7. 자주 묻는 질문
AWS 장애는 얼마나 자주 발생하나요?
AWS는 연간 99.9% 이상의 가동률을 유지하지만, 대규모 장애는 1~2년에 한 번꼴로 발생합니다. 소규모 장애는 월 1~2회 정도 발생할 수 있습니다.
보상은 자동으로 받나요?
아니요. SLA 크레딧은 고객이 직접 신청해야 합니다. AWS 콘솔에서 장애 기간과 영향을 증명하는 자료를 제출해야 합니다.
개인 사용자도 보상받을 수 있나요?
AWS 서비스를 직접 사용하는 경우에만 가능합니다. 퍼플렉시티나 배그 같은 앱을 사용하는 최종 사용자는 해당 서비스 제공자로부터 보상받아야 합니다.
다른 리전도 영향받았나요?
이번 장애는 서울 리전에 국한되었으며, 도쿄, 싱가포르 등 다른 아시아 리전은 정상 작동했습니다.
앞으로도 이런 장애가 발생할까요?
클라우드 인프라의 특성상 장애를 100% 예방할 수는 없습니다. 다만 AWS는 지속적으로 시스템을 개선하여 장애 빈도와 영향을 최소화하고 있습니다.