14일 클라우드플레어의 네트워크 장애로 수많은 주요 웹사이트가 중단되거나 속도가 느려졌다. 영국을 중심으로 사용자들이 소셜 미디어를 통해 웹사이트 접근 불가 및 로딩 지연 문제를 호소하며 피해가 컸다. 미국과 다른 지역에서도 비슷한 상황이 보고되며 전 세계적인 디지털 혼잡 현상이 발생했다.
마이크로소프트 서비스, 아웃룩 이메일, 우버 플랫폼 등 사용자가 접속하려는 서비스에서는 오류 페이지나 무한 대기 현상이 발생했다. 클라우드플레어 인프라에 의존하는 수십 개의 다른 사이트도 장애로 인해 작동하지 못했다. 한 영국 사용자는 온라인에 ‘웹 페이지가 로드되지 않고 앱이 중단됐다. 완전한 혼란이었다’고 게시했다.
수백만 개의 웹사이트에 대한 트래픽 보호 및 가속화 서비스를 제공하는 클라우드플레어는 시스템에 예고 없이 오류가 발생했다. 회사는 상태 페이지를 통해 핵심 라우팅 서비스의 기술적 결함을 원인으로 지목했다. 엔지니어들은 트래픽을 재경로화하고 문제를 수정하기 위해 대응했다.
UTC 기준 오후 늦게 클라우드플레어는 서비스가 부분적으로 복구됐다고 발표했으며, 대부분의 서비스는 오후에 완전히 복구됐다. 회사는 원인을 구체적으로 밝히지는 않았으나 사후 분석 보고서를 발표할 계획이라고 밝혔다.
이번 장애는 현대 웹의 취약성을 드러냈다. 클라우드플레어는 전 세계 인터넷 트래픽의 상당 부분을 처리하고 있어, 작은 오류도 큰 영향을 미친다. 이 사건을 지켜본 전문가들은 2022년 디스코드와 리그 오브 레전드가 느려진 사례를 언급하며, 이번에는 기업용 도구와 소비자 앱까지 영향을 받았다고 지적했다.
영국 정부는 이에 신속히 대응했다. 국가 사이버보안센터는 영향을 받은 기관들이 후속 영향을 주의 깊게 모니터링할 것을 요청했다. 미국에서는 연방거래위원회(Federal Trade Commission)는 아직 발언을 하지 않았으나, 기업들은 운영 중단으로 인한 손실을 집계하고 있다.
클라우드플레어의 고객은 소규모 블로그부터 포춘 500 기업에 이르기까지, 공격에 대한 방어 및 속도 향상 서비스에 의존하고 있다. 이번 사태는 그 의존성을 상기시켰다. 한 분석가는 인프라 제공업체를 다양화할 필요가 있는 ‘경고’라고 평가했다.
서비스가 안정화되더라도 사용자들의 불만은 여전했다. 영국에서만 도우너디텍터(Downdetector) 차트에 보고가 10만 건에 달하는 등 피크가 나타났다. 클라우드플레어는 반복되지 않도록 팀이 24시간 근무 중이라고 트위터로 안내했다.
이번 사태는 웹 트래픽의 지속적인 성장 속에서 발생했으며, 공격과 관련된 링크는 나타나지 않았다. 관계자는 내부 결함이라고 설명했지만, 원격 근무자들이 아웃룩을 확인하거나 우버를 호출하거나 마이크로소프트 플랫폼에서 개발하는 데 지장을 주는 등 영향은 컸다.
클라우드플레어의 신속한 대응은 더 큰 위기를 막았다. 저녁에는 대부분 지역의 대시보드가 녹색으로 돌아왔다. 회사는 사후 보고서를 통해 투명성을 유지하겠다고 약속했으며, 이 보고서는 며칠 내 발표될 예정이다.
댓글
아직 댓글이 없습니다
첫 번째로 의견을 남겨보세요