빅테크 데이터센터도 사고 있었다…”신속 복구 시스템 중요”

아마존·MS·구글 “사고 방지와 발생시 신속복구에 많은 투자”

2011년 아마존 하루 동안 가동 중단…뉴욕타임스 등 사이트다운

미국 오클라호마주 메이스 카운티의 구글 데이터센터

미국 오클라호마주 메이스 카운티의 구글 데이터센터 [연합뉴스 자료사진. 재판매 및 DB 금지]

카카오의 데이터센터 화재로 관련 서비스가 전면 중단되는 사태를 겪으면서 해외 빅테크 기업들의 사고에도 관심이 쏠린다.

아마존과 마이크로소프트, 구글은 전 세계 곳곳에 데이터센터를 구축해 이를 다른 기업에 빌려주는 ‘클라우드 서비스’를 하고 있다.

그런 만큼 보안이나 예상치 못한 사고 방지에 온 힘을 쏟지만 그렇다고 사고가 없었던 것은 아니다. 특히, 센터 가동을 위해 필요한 대규모 전력에 차질이 생기면서 정전 등에 따른 가동 중단이 발생하곤 했다.

아마존은 전 세계 클라우드 서비스 시장의 1위를 차지하고 있지만 크고 작은 사고도 잦았다.

대표적인 것이 2011년 4월 사고다. 미 동부 지역에 위치한 데이터센터에 예기치 못한 정전으로 센터 가동이 중단됐고 복구까지는 만 하루가 걸렸다.

당시에 미국 대형 소셜 뉴스 웹사이트인 레딧, 뉴욕타임스 등 유명 기업들이 아마존의 데이터센터를 빌려 사용했다.

아마존 웹서비스 로고.
아마존 웹서비스 로고. [EPA 연합뉴스 자료사진. 재판매 및 DB 금지]

이 정전으로 이들 기업의 사이트가 최소 하루 동안 녹다운됐고, 일부 사이트 복구에는 4일이 걸렸다.

아마존은 이를 계기로 정전 등에 대비해왔지만 그래도 사고는 일어났다.

2012년 6월에는 태풍 때문에 서버 전력공급이 끊기면서 4시간 동안 아마존 클라우드 서버를 이용하는 인스타그램이 먹통이 됐다.

2017년 2월에도 미 동부 데이터센터의 정전 에러로 인터넷 업데이트가 안 되거나 인터넷 속도가 느려지는 일이 발생했다.

지난해 12월에만해도 미국 동부 해안에 있는 데이터 서버가 세 차례 정전됐다.

일시적이었기는 했지만 이 때문에 이 서버의 클라우드 서비스를 이용하는 회사들의 홈페이지와 애플리케이션 작동에 차질이 빚어졌다.

12월 20일 정전으로 미국 최대 가상화폐 거래소인 코인베이스의 앱과 홈페이지에서는 일부 가상화폐 거래가 지연됐다.

같은 달 7일에도 버지니아주 북부를 포함한 미 동부 지역의 클라우드 서비스가 1시간가량 중단됐고, 같은 달 초에도 짧은 장애가 발생하기도 했다.

데이터센터
데이터센터

[마이크로소프트 제공]

시장조사업체 가트너의 추정치에 따르면 2020년 기준 아마존의 테이터센터 시장점유율은 41%, 마이크로소프트(MS)가 20%를 차지한다.

마이크로소프트는 지난 6월 미 동부 버지니아에 있는 데이터센터 운영이 중단됐다. 전력 시스템에 예기치 않은 문제가 발생했기 때문이었다.

완전 복구까지는 12시간이 걸렸으나, 다른 데이터센터로의 중복 서비스가 제공된 기업들은 큰 영향은 받지 않았다.

구글은 지난 8월 런던 지역을 커버하는 데이터센터에 문제가 생겼다. 기록적인 폭염으로 전력공급에 차질이 빚어지면서 냉각시스템이 고장을 일으킨 것이다.

다행히 수 시간 만에 복구돼 큰 피해는 알려지지 않았다.

이처럼 글로벌 빅 테크들의 데이터센터에도 예상치 못한 사고가 발생하면서 이들 기업은 사고 대비는 물론, 발생 시 신속한 복구에 많은 투자를 하고 있다.

실리콘밸리 테크 기업의 한 엔지니어는 “데이터센터도 정전이나 재난 등으로 예상치 못한 사고가 종종 발생하곤 한다”며 “그러나 이를 얼마나 빨리 복구할 수 있는 시스템이 돼 있느냐가 중요하다”고 말했다.