경불진 이피디의 경제공부방

카카오는 물론 대한민국에 ‘미친 원숭이’가 필요한 이유는? 본문

카테고리 없음

카카오는 물론 대한민국에 ‘미친 원숭이’가 필요한 이유는?

경불진 이피디 2022. 10. 25. 11:52
반응형

카카오 먹통 대란이 아직도 진행 중인 듯합니다. 온국민의 일상이 한동안 멈추면서 소상공인들, 택시기사 등의 수입도 막혔잖아요. 그런데 카카오가 내놓고 있는 보상안은 성에 차지 않고요. 많은 분들이 집단소송을 준비 중이라는 말까지 들리고 있습니다.

 

이런 상황에서 정부와 여당이 내놓는 대안도 실망스럽긴 마찬가지입니다. 데이터센터 관리에 국가가 개입할 수 있게 법을 바꾸겠다고 하는데요. 카카오나 네이버와 같은 부가통신사업자에 의무적으로 이중화를 시키겠다는 거죠. 이번 화재 같은 재난에 대비해 같은 시스템을 두 개 이상 준비하는 걸 법으로 강제하겠단 겁니다.

 

해당 법이 통과되면 데이터센터 안전 관리에 정부가 관여하고 과징금까지 부과할 수 있게 됩니다.

 

하지만 데이터센터 관리에 국가가 개입하는 법 개정안은 27개월 전에 발의된 바 있습니다.

 

201811KT 아현지사 통신구 화재 사태로 인한 대규모 통신 장애 사태가 발생한 직후였는데요. 재난 사태가 발생할 경우 사업자는 정부에 관련 보고를 제출해야 하고, 위반하면 매출의 최대 3%에 해당하는 과징금 또는 과태료를 내야 한다는 내용이 골자입니다. 필요한 경우 정부가 현장 조사에 나설 수도 있다는 내용도 포함돼 있었고요.

 

하지만 이중규제라는 업계의 반발로 폐기처분됐었죠. 따라서 이번 대안도 소 잃고 외양간 고치기란 비판이 나올 수 밖에 없습니다. 물론 소 잃은 후에 외양간이라도 고친다면 다행이겠지만 이번에는 제대로 고칠 수 있을까요? 과거 KT 아현지사 통신구 화재 사태 때도 여론의 추이를 보면 관련법 통과가 당연해 보였지만 무산됐잖아요. 이번에도 정부나 여당은 강력 추진하겠다고 강조하고 있지만 시간만 지나가라고 하지 않을까요? 이중규제라는 업계의 반발을 근거로 또다시 하나마나한 개정안만 통과시키지 않을까요?

 

여기서 다시 집어 볼 것이 있습니다. “도대체 카카오 먹통사태의 진짜 원인이 뭘까?” 원인을 정확히 알아야 대안을 제대로 만들 수 있잖아요. 그래서 궁금한 질문을 하나하나 풀어보도록하겠습니다.

 

연합뉴스 제공

첫 번째, 네이버는 괜찮은데 왜 카카오만 문제가 발생했을까요?

 

다들 아시다시피 이번 사태는 SK C&C 판교 데이터센터 화재로 발생했죠. 그런데 이 데이터센터를 카카오만 썼던 것이 아닙니다. 국내 최대 IT업체 네이버도 썼습니다. 그런데 카카오는 30시간 이상 먹통이 됐지만 네이버는 일부 서비스만 그것도 짧은 시간만 장애를 겪었습니다.

 

그래서 원인으로 지목되는 것이 바로 이중화입니다. 이런 이중화는 조선시대에도 했던 것입니다. 조선 태종에서 철종까지 5백년 가까운 역사적 사실을 기록한 세계적인 문화유산 조선왕조실록. 처음에는 춘추관과 충주 전주 성주 등 4곳에 실록을 보관했는데 임진왜란 때 전주 사고를 제외한 나머지 사고가 모두 불타 버리고 말았습니다. 이 때 조선은 어떤 대책을 내놨을까요? 이들 사고의 위치를 옮깁니다. 침략자의 발길이 닿기 힘든 묘향산 태백산 오대산 마니산 등으로요. 그리고 백업의 숫자도 늘립니다. 4곳에서 5곳으로. 이중 5중화 작업 덕분에 병자호란, 청일·러일전쟁, 한국전쟁 등 수많은 전쟁 속에서도 우리의 소중한 문화유산인 조선왕조실록이 온전히 남을 수 있었습니다. 이제는 모든 내용이 인터넷에 기록돼 손쉽게 검색도 할 수 있죠.

 

이런 조상들의 지혜를 카카오 경영진은 배우지 못한 듯합니다. 실제로 카카오와 네이버는 서버운용에서 큰 차이를 보입니다. 카카오는 사고 직후 32000여개의 서버가 동시에 다운되는 초유의 사태가 벌어져 손 쓸 수 없었다고 해명합니다. 그런데 문제는 32000개 서버 대부분이 해당 센터에 있었다는 거죠. 일부를 제외하고는 백업을 하지 않은 것으로 보입니다. 비용이 너무 많이 든다는 이유로.

 

https://www.podbbang.com/channels/9344/episodes/24509315?ucode=L-cYlmqQUB 

 

[꼬꼬문]카카오는 물론 대한민국에 ‘혼돈 원숭이’가 필요한 이유는?

카카오 먹통 사태가 아직도 진행형인데···. 사태의 원인에 대한 분석이 아직 미흡하다고···. 카카오 서버는 하나도 타지 않았는데도 왜 30시간 이상 멈췄을까? 같은 화재에서 네이버는 괜찮았

www.podbbang.com

반면 네이버도 판교 데이터센터에 2만개 이상의 서버를 운용하는 것으로 알려졌습니다. 하지만 네이버는 자체 시설인 각을 포함해 총 6개의 데이터센터에 정보를 골고루 나눠서 저장하고 있습니다. 특히 6개 데이터센터는 서로 유기적으로 연결돼 있다고 합니다. 각 데이터센터가 차지하는 의존 비율은 알 수 없으나, 만약 한 곳의 서버가 마비되더라도 나머지 5개 서버에서 복구를 할 수 있도록 골고루 배분됐다는 거죠. 이중화를 넘어 6중화를 했다는 말입니다.

 

또 한가지 차이점이 있습니다. 이번 카카오 먹통 사태는 화재 때문이었죠. 그래서 많은 분들이 카카오 서버가 불탄 것으로 생각합니다. 그런데 이번 화재로 불탄 서버는 하나도 없는 것으로 알려지고 있습니다. 그럼 좀 이상하죠. 서버는 멀쩡하다는 이야기인데 왜 카카오가 멈췄을까요?

 

이번 데이터센터 화재의 원인이 UPS(무정전 전원장치)의 배터리에 불이 나면서 발생한 것으로 드러났습니다. UPS는 전원이 정전됐을 때 부하전력의 연속성 확보를 위해 사용하는 전원장치입니다. 쉽게 이야기하면 화재나 재난이 발생했을 때 전원이 끊기면 비상 발전기가 가동되잖아요. 그런데 비상 발전기에서 전기를 받기까지도 짧지만 시간이 걸리겠죠. 1초만 멈춰도 주식이나 금융 등에서는 큰 혼란이 야기될 수 있습니다. 따라서 비상 발전기의 전기가 돌기 전까지를 커버하기 위해 UPS를 설치합니다. 1초라도 전원이 끊기는 것을 막기 위해서죠.

 

그런데 이 UPS는 배터리로 구성돼 있습니다. 배터리는 자칫 터질 수 있잖아요. 이번 사태도 UPS의 배터리에서 무슨 이유인지는 아직 정확하지 않지만 화재가 발생하면서 촉발됐습니다. 그런데 전기차 화재에서 보듯이 배터리는 한번 불이 붙으면 잘 꺼지지 않잖아요. 서버 시설이니 물을 뿌릴 수도 없고요. 아예 산소 공급을 막아 불을 끌 수도 있지만 이 센터에는 그런 시설이 없었던 것으로 보입니다. 그래서 할 수 있는 방법은 하나죠. 바로 주전원 차단해 버리는 것. 문제는 주전원을 차단하면 서버마저 전원공급이 이뤄지지 않게 되죠, 서버는 멀쩡하지만 전기가 내려가 멈춰버린 것입니다. 대형 화재나 재난이라고 하기에는 너무나 부끄러운 사고죠. 정말 어이없지 않나요?

 

https://smartstore.naver.com/kbjmall/products/4875486249

 

(베이스워시트래블젤 증정) 닉왁스베이스워시1리터 대용량, 총 1300ml : 경불진몰

[경불진몰] 경불진을 사랑하는 사람들의 착한 쇼핑몰

smartstore.naver.com

두 번째 질문. 전기를 내렸다고 3일 이상 카카오가 멈춘다는 것이 말이 될까? 전기를 공급하면 바로 돌아가야 하는 것 아닐까?

 

여기에 불편한 진실이 있습니다. PC에서 워드 작업을 하다가 갑자기 전원이 끊기면 어떻게 되나요? 자동으로 임시저장이 되기 때문에 다시 전원을 켜면 이어서 작업을 할 수 있죠. 그런데 이런 임시저장은 PC 저장장치에 여유 공간에 하는 것입니다. 대부분 설정에 이런 여유공간을 두게 돼있죠. 그런데 설정을 조정해서 여유공간을 제로로 하면 어떻게 될까요? 임시저장이 되지 않습니다. 그동안의 작업이 한순간에 날아갈 수도 있죠.

 

서버도 비슷합니다. 전원차단으로 카카오의 32000개 서버가 일시에 작동을 멈췄잖아요. 결국 복구를 위해서는 32000개 서버에 저장된 데이터를 여유 공간에서 활성화시켜야 합니다.

하지만 카카오는 이런 여유 공간이 거의 없었던 것으로 보입니다. 서버의 용량을 최대한 탈탈 털어서 썼다는 거죠. 한푼의 낭비도 있으면 안된다는 효율성이라는 명목하에요. 그런데 이 효율성이 발목을 잡았다는 것입니다.

 

그럼 네이버는 어땠을까요? 네이버는 각 데이터센터의 용량을 50~60%만 사용합니다. 예를 들어, 네이버가 100GB(기가바이트) 용량의 데이터센터를 사용한다면, 50~60GB만 사용하고, 나머지 40~50GB는 비상 상황을 위해 여유 공간으로 남겨 둔다는 의미죠. 물론 낭비로 보일 수 있습니다. 평상시에는 이런 여유 공간이 돈먹는 하마처럼 보이기도 할 것입니다. 하지만 이런 여유 공간이 이번 판교 데이터센터 화재 사고에서 빛을 발휘했습니다. 네이버는 여유 공간 덕분에 빠르게 모든 서비스를 정상화 시킬 수 있었죠.

 

이건 사람도 마찬가지 인 듯합니다. 11초를 아끼면서 사는 사람이 많죠. 대부분 최고의 효율을 낼 수 있기 때문에 승진도 빠르고 성공도 많이들 합니다. 그런데 이런 분들의 불편한 진실이 있죠. 건강 등에 문제가 생기면 회복이 되지 않는다는 것입니다. 모든 것을 쏟아 부었기 때문에 다시 복구할 여유 공간이 없어 무너져 내리잖아요. 삶이든 비즈니스든 여유는 낭비가 아니라 미래를 위한 투자로 보는 인식 전환이 필요하지 않을까요?

 

https://smartstore.naver.com/kbjmall/products/5528883860

 

닉왁스 텐트&기어 솔라프루프(TENT&GEAR SOLARPROOF) 1+1(총 1000ml), 사은품: 다운워시300ml , 세척스폰지 :

[경불진몰] 경불진을 사랑하는 사람들의 착한 쇼핑몰

smartstore.naver.com

세 번째 질문. 구글 등 글로벌 IT기업들도 이와 비슷한 사태를 과거에 경험했다고 하는데 어떻게 극복했을까요?

 

여기서 주목받는 용어가 하나 있습니다. ‘카오스 몽키’. 혼돈 원숭이라는 뜻인데요. 이것과 IT 기업의 위기 대응과 무슨 상관이 있을까요?

 

카오스 몽키란 개념을 처음 도입한 것은 구글이나 페이스북이 아니라 놀랍게도 넷플릭스입니다. DVD 대여업을 하던 넷플릭스가 2011년 비디오 스트리밍을 위한 분산 클라우드 시스템으로 전환하던 시기에 이번 카카오 먹통처럼 서버가 멈추는 사태를 방지하기 위한 방안으로 고안한 것인데요. 넷플릭스의 클라우드 및 시스템 인프라 책임자였던 유리 아즈라일레브스키와 클라우드 솔루션 책임자 아리엘 자이틀린이 함께 만든 것으로 알려져 있습니다.

 

그런데 이해하기 어렵죠. 왜 원숭이가 그것도 혼돈 원숭이가 등장할까요? 정말 원숭이를 서비실에 풀어놓기라도 한다는 말일까요?

 

서구 심리학자들은 각종 쓸데없는 잡생각에 사로잡히는 이유를 미친 원숭이가 머리속에 날 뛰고 있기 때문이라고 설명하곤 합니다. 여기서 따온 말로 추정되는데요. 아즈라일레브스키와 지이틀린도 머리가 아니라 넷플릭스 서비스에 미친 원숭이 날 뛰면 어떻게 할까라는 질문을 던졌습니다. 그리고 그런 상황을 가정해 훈련을 해야 한다고 주장한 것이죠.

 

예를들어 미친 원숭이가 서버실에 난입해 공격하고 케이블을 물어 뜯는 동안에도 넷플릭스 서비스를 멈추지 않게 하려면 어떻게 해야 하느냐를 훈련한 것입니다.

 

그래서 넷플릭스는 이 때부터 수시로 비상훈련을 실시합니다. 업무시간을 물론 일요일 새벽 2시 등 불시에 서버 불능 상태 등 돌발 상황을 일으킬 수 있는 훈련 프로그램을 가동하는 거죠. 물론 자칫 모든 서비스가 멈출 수 있으니 랜덤으로 뽑은 일부만 가지고 이런 훈련을 하는 것입니다.

 

이런 훈련을 거듭되면서 넷플릭스는 혼돈 원숭이에 이어 서버 통신을 인위적으로 지연시키는 지연 원숭이’, 규칙에 어긋나는 소프트웨어상 실체를 종료시키는 적합성 원숭이’, 취약한 실체를 탐지해 서비스에서 제외시키고 종료시키는 의사 원숭이등을 탄생시켰다고 합니다. 더 나아가 원숭이로는 부족하다며 더 강력한, 즉 전체 클라우드 서버를 종료하는 혼돈 고릴라를 개발해 극단적인 장애 상황에 대응하는 능력을 시험하고 있다는 군요.

 

넷플릭스 만이 아닙니다. 구글 역시 매년 전사 차원의 재해 복구 테스트’(DiRT·Disaster Recovery Testing)를 시행한다고 합니다. DiRT는 강제로 서비스가 불능 상태가 되거나 핵심 인력이 없는 상황, 지원 시스템 차단 상황 등을 의도적으로 부여하고 해결하는 훈련 방식이죠. 특히 2020년 구글 클라우드 계정이 먹통 되면서 유튜브도 못 봤었고 그때 지메일도 되지 않아 미국은 물론 전세계가 혼돈을 겪었는데요. 이 때 구글은 관련 내용을 백서로 만들어 공개했습니다. 다른 IT업계도 참조할 수 있도록 한 것이죠.

 

그런데 카카오도 자체 재난 훈련 프로그램을 운영하고 있다고 해명합니다. 그런데 넷플릭스처럼 구글처럼 원숭이까지 풀어놓는 훈련도 하고 있을까요? 카카오의 김범석 의장도 이젠 미친 원숭이를 키워야 하지 않을까요?

 

그런데 김범석 의장 만이 아니죠? 지난 여름 강남역 물폭탄 사태에서 봤듯이 일반 재해에 대한 우리사회의 대비 훈련도 정말 미흡해 보입니다. 미친 원숭이, 고릴라가 서울 시내를 휘젓고 다니는 극단 상황을 가정한 대비책을 지금이라도 마련해야 하지 않을까요? 개인이나 가정에서도 말이죠.

 

뉴스1 제공

네 번째 질문. 그렇다하러도 카카오의 사태 수습이 너무 늦어졌는데요. 다른 이유도 있을까요?

 

이를 알기 위해서는 카카오가 사태 처리를 어떻게 했는지 살펴봐야 합니다. 창업주인 김범수 의장은 코배끼도 보이지 않고 남궁훈 대표만 사퇴한다고 했잖아요. 그런데 놀라운 사실이 하나 있습니다.

 

올해 카카오 대표이사가 몇 번이나 바뀌었을까요? 한번? 많아야 두 번?

 

무려 4번입니다. ‘먹튀 논란으로 류영준 대표가 110일 자진사퇴했고 낭궁훈 센터장이 120일 단독 대표가 됩니다. 그러다 714일에는 남궁훈 홍은택 공동대표로 전환하더니 이번 사태 이후 홍은택 단독 대표로 바뀐 것이죠. 특히 남궁훈 대표가 들어왔을 때만 하더라도 카카오 주가가 15만 원으로 회복될 때까지 월급을 보류하고 최저임금만 받겠다는 파격 선언을 했었죠. 그런데 15만원커녕 4만원대로 추락했는데요. 그럼 이런 의심까지 들죠. 사퇴할 때 못받았던 월급을 한꺼번에 받았을까요? 카카오에 대한 신뢰가 무너지면서 이런 의심까지 든다는 것입니다. 참 어의 없죠.

 

더 어의없는 상황도 전해졌습니다. 우리나라의 법정 노동시간은 40시간이죠. 52시간 이야기가 하도 많이 나와 헷갈리는 분들도 계시지만요. 그런데 카카오의 노동시간은 36시간입니다. 우와 꿈의 직장이라고 생각할 수도 있어요. 엄청 복지가 좋은 거잖아요. 소위 워라밸을 충족할 수 있는 회사죠. 그런데 이번 사태에서 이게 문제가 됐습니다.

 

카카오의 노동시간은 36시간이기 때문에 이를 넘어서는 초과 노동은 인정하지 않습니다. 그래서 초과노동수당도 안줍니다. 그런데 이번 먹통사태가 나자 회사 측에서는 당연히 모든 노동자를 출근 시키려 했겠죠. 그런데 일부 노동자들이 출근하지 않았다고 합니다. 나가서 일해도 수당을 주지 않으니까요? 이에 대해 애사심이 없다고 하실 수도 있지만 애사심도 노동 대가를 제대로 줘야 나오는 것 아닐까요?

 

놀라운 것은 카카오 경영진도 이를 그냥 두고 봤다는 것입니다. 그래서 사태 수습이 더 늦어졌다는 이야기도 있고요. 그런데 이런 사실이 언론에 까발려지자 뒤늦게 초과노동수당을 주겠다며 노동자들에 나오라고 했다는 군요. 정말 가관이죠. 카카오 먹통 사태는 시기의 문제였을 뿐 언젠간 터질 것이 터졌다고 봐야 할지도 모르겠습니다.

 

이 정도면 정말 책임을 물어야 하지 않을까요? 그런데 우리 사회는 물론 정치권, 법조계도 이와 유사한 사태에 대해 기업의 책임을 제대로 물리는 경우는 매우 듭니다. 특히 미국 등 선진국에서는 이 정도 사건이면 법적 손해배상 뿐만 아니라 각종 규정을 적용합니다. 자신의 의무를 제대로 지키지 못한 기업을 벌하고 소비자들 보호하는 것이죠. 이는 유료, 무료를 가리지 않습니다. 무료라도 완전 무료는 아니잖아요. 우리의 개인정보와 생활패턴 등을 거의 꽁짜로 쓰고 있으니 대부분의 무료 IT서비스는 유료입니다. 미국, 유럽 등 선진국에서는 이런 점을 강조해 무료 서비스에도 철저한 의무를 강제하거나 강제하려고 합니다.

 

하지만 우리 정부나 정치권은 다르죠. 앞서 언급했던 것처럼 IT 관련, 서버 관련 법. 여러 번 효율화 시키고 체계화시킨다는 논의가 나왔었는데, 정부에서 적극적으로 하지 않았고 특히 일부 국회의원들은 정경유착이라는 소리 들어가면서까지 그 법을 전부 묵살했습니다.

 

그러면서 정부는 카톡을 통해서 군 소집 명령까지 보내고, 또 코로나 백신 예약도 받고 하잖아요. 편하다는 이유로 정부나 정치권도 카톡에 중독된 것으로 보입니다. 이렇게 무임승차 하다보니 규제의 규자도 제대로 꺼내지 못했죠.

 

지금이라도 정신 차려야 합니다. 규모와 영향력에 걸맞는 책임을 기업에게 지우게 해야 합니다. 미친 원숭이를 양성해 사회 곳곳의 위기 상황을 미리 점검해야 합니다. 자유를 그렇게 강조하시는 윤석열 대통령마저 시장 왜곡되면 제도적으로 국가가 대응하겠다고 이야기 하시던요. 설마 이것도 빌 공자의 공약은 아니겠죠?

 
728x90
반응형
LIST