얼마 전, 싸이월드가 점검에 들어갔습니다. 써보신 분들은 아시겠지만, 싸이월드는 점검 시간이 잦고 긴 편입니다. 그래도 미니홈피 정도는 안 봐도 괜찮았습니다. 정작 문제는 네이트온이라는 메신저에 나타났습니다. 싸이월드가 점검중인데 네이트온 메신저의 쪽지함을 못 열어보는 이상한 일이 생겼습니다. 대화, 메일 등도 당연히 사용이 불가했습니다. 반면, 네이트온과 네이트 홈페이지 자체는 분명히 접근할 수 있었습니다.
이유는 이렇습니다. 얼마 전 네이트 홈페이지에 싸이월드와 네이트온의 기능을 대거 통합시켰습니다. 그러면서 네이트온의 쪽지함 기능이 네이트 홈페이지로 이전됐습니다. 쪽지함을 어느 컴퓨터에서나 통합해서 볼 수 있다는 점은 확실히 좋았습니다. 그러나 이 쪽지 기능이 내부적으로는 네이트 홈페이지가 아니라 싸이월드 기능과 의존성이 생겼나봅니다. 그 밖에도 대화함, 메일 확인까지 안되니 정말 답답할 따름이었습니다.
이는 네이트에서만 생길 수 있는 문제가 아닙니다. 어떤 서비스든지 간에 서로 의존 관계가 생긴다면 당연히 생길 수 있는 문제입니다. SK의 T스토어나 앱스토어의 서비스에 전적으로 자신의 중요한 정보를 맡길 수 있을까요? 중요한 순간에 서비스가 점검에 들어간다면 어떻게 하죠? 중앙 서버에서 자료를 통째로 잃어버린다면? 구식 단말기라면 남아있을 중요한 자료들이 한 순간에 날아버리는 일도 있지 않을까요?
이건 허무맹랑한 이야기가 아닙니다. 이미 마이크로소프트와 티모바일이라는 회사가 함께 만든 '사이드킥'이라는 핸드폰의 모든 정보가 초기화되어버리는 황당한 사고가 있었습니다. 사용자들은 특정 시간대까지 전원을 끄지 말라거나 하는 이상한 지시를 받았고, 그런 걸 알지 못한 채로 잃어버리는 사람이 수 천명에 달했습니다. 잃어버린 자료는 다시 되찾기가 불가능했고, 보상의 차원에서 10만원대의 티모바일 상품권을 보내는 것으로 마무리 지었습니다. (그렇게 자료를 잃은 사람이 티모바일 서비스를 다시 쓰고 싶기나 할까만은)
오픈마루 스튜디오에서도 "마이 아이디"라는 오픈 아이디 서비스를 제공하고 있습니다. 여러 사이트에 단 하나의 계정만으로 가입, 탈퇴가 가능한 서비스입니다. 그런데 이 마이 아이디가 잠시 접속이 되지 않은 일이 있었습니다. 마이 아이디 사용자들은 다른 모든 멀쩡한 서비스를 두고도 접속하지 못하는 황당한 일이 생겼죠. 그 오류는 오래 가지는 않았습니다만, 사용자와 각 서비스 운영자들에게 충격을 심어주기에는 충분했습니다. 오픈 아이디 서비스 공급이 중단되더라도 우회하는 길이 필요하다는 겁니다. 그것은 보안상 문제가 될 수가 있기에, 결국은 옛날처럼 사이트 자체에 계정 정보를 저장해야 한다는 말이 됩니다.
오픈 API라는 말, 한 번 쯤은 들어보셨을 겁니다. 앞으로 소프트웨어 서비스를 공개해서 누구나 쉽게 쓸 수 있겠다고 하는 겁니다. 그래서 새로운 소프트웨어가 이전 소프트웨어 서비스를 참고하게 되죠. 거꾸로 말하자면 오픈 API를 쓰면 외부 의존성이 아주 커집니다. 공급자가 버전 변경에 따라 동작을 변경하거나, 서비스를 잠시 중단하는 일은 종종 있습니다. 그러면 그 서비스에 의존하는 다른 프로그램에게까지 영향이 미치게 됩니다. 외부적 요인으로 소프트웨어를 믿을 수 없어진다는 말입니다.
이러한 부작용을 최소화하기 위해서는, 서비스간의 의존성을 잘 분리해야합니다. 하나의 서비스가 중단되는 일은 잦은데, 이로 인해서 다른 서비스들까지 연이어 중단된다면 또 다른 서비스가 중단될 겁니다. 이런 식으로 서비스 중단의 도미노 현상이 일어나지 않도록 의존성을 고려하여 잘 설계해야 합니다. 그리고 최대한 믿을 수 있고, 자신의 통제 하에 있는 서비스들을 쓰도록 노력해야 합니다. 자주 고장이 나는 일에 다른 사람이 고쳐주기만을 목이 빠져라 기다리는 것 만큼 바보짓은 없기 때문입니다.



덧글
Tristyn 2009/10/28 13:37 # 답글
이오공감 타고 왔습니다 ^^이러한 흐름을 보면 클라우드 컴퓨팅의 시대가 도래하고 있기는 있는가 보구나 싶습니다.
하지만 이 컴퓨팅의 잠재적인 폭탄은 지적하신 부분들이지요.
특히 사이드킥 사건은 클라우드 운용체계 Azur를 준비하고 있는 MS에게는 신용에 커다란 타격을 입은 셈이 되었지요.
가장 좋은 보험은 물리적으로 연결되지 않는곳에 백업을 하는 것이지만 서버농장을 무한대로 늘릴 수도 없으니
결국은 기술적인 문제로 보완되어야 할 부분이네요. 역시 편리한 것에는 그만큼의 리스크가 따르는 모양입니다.
최종욱 2009/10/28 16:34 #
네트워크화 되는 서비스들의 신뢰성을 어떻게 보장할 수 있을지 정말 궁금합니다.지금 영세한 업체들의 자료 관리 능력을 보면 정말 한숨만 나오는지라... ㅠㅜ
dhunter 2009/10/28 14:02 # 삭제 답글
아무리 잘 고려해도 '인증시스템' 에 대한 의존성을 없앨 수는 없으니, 인증시스템의 백업이 필요할텐데요.. 음.;
최종욱 2009/10/28 16:33 #
분명히 방법은 있을 것 같습니다. 언뜻 드는 생각에, 각 서비스 업체가 이용자 아이디, 그리고 (서비스 업체 아이디 + 비밀번호)의 해쉬값을 저장해놓는다면야 오픈 ID 제공업체가 없어져도 로그인까지는 될 겁니다. 그 로그인 이후에 다른 오픈 ID로 변경을 할 수 있도록 하면 그래도 좀 안전한 우회로가 되지 않을까 싶습니다.
Corund 2009/10/29 10:36 # 답글
포스팅 주제와는 좀 떨어진 이야기겠습니다만,클라우드 컴퓨팅 기술에서 가장 중요하게 연구되는 것 중 하나가 Availability 보장에 관한 거인 거 같습니다. 심지어는 이를 위해 일부 데이터의 Consistency 보장을 희생(?)시키기까지 하는 거 같더군요. 아직은 충분하지 않겠지만 기술의 발전은 놀라우니까 언젠간 되겠죠 :)
그전엔 포스팅 내용 대로 해야겠죠. Availability 보장에 대한 고려없이 데이터센터의 확장 정도로만 클라우드 컴퓨팅을 보는 업체도 있는 거 같습니다.
최종욱 2009/10/29 11:21 #
그렇죠. 시간이 지나면서 표준화가 되고, 가용성이 높아지지 않을까 싶습니다. 그리고 클라우드라는 용어 자체가 좀 '두리뭉실' 하기 때문에 아직 오해가 많다고 생각합니다. ^^; '단위 판매가 가능한 연산력' 쪽으로 봐야 하나 싶기도 하고...
방랑자 2009/11/08 03:52 # 삭제 답글
흠흠... 보셨나 모르겠지만 네이트온도 점검한다고 공지가 되어있었습니다.ㅁ 작업 시간 : 2009년 10월 28일 (수) 05:00 ~ 06:00 (1시간)
ㅁ 작업 내역 : 네이트온 쪽지/대화 서비스 점검
ㅁ 점검에 따른 영향 : 네이트온 쪽지/대화 서비스 일시 중지
(쪽지/대화 페이지 접속불가, 쪽지 발송 불가,네이트온에서 대화저장 불가)
최종욱님께서 말씀하신 통합 때문에 발생한 것인지는 모르겠지만, 여튼 갑작스런 것도 아니고 공지가 되어있었던 것이지요; 아, 저 공지된 시간보다 길게 했을 수도 있겠네요.
최종욱 2009/11/08 11:27 #
그렇군요. 아마 그 시간대는 아니였던 걸로 기억합니다만, 정확하지는 않네요. ^^;
방랑자 2009/11/09 00:14 # 삭제
수요일은 맞을겁니다. 그리고 시간대도 얼추 맞을 겁니다. 싸이월드 정기점검이 수요일 2시에서 7시정도니까요.