|
29일 과학기술정보통신부는 KT 네트워크 장애 사고와 관련해 정보보호, 네트워크 전문가들로 구성된 사고조사반과 브리핑을 열고 원인을 조사 및 분석한 결과를 발표했다.
과기정통부에 따르면 KT 통신장애는 25일 오전 11시 16분께 KT북부산국사에서 트래픽이 급증했으며 11시 20분에 KT 측에서 이러한 장애를 인지했다. 처음에는 급격한 트래픽 증가가 디도스(DDoS, 분산서비스거부공격)인지 사이버 공격으로 오해했으며, 이후 11시 40분께 KT측이 과기정통부에 신고를 했다. 오전 11시 44분께 라우팅 오류로 판단했고, 57분부터 복구를 시작해 12시 45분께 복구가 완료됐다고 설명했다.
이 과정에서 처음 11시 16분께 KT 협력업체 직원이 부산에서 기업망 라우터를 교체하던 중 이 라우터에 입력해야 하는 명령어 가운데 하나인 ‘exit(종료)’를 누락한 게 1차 원인이 된 것으로 나타났다. 잘못된 명령어가 입력된 라우터는 잘못된 데이터를 인근 라우터들에 전달하게 됐다. 이후 부산에서 전국으로 30초만에 오류가 전파된 것이다.
또한 KT가 라우터 교체 작업을 야간에 하기로 계획했지만 실제로는 주간에 이뤄졌으며 KT 본사의 작업 관리자 없이 협력사 직원들만 현장에 나가 수행했던 것으로 조사됐다.
과기정통부의 발표에 따르면 “KT 관리자와 협력사 직원들이 합의 하에 주간 작업을 결정했다”며 이유에 대해서는 “야간작업을 좋아하는 이들은 없기 때문에 그런 것으로 판단된다”고 설명했다. KT 관리자는 “다른 업무가 있었다는 이유로 자리를 비웠다”고 답한 것으로 조사됐다. 과기정통부는 결과적으로 KT의 작업관리체계가 부실했다고 설명했다.
아울러 기술적인 문제도 있었다고 설명했다. 작업자의 단순 실수로 인해 전국적인 피해가 벌어질 동안 KT는 아무런 사전검증을 거치지 않았고, 지역에서 발생한 오류가 전국으로 확산되는 걸 차단할 시스템도 없었다고 전했다.
과기정통부는 KT를 포함한 주요통신사업자의 네트워크 작업과 관리 체계를 점검하기로 했다. 네트워크 작업으로 인한 오류 여부를 사전에 전달할 수 있는 가상의 시뮬레이션 시스템, 야간에 하기로 한 작업을 주간에 한 것처럼 계획과 달리 작업이 이뤄지는 걸 감시하는 네트워크관제 체계를 마련하겠다는 계획이다.
또한 KT는 사고 직후 자사 홈페이지를 통해서만 통신장애 사실을 알렸다. 과기정통부는 “이것이 현행 법에 어긋나지는 않지만 문자 메시지 등 사람들의 접근성이 더 높은 수단으로도 고지할 수 있도록 제도를 개선하겠다”고 말했다.
과기정통부는 이번 조사결과를 바탕으로 주요통신사업자 네트워크의 생존성·기술적·구조적인 대책이 담긴 ‘네트워크 안정성 확보방안’을 마련할 계획이다. 방통위는 “통신장애 발생시 실효성 있는 피해구제를 위한 법령 및 이용약관 등 개선방안 마련을 검토할 계획”이라고 밝혔다.