본문 바로가기

STUDY/CISSP

[CISSP] Domain7_Security Operations (6/6)

6. BCP/DRP

 

 1. BCP/DRP 개요

  1.1 BCP(Business Continuity Plan) : 사업 연속성 계획

    - 비즈니스의 중단(Disruption)이 발생했을 때 일차로 비즈니스 운영(Operation)의 연속성(Continuity)을 확보하고
      전체 기능을 순차적으로 원상회복하기 위한 계획

    - 핵심적인 비지니스 기능이 복구시간목표(RTO) 내에 유지되거나 복구되는 것을 보장

    - 핵심적인 비지니스 기능들의 우선순위화된 재개에 초점을 두며 비지니스 지향적인 계획

 

  1.2 DRP(Disaster Recovery Plan) : 재해 복구 계획

    - BCP의 일부로 특정 비지니스 분야에 대한 복구 계획

    - IT DRP가 대표적인 사례로 IT지향적인 계획으로 간주

    - 재해의 발생 원인 : 인적(Human), 자연적(Natural), 환경적(Environmental)

 

  1.3 BCP와 DRP공통점:(1) 예방적 기능도 있으나 교정통제(복구통제)로 분류

                              (2) 위험 수용(Acceptance) 전략

                              (3) 목적은 조직의 연속성(Continuity) 확보 -> 가용성

                              (4) 대상은 통제를 가하고도 남아 있는 잔여 위험(Residual risk) 이다.

                              (5) 대외비(Confidential)로 관리해야 한다.

 

  1.4 장애 정도와 대체처리 설비 활용 필요 여부

    - Non-Disaster : 중단시간 짧음 / 정보처리시설 정상 / 대체 설비 이용 안함

    - Disaster : 하루이상 중단 / 정보처리시설 손상가능 / 대체 설비 필요

    - Catastrophe : 장기 중단 / 정보처리시설 완전파괴 / 대체 설비 필요

 

  1.5 대체처리 개념

    - Original Site > Alternative Site > Interim Site > New Home Site

    - Original site : 재해 전부터 사용되는 일차 사이트

    - Alternative Site : 일차사이트 중단 시 임시 사이트

    - Interim Site : 일차 사이트로 이관 전 경유 사이트

    - New Home Site : 재해 후 새로 건설한 일차 사이트

 

    - 활동

     > Recovery : 재해로 영향을 받은 기능의 체계적 회복 과정

     > Resumption : 백업사이트에서 핵심 기능 복구와 재시작

     > Reconstitution : 중단된 일차 사이트 기능의 정상화 과정

     > Reconstruction : 새로운 위치에서의 일차사이트 구축

     > Restroration : 일차 사이트에서의 기능의 정상화 및 재시작

     => Disaster는 언제 끝? 원상회복=Restoration

 

    - 각종 시간지표

     > MTD(Maximum Tolerable Downtime : 최대 허용 가능 중단 시간) : 재해 영향을 견딜 수 있는 최대 시간

     > RTO(Recovery Time Object : 복구 시간 목표) : 기능이 반드 시 복구되어야 하는 시간

     > RPO(Recovery Point Object : 복구 시점 목표) : 데이터 손실 최대 허용량 -> 백업주기 관련

     > RP(Recovery Perio : 복구 시간) : 실제 업무 가능 복구까지 걸린 시간

     > MTD = RTP + WRT(Work Recovery Time : 수작업 복구 시간)

     > RTO는 IT복구 목표 시간, WRT는 업무수행 가능 목표 시간

     > RTO=<MTD /  백업주기 =< RPO /  RPO=0 -> 실시간 백업

 

    - 단계별 팀의 역할 정리

     1) 비상조치 단계

      > 비상조치팀 : 초기 대응(인명 구조 -> 피해 확산 방지(복귀 범위 최소화), 재해공지/(증거 수집 염두 하지 않음)

      > 피해평가팀 : 원인 조사 -> 1차 피해 평가 -> 재해 선언 -> BCP/DRP 가동(activation)

     2) 복구 단계

      > 비상관리팀 : 전문화된 여러 하위 팀들의 역할 조율, 핵심업무재개, 상세 피해 평가

     3) 재구성 단계

      > 구호 팀 : 상세 피해 평가 -> 원상 회복 전략 수립 -> 1차 사이트로 이관 지휘 -> 재해 종료 선언

      > 재배치 팀 : 1차 사이트로 이관 업무 수행

      =>복구활동 단계가 아닌것은? : 피해 확산 방지

 

    - 용어

      > COOP(Continuity of Operation Plan) : 조직의 필수적/전략적 기능을 대체 사이트에서 30일 이상 유지 절차

      > Cyber Incident Response Plan : 악성사이버 사건의 탐지/대응 확산방지에 대한 절차제공

      > OEP(Occupant Emergency Plan) : 물리적 위협으로부터 인명피해 최소화 자산보호 통합절차 제공

 

 

 2. BCP/DRP 수립 단계

   1) BCP/DRP 프로젝트 착수 : 임무역할, 권한 할당을 위한 가이드라인을 제공할 정책

   2) 사업 영향 분석(BIA:Business Impact Analysis) 수행 : 핵심 기능 수행관련 자산 식별 / 복구우선순위 개발

   3) 예방통제 식별

   4) 복구전략 개발 : 시스템과 중대한 기능들이 Online으로 즉시 옮겨질 것을 보장하는 방법 공식화

   5) 연속성 계획 개발

   6) 계획 테스트 및 훈련과 연습수행

   7) 계획의 유지관리 : BCP 유효성 정기적 갱신과 유지보수

 

  2.1 BCP/DRP 프로젝트 착수

   1) 의의

    - 프로젝트 범위, 멤버의 역할, 프로젝트 목표 등을 설계

    - 고위 경영진과 이사회의 전폭적인 지원이 관건

    - 고위 경영진(Senior management) : 모든 단계의 궁극적인 책임 -> 복구우선순위 결정

 

   2) 수행단계

    - 경영진의 지원 결심(Top-down Approach)

    - 업무 연속성 코디네이터(Business Continuity Coordinator) 설정 : BCP 팀의 리더, BCP/DRP 개발 및 구현, 테스트를 감독

    - BCP 위원회 구성 멤버 : 고위 경영진(Senior management), IT부서, 보안부서, 통신부서, 법률부서

    - 연속계획정책선언문(Continuity Planning Policy Statement) : BCP팀이 경영진과 함께 개발

 

 

  2.2 사업 영향 분석(BIA:Business Impact Analysis)

   1) 의의

     - Business Impact Assessment라고도 함

     - 업무중단이 사업에 미치는 영향에 대해 정성적/정량적 분석평가

     - 목적 : RTO/ 복구우선순위 결정

 

   2) 수행단계

     (1) 조직의 전체 업무 프로세스 구성 파악

     (2) 핵심 업무 프로세스와 Work Flow 식별

     (3) 핵심 프로세스에 필요한 자원 식별

     (4) 업무 중단으로 인한 영향의 정성적/정량적 평가 -> 위험분석     => (정량적 : 돈 영향), (정성적 : 신용도)

     (5) 최대 허용 중단 시간(MTD) 산정

     (6) 복구 목표 시간(RTO) 및 우선순위 결정

     (7) 의존성 분석을 통한 우선순위 조정

     - 상호의존성(Interdependencies)

      > 기술적 관계 의존성 분석

      > 우선순위가 높은 기능을 지원하는 자원의 복구 우선순위를 상향 조정

 

 

  2.3 복구 전략 수립

   1) 의의

     - BIA는 복구 전략의 청사진을 제공

     - BCP위원회는 BIA에서 식별된 위협에 대한 복구전략을 비용효과분석을 통해 발견

     - 복구전략을 정의하고 문서화

     - 대체 처리 시설, 하드웨어 및 장비의 가용성, 데이터 백업 정의

     - Alternative Site로 기능이 이관되서 용량이 작아지더라도 핵심 기능은 수행해야함(Resumption)

 

    2) 대체 처리 시설

     - 동일한 재해 지역을 벗어난 곳에 위치해야 한다.

      > 일반 : 최소 5마일

      > 하위-중간 : 최소 15마일

      > 핵심 운영 : 50~200마일

 

      (1) 상호 지원 계약(Mutual Aid Agreement, Reciprocal Agreement)

        - 유사한 장비나 응용시스템을 가진 두 개 이상 조직간 계약으로 설비와 서비스 시간 제공을 약속

        - 장점 : (1) 비용이 가장 저렴

                   (2) 특수 장비를 이용하는 경우 유일한 대안

        - 단점 : (1) 계약 이행을 강제할 수 없다

                   (2) 용량 문제

                   (3) 호환성 문제

      (2) 상호 구독 서비스(Commercial subscription services)

         - 일정 비용을 지불하고 유사 시 정보처리 시설을 임대하여 사용

         - 가용성 수준에 따라 Hot, Warm, Cold Site로 구분 //(전체 사이트 HVAC기본)

          > Hot Site : 몇 시간 내 운영이 가능하도록 모든 시설과 장비, 데이터 백업 본 존재

             장점 : 가장 신속한 대체 운영 가능(신속한 가용성)

             단점 : 고비용, 데이터로 인한 보안적인 문제(유지비용 고가, 보안문제)

          > Warm Site : 데이터를 제외한 고가의 장비와 시설, 응용프로그램만

             장점 : Hot보다 저렴 및 유지관리 용이(시간/비용 중간)

             단점 : Hot보다 대응속도 느림

          > Cold Site : 정보처리시설을 운영하기 위한 환경만 구축

             장점 : 구축 시 최소 비용(유지비용 저렴)

             단점 : 운영 준비시간이 길고, 테스트가 곤란(운영준비가 긺)

      (3) 자체 핫 사이트

      (4) 이중사이트(redundant site)

         - 미러링 사이트

         - 가용성이 가장 우수하나 고비용 및 구성관리 어려움

      (5) 제 3의 사이트(Tertiary Site) -> backup to the backup

         - 1차 백업시설 무용지물에 대한 대비책으로 2차 백업 사이트

      (6) 서비스 뷰로(Service bureau)

         - 자체 정보처리 설비를 갖추고 정보처리서비스만 제공하는 벤더이용

         - Hot Site 대표적인 상품

      (7) 다중처리 센터(multiple processing centers)

         - 가용 자원의 공유와 중복을 제공하는 분산시스템 접근법

         - 시스템을 여러곳으로 분산

      (8) 이동식 핫 사이트(Rolling/Mobile Hot Site) : 대형 트럭이나 트레일러 이용

      (9) 조립식 건물(Prefabricated Building) : 컨테이너 또는 조립식 건물 이용한 Hot Site

 

    3) 하드웨어 가용성 개선

     - MTBF(Mean Time Between Failures) : 평균 고장 간격 시간

      > 신뢰성(Reliability) 척도

      > 길수록 좋다

      > MTBF=MTTF(실제가동시간 높아야함)+MTTR(평균 수리 시간 낮아야함)

     - MTTR(Mean Time To Repair) : 평균 수리 시간

      > 유지보수성(Maintainability) 척도

      > 짧을수록 좋다

     - Legacy System과 H/W대신 상용규격품(COTS) 사용이 유리하다.

     - On-Site와 Off-Site 전략에서 마련되어야 한다.

 

    4) 데이터 백업

     (1) 격지 저장소

      > 원격 라이브러리 또는 스토리지등 장소가 별도로 마련

      > 1차사이트 또는 2차사이트와 별개의 장소

     (2) 백업 주기의 결정

       > 실시간, 일간, 주간, 월간 백업

       > 주기적으로 백업에 소요되는 비용

       > 백업을 하지 않아 데이터 유실 비용

       > 백업주기가 길어지면 백업 비용감소, 데이터 유실비용 증가

     (3) 백업 방식

      - 전체백업(Full Backup) : 변경이 없어도 전체 백업

      - 차등백업(Differential Backup) : 전체 백업 후 변경된 모든 것 백업 (누적)

      - 증분백업(Incremental Backup) : 변경된 것만 백업

       > 백업시간(F>D>I), 복구속도(I>D>F), 매개수(F<I)

      - 3세대 백업(Three-Generation backup)

       > 3가지 백업 주기 병행(Son-일간, Father-주간, Grand-Father-월간)

       > 매체 순환을 통하여 백업매체를 효율적으로 활용, 증분백업방식

 

    4) RAID(Redundant Arrays of Inexpensive Disks)

      (1) Striping(=Disk interleaving)

        > 분산 저장 -> 저장시간 단축

        > round-robin

        > 입/출력속도 향상

        > 디스크 고장시 복구 불가

      (2) Mirroring

        > 중복저장

        > 고장감내(Fault tolerance) 제공

        > 입/출력 속도 향상 없음( cf.출력 속도 향상가능)

        > 저장 공간이 많이 소요됨

        > 디스크 고장시 복구 가능

      (3) Parity

        > 다른 디스크데이터에서 계산한 오류 검증데이터

        > 고장감내 제공(미러링보다 구림), 데이터 중복 불필요

        > 저장 공간이 미러링보다 적음

        > 입/출력 속도 향상 없음

        > 미러링 용량 문제 해결, 디스크 1개 더추가

 

Level

Striping

Mirroring

Parity

0

O

 

 

1

 

O

 

10

O

O

 

4

Block

 

전용하드디스크

5

Block

 

분산

6

Block

 

이중분산

 

    5) 이중화

      - 발전과정

전통적백업

Offline + Batch

전자금고(Electronic Vaulting)

Online + Batch

원격저널링(Remote Journaling)

Online + Realtime(트랙잭션파일만)

디스크미러링(Disk Mirroring)

Online + Realtime(마스터파일)

      - 백업방법에 따른 데이터 손실 가능성(전통>전자>저널링>미러링)

 

    6) 용량확장

      (1) 직접연결 스토리지(DAS: Direct Attached Storage)

        - 저장할 데이터와 늘어나는 데이터가 한 공간에 존재 -> 편리함

        - 데이터 전송속도가 떨어짐

      (2) 네트워크연결 스토리지(NAS: Network Attached Storage)

        - 자체 운영체제(리얼타임 OS)

        - LAN을이용 IP주소 부여

        - 저비용 고성능

      (3) 저장소 영역 네트워크(SAN: Storage Area Network)

        - 분산 Storage간 대용량 데이터 전송

        - 새로운 망 구축

        - 고가, OSI7계층 해당

 

  2.4 연속성 계획 개발

   - 문서화 및 실행 (상세 방법 및 절차를 가이드라인, 문서화)

   - BCP의 일반적인 골격 (기획 단계, 가동 단계, 복구 단계, 재구성 단계, 추가사항=연락체계(Calling tree data, 비상연락망)

   - 비상연락망 범위? 본사/지사 핵심직원 

 

  2.5 BCP/DRP 테스트 시 고려사항

   - 테스트 목적 : 개선사항, 약점 발견하기 위해

   - 사전에 공지, 최악의 상황 고려, 정성적/정량적 평가, 최소 1회 수행

    (1) 문서 테스트

      > 체크리스트 : 부서장이 주도하여 부서별 점검목록을 이용 점검

      > 구조적 워크스루 : 부서 대표자들이 워크숍 방식으로 준비상황 점검

    (2) 준비성(Preparedness) 테스트

      > 시뮬레이션 : 2차 사이트로 재배치까지 수행 (실제 정보처리는 하지 않음)

      > 병행 테스트(Parallel Test) : 1, 2차 사이트에서 업무를 실제로 수행한 후 양 사이트 업무 결과 비교

    (3) 완전 중단(Full interruption) 테스트

      > 1차사이트 중단하고 2차 사이트에서 업무처리 -> 만약을 위한 대책을 수립해야함

 

  2.6 BCP/DRP 유지관리

    - 계획이 노후화된 원인

     > 업무 프로세스 변경, 조직 개편, 휴업, 합병 등으로 자주 업데이트 필요

     > 인프라구조, 환경변화, 장비 변경, 계획 수립후, 인력 이직, 많은 작업 등

    - BCP/DRP 유지보수 촉진 방안

     > 유지 관리 책임자를 지정한다.

     > 내부 감사를 실시한다.

     > 정기적인 훈련과 테스트를 실시한다.

      => BCP/DRP 수명기간중 가장 긴 단계? 유지관리 단계

      => BCP/DRP 마지막 단계? 유지관리 단계

      => BCP/DRP 수명을 연장하는 좋은 방법은? 유지관리 단계