데이터 거버넌스와 프로세스 거버넌스

2 분 소요

거버넌스는 비즈니스에 대한 일련의 통제로, 금융·법률·윤리적 의무가 있습니다. 대표적인 예시로 개인정보 보호법이 있습니다. MLOps에서의 거버넌스데이터, 프로세스, 모델 3가지로 구분할 수 있습니다.


1. 데이터 거버넌스 (Data Governance)

데이터 거버넌스데이터 보안, 개인정보 보호, 정확성, 가용성, 사용성을 보장하기 위해 수행하는 모든 작업을 가리키며, 데이터 수집, 저장, 처리, 폐기 방법에 적용되는 내부 표준(정책)을 설정하는 것을 의미합니다. 따라서 데이터 거버넌스를 설정할 때 아래 4가지 질문에 답이 가능해야 합니다.

  1. 데이터 출처
  2. 원본 데이터 수집 약관(정책)
  3. 데이터 정확성
  4. 개인 식별 정보 혹은 민감 데이터 유무

모두 데이터 수집과 관련있는 질문이며, 절대 위 질문을 무시하고 데이터를 수집해서는 안됩니다.


2. 프로세스 거버넌스 (Process Governance)

프로세스 거버넌스는 MLOps 프로세스 내 각 단계를 공식화하고 관련 작업을 정의하는데 중점을 둡니다. 프로세스 거버넌스의 목적은 아래 2가지 입니다.

  1. 모든 거버넌스 관련 고려 사항이 정확한 시점에 이뤄지고 수행되는지 확인
  2. MLOps 프로세스 외부의 감독을 받을 수 있게 하고 현황을 추척하면서 기존 의사결정을 검토


3. 모델 거버넌스 (Model Governance)

모델 거버넌스는 책임있는 AI를 위한 내용으로, 더 많은 거버넌스가 요구되고 효과적인 구현을 위해 모델 리스크 관리(MRM)이 필요합니다. 국가별로 영국은 PRA(Prudential Regulation Authority) 규정에 MRM 4가지 원칙을 정의했고, EU는 AI의 신뢰성을 위한 핵심 요구사항 7가지를 정의하는 등 규정이 생기고 있습니다.

책임있는 AI의 핵심 요소는 데이터, 편향(Bias), 포괄성, 확장적인 모델 관리, 거버넌스가 있습니다.



본 게시글은 Introducing MLOps를 읽고 정리한 내용입니다.



Reference

댓글남기기