데이터 거버넌스와 프로세스 거버넌스
거버넌스는 비즈니스에 대한 일련의 통제로, 금융·법률·윤리적 의무가 있습니다. 대표적인 예시로 개인정보 보호법이 있습니다. MLOps에서의 거버넌스는 데이터
, 프로세스
, 모델
3가지로 구분할 수 있습니다.
1. 데이터 거버넌스 (Data Governance)
데이터 거버넌스란 데이터 보안
, 개인정보 보호
, 정확성
, 가용성
, 사용성
을 보장하기 위해 수행하는 모든 작업을 가리키며, 데이터 수집
, 저장
, 처리
, 폐기 방법
에 적용되는 내부 표준(정책)을 설정하는 것을 의미합니다. 따라서 데이터 거버넌스를 설정할 때 아래 4가지 질문에 답이 가능해야 합니다.
- 데이터 출처
- 원본 데이터 수집 약관(정책)
- 데이터 정확성
- 개인 식별 정보 혹은 민감 데이터 유무
모두 데이터 수집과 관련있는 질문이며, 절대 위 질문을 무시하고 데이터를 수집해서는 안됩니다.
2. 프로세스 거버넌스 (Process Governance)
프로세스 거버넌스는 MLOps 프로세스 내 각 단계를 공식화하고 관련 작업을 정의하는데 중점을 둡니다. 프로세스 거버넌스의 목적은 아래 2가지 입니다.
- 모든 거버넌스 관련 고려 사항이 정확한 시점에 이뤄지고 수행되는지 확인
- MLOps 프로세스 외부의 감독을 받을 수 있게 하고 현황을 추척하면서 기존 의사결정을 검토
3. 모델 거버넌스 (Model Governance)
모델 거버넌스는 책임있는 AI를 위한 내용으로, 더 많은 거버넌스가 요구되고 효과적인 구현을 위해 모델 리스크 관리(MRM)이 필요합니다. 국가별로 영국은 PRA(Prudential Regulation Authority) 규정에 MRM 4가지 원칙을 정의했고, EU는 AI의 신뢰성을 위한 핵심 요구사항 7가지를 정의하는 등 규정이 생기고 있습니다.
책임있는 AI의 핵심 요소는 데이터
, 편향(Bias)
, 포괄성
, 확장적인 모델 관리
, 거버넌스
가 있습니다.
본 게시글은 Introducing MLOps를 읽고 정리한 내용입니다.
댓글남기기