요구사항 3. 인공지능 시스템의 신뢰성 테스트 계획 수립

1. 인증 기준

인공지능 시스템(AI)의 신뢰성을 테스트하기 위한 계획 수립해야 합니다. 신뢰성 테스트 계획은 대상 AI 시스템의 특성을 고려하고, 테스트 목표를 달성하기에 충분한 범위를 포괄해야 합니다.

2. 평가 개요

구분내용

평가 대상

인공지능 모델, 인공지능 시스템

평가 방법

문서‧절차 검사

주요 확인사항

• 테스트를 통해 달성하고자 하는 목표를 명확하게 정의 하였는지 확인합니다.

• 테스트 대상이 되는 AI 시스템의 기능과 범위가 명확하게 정의되어 있는지 확인합니다.

• 테스트를 수행하는 데 사용할 방법론(평가기준 포함)이 정의되어 있는지 확인합니다.

• 테스트를 수행할 환경이 정의되어 있는지 확인합니다.

• 테스트를 수행하는 데 사용할 데이터가 정의되어 있는지 확인합니다.

3. 평가 세부 설명

3.1 신뢰 속성

  • 안전성: 대상 시스템이 사용되는 분야의 위험도를 고려해야 합니다.

3.2 관련 프로세스

  • 레드티밍: 기술의 기능, 한계, 개선 방법을 파악하기 위해 의도적으로 기술의 안전 장벽을 허물고자 하는 시도로써, 벤치마크 및 적대적 테스트와 같은 기존 모델 거버넌스를 강화합니다. 특히, 생성형 인공지능처럼 평가의 지표 및 유효성이 개발중인 분야에 유용합니다.

4. 평가 증빙

증빙 문서포함 내용

시험 계획서

-

테스트 데이터

-

테스트 리포트

-

소스코드 일부

• 시험용

사용자 평가 수행 이력

• 사용자 평가단 명단 (없으면 모집기준)

• 사용자 평가 질문 문항

5. 관련 문서

6. 추가 고려사항

  • 테스트 대상 인공지능에 적용되는 관련 규제 및 표준을 파악해야 합니다.

  • 테스트는 인공지능을 개발한 조직과 독립적인 조직에서 수행하는 것이 바람직합니다.

  • 인공지능은 지속적으로 업데이트되므로 테스트도 지속적으로 수행되어야 합니다.

7. 사례

[1] 테스트 시 실제 사용 환경에서 사용자가 업로드하는 영상을 테스트 데이터로 사용하고, 영상을 대상으로 전문가의 평가와 시스템의 추론 결과를 비교하여 그 유의성을 검증

Last updated