요구사항 13. 인공지능 시스템의 안전 모드 구현 및 문제발생 알림 절차 수립

1. 인증 기준

인공지능 시스템에 발생할 수 있는 안전성 문제 중 일부는, 시스템 측면에서 안전 모드를 구현하고 문제 발생 알림 절차를 수립하는 것으로 해결할 수 있습니다. 데이터 중독, 모델 추출, 모델 전도 공격 등에 대한 시스템 차원의 방어 대책과, 운영자에게 문제발생을 알리는 절차 등이 구현되어야 합니다.

2. 평가 개요

구분내용

평가대상

인공지능 시스템

평가방법

문서‧절차 검사

주요 확인사항

• 안전 모드 작동 기준 및 조건을 확인합니다.

• 안전 모드 작동 시 시스템의 동작 상황을 확인합니다.

• 안전 모드 해제 기준 및 절차를 확인합니다.

• 문제 감지 절차 및 식별 방법을 확인합니다.

• 알림 방식 및 내용을 확인합니다.

• 알림 수신자 및 사람의 개입 시 그 역할을 확인합니다.

3. 평가 세부 설명

3.1 신뢰 속성

  • 보안성 및 회복탄력성: 안전 모드가 시스템을 견고하게 유지하기에 충분한 기능을 갖추는지 확인합니다.

3.2 관련 프로세스 및 양식

  • 침입 탐지 시스템(Intrusion Dection Ssystem, IDS): 네트워크 트래픽, 의심스러운 활동, 보안 정책 위반 등을 탐지

  • 침입 방지 시스템(Intrusion Prevention System, IPS): 네트워크 트래픽에서 잠재적인 위협에 자동적으로 차단조치를 수행하고 관계 보안팀에 알림

  • 데이터 중독 공격: 의도적으로 악의적인 학습 데이터를 주입해 모델을 망가뜨리는 공격

  • 모델 추출 공격: 입력값과 결괏값을 분석해 모델을 추출하는 공격

  • 모델 전도 공격: 여러 질문(query)를 시도한 결과를 통해 학습 데이터를 추출하는 공격

4. 평가 증빙

증빙 문서포함 내용

시스템(보안) 아키텍처 문서

-

문제 발생 대응 절차서(이상 처리, 장애 대응 절차서)

-

사용자 매뉴얼

-

테스트 리포트

-

서비스 성능 분석 기록

-

위험관리 계획서

• 윤리 문제 분석 내용

5. 관련 문서

6. 추가 고려사항

  • 시스템의 특성 및 활용 분야를 고려하여 안전 모드 돌입 방식 등을 정의해야 합니다.

  • 생성형 AI의 환각 문제를 해결하기 위해서는 사용자의 의견 전달 기능을 통해 관련 피드백을 수용하는 것이 중요합니다.

7. 사례

[1] 이상데이터 확인 프로세스를 구축하여, 데이터 중독 및 모델 회피 보호 시스템을 구축하고, 관련 내용을 로그로 기록하여 보안팀에 전달함을 확인

Last updated