K-SMARTFACTORY

AI & Big Data

AI의 편향성과 불공정성(bias and unfairness) 해결 방안

2022-09-26

편향성 없이 결론에 이르는 과정을 설명할 수 있는 인공지능(AI)을 실현하고자 하는 노력은 칭찬받을 만하지만 넘어야 할 장벽이 한 두 가지가 아니다. AI의 공정성은 수집된 데이터에 크게 의존하기 때문이다.

AI의 편향성과 불공정성 배제가 문제가 되고 있는 가운데 테크놀로지 분야 리더들은 AI에 대하여 보다 책임 있는 접근법에 주력할 필요가 있다는 점에 이제서야 의견의 일치를 보이고 있다

Appen이 최근 공개한 보고서 State of AI and Machine Learning Report 2022 상황 리포트에서, 데이터가 고객이나 시장, 기회에 관련된 의사결정의 역할이 점점 커지고 있는 가운데 그 데이터에 대한 우려가 높아지고 있다는 의견이 제시되고 있다. 또, 자사가 보유하고 있는 데이터가 사람들과 커뮤니티, 기업에 문제를 초래할 수 있다는 인식을 이들 리더들이 가지고 있는 것도 시사되고 있다. 이 보고서는 The Harris Poll의 협력을 얻어 504명의 IT 간부를 대상으로 실시한 조사이다.

그러나, McKinsey의 2021년 조사에서는, AI를 가장 전향적으로 추진하고 있는 기업이라 하더라도 대다수는 AI에 의한 편향성을 배제하기 위한 방안을 아직 강구하고 있지 않은 것으로 밝혀졌다.

일례로 표면화되지 않은 숨겨진 특성이나 특질을 찾아내기 위해 트레이닝 데이터나 테스트 데이터를 정밀 조사한다고 답한 수는 절반도 못 된다(47%).

또, 데이터 수집 단계에서, 왜곡하거나 편견이 있는 데이터의 유무를 자사의 데이터 프로페셔널이 적극적으로 체크하고 있다고 대답한 응답수도 비슷한 비율이었다. 반면 데이터 프로페셔널이 그러한 데이터를 모델 개발의 여러 단계에서 적극적으로 체크하고 있다고 답한 응답수는 36%에 그쳤다.

Appen의 조사에서는 고품질의 데이터 조달이 AI를 실현하는데 있어서의 장벽이 되고 있음을 시사하고 있다. 과반수(51%)의 응답자가 데이터 정확도는 자사의 AI 활용 사례에서 중요하다고 답했지만 데이터의 정확도 고도화(90% 초과)를 달성했다고 밝힌 응답자는 6%에 불과했다.

이 회사의 최고경영자(CEO) Mark Brayan은 많은 사람들이 빈약한 데이터 셋을 이용해 뛰어난 AI를 구현하려다 난제에 직면해 있다고 말했다. 또 이 회사 웹페이지에는 "제대로 된 AI 모델을 구축하려면 정확하고 고품질의 데이터가 필요하다. 유감스럽게도 비즈니스 리더나 테크놀로지스트들은 데이터의 정확성이라는 문제에 몰두하는 가운데 이상과 현실 사이의 큰 갭에 직면해 있다고 말하고 있다"고 적혀 있다.

그러나, Appen의 조사에서 기업이 「책임 있는 AI」에 보다 힘을 기울이며 추진 하려고 하는 것으로 나타나고 있다.

Appen의 엔터프라이즈 솔루션 담당 바이스 프레지던트이자 이 보고서의 저자인 Erik Vogt 씨는 데이터 윤리는 옳은 일을 하는 데 그치지 않는다.

콘트리뷰터에서부터 컨슈머까지의 가치사슬에 연관되어 있는 모든 사람들의 신뢰와 안전을 유지하는 것도 중요하다고 밝혔다. 그리고 거의 모든 응답자(93%)가 책임 있는 AI를 실현할 필요성이 있음을 확신한다고 밝혔다.

응답자들은 편향성 및 불공정성 제거에 연결되는 보다 포괄적인 데이터 셋 구현을 위해 AI 프로젝트에서 사용하는 데이터의 품질 향상에 주력하고 있다고 답했다. 또 응답자 10명 중 8명은 데이터의 다양성이 매우 중요하다고 답했으며, 95%는 포괄적인 데이터 셋 구현에 있어 합성 데이터가 중요한 역할을 한다는 데 동의했다.

이렇게 하는 것은 물론 말하기는 쉽지만 실행하기는 어렵다. 적어도 테크놀로지스트의 42%는 AI의 라이프사이클에 있어서 데이터의 수집 단계가 특히 어려운 단계라고 답하고 있다. 또 90%는 최소 3개월에 한 번씩 모델을 재훈련하고 있다고 답했다.

이는 전체적인 AI 연결 고리에 사람과 관련 있는 인간계통을 포함시켜야 할 필요성을 의미한다. ML 프로세스에 인간계를 포함하는 것의 중요성에 대해서는 많은 사람이 동의하고 있으며 81%는 상당히 중요하다, 97%는 정확한 모델을 구현하는 데 인간계를 포함한 평가가 중요하다고 답했다.

흥미롭게도 AI 과제의 이해에 관해서는 데이터 사이언티스트와 비즈니스 리더 사이의 간극이 시간이 지날수록 조금씩 좁혀지고 있다.

Appen의 데이터 사이언스 담당 바이스 프레지던트이자 이 리포트의 저자인 Mingkuan Liu씨는 「AI 모델의 성공을 향한 과제 해결을 위해서는 팀이 하나가 되어 추진해야 하는데, 데이터 특히 애플리케이션의 시나리오와 일치되는 고품질 데이터의 중요성을 강조하여야 한다」고 지적하고 있다.

출처 : zdnet