언론을 통해 많이 보도된 것과 같이, 이루다 서비스의 제공 과정에서 성희롱적 발언과 함께 성소수자라든가 장애인 등 우리 사회의 소수자 그룹에 속하는 사람들에 대한 차별적이고 혐오적인 발언이 등장하여 논란이 된 바 있다. 이루다는 채팅 서비스다. 기술적 관점에서 이루다의 가장 큰 성취는 자연스러운 대화다. 자연스러운 대화가 가능했던 가장 큰 이유는, 당초 인공지능 챗봇 모형을 개발하는 단계에서 학습 데이터를 구축하여 1단계 학습을 진행한 후에 2단계로 ‘응답 데이터베이스’를 이용하여 검색retrieval-based 모형을 활용한 것이 배경에 있는 것으로 보인다. 자연스러운 대화의 구현이라는 면에서는 기술의 완성도가 상당히 높았던 반면, 사회적 맥락에 대한 고려 측면에서는 이용자들의 기대에 비해 부족함이 있었다.

메신저 대화는 구조화된 데이터가 아니라는 의미에서 비정형 데이터unstructured data라고 부른다. 그런데 비정형 데이터는 정형 데이터structured data에 비해서 익명처리가 훨씬 복잡한 것이 보통일뿐더러 익명 처리를 하더라도 충분한 익명처리가 되었는지에 관해 확인하거나 보장하는 것이 거의 불가능하다는 한계가 있다.

알고리즘의 부작용을 강조하는 시각에서는, 추천 알고리즘으로 인해 이용자들이 편향적 사고에 빠지게 되면서 이른바 필터 버블filter bubble이나 확증편향confirmation bias에 빠지게 된다는 주장이 반복적으로 나타난다.

인공지능의 작동방식에서는 '레이블이 잘된' 데이터가 핵심적으로 중요하다. 레이블링을 어떻게 하느냐에 따라 결과값이 크게 달라질 수 있기 때문이다. 하지만 만일 동그라미와 세모만으로 레이블링된 데이터를 학습하여 인공지능 모형이 만들어진다면, 그러한 인공지능은 '네모'의 특징을 분간해내지 못한다. 

주요 플랫폼은 구독 모델을 전제하지 않는 한, 이 회사들의 핵심적 수입원은 광고다. 특히 이용자들의 특징이나 선호에 대한 분석을 전제로 한 맞춤형 광고가 중요하다. 그래서 이용자들에 대한 데이터를 프로파일링하는 것이 인터넷 플랫폼 생태계에서는 필수적인 것이 된다. 이는 인터넷 공간에서의 무료 서비스 제공과 함께 나타나는 동전의 뒷면 같은 것이다.

정보를 수집하는 입장에서는 스마트폰 이용자의 동일성을 파악하여 일관성 있게 정보를 수집하는 것이 중요하다. 따라서 일종의 일련번호(안드로이드 시스템에서는 ADID advertising identifier, 애플 시스템에서는 IDFA identifier for advertisers)를 부여하여 이용자나 기기를 파악하고 이를 통해 동일 이용자에 대해서 체계적으로 정보를 수집하기 위한 시도를 하게 된다. 

인터넷을 통한 정보 수집에서는 인터넷 쿠키가 매개가 된다. 이는 ADID나 IDFA와 유사한 역할을 한다.

메타버스, 특히 그중 가상현실 기술을 이용하는 것에 관해 몰입 기술이라는 표현이 쓰이기도 하는데, 이는 이용자가 메타버스에서 활동하는 동안 엄청난 양의 데이터를 생성한다는 뜻으로 해석될 수도 있다.  

인터넷을 매개로 활동하는 회사들 중 플랫폼 기업이 많다. 플랫폼 기업은 양면 시장 서비스를 제공하는 경우가 적지 않다. 어떤 경우건 플랫폼으로서는 이용자들을 충분히 확보하는 것이 중요하다.

'데이터 이동권'에 대한 강조를 통해 개인이 자신에 관한 개인정보의 통제권한을 강화하도록 하는 움직임도 있다. 유럽의 개인정보 보호법인 GDPR에 이에 관한 규정이 도입되면서 우리나라에서도 데이터 이동권에 대한 전반적인 관심이 늘어나고 있다. 현재 우리나라에서는 금융 영역에 도입된 '마이데이터'라는 제도(금융정보의 주체인 개개인이 자신에 관한 개인신용정보를 자신이 지정하는 기관에 전송하도록 요구할 수 있는 권리)가 있다. 

추천 알고리즘과 관련하여 국내에서 주기적으로 사회적 또는 정치적 논란이 발생하게 되는 영역 하나는 인터넷 플랫폼을 통해서 뉴스를 보게 되는 메커니즘과 관련된 것이다. 넓게는 콘텐츠 기반 필터링content-based filtering이라는 방식과 협업 필터링collaborative filtering이라는 방식이 있다. 먼저 콘텐츠 기반 필터링 방식은 사용자의 특징이나 선호에 관한 프로필을 만든 뒤에 이를 주어진 데이터베이스에 담긴 콘텐츠의 속성과 매치해서 추천하는 방식이다. 그리고 협업 필터링 방식은 유사한 속성을 가진 사용자들 사이의 선호나 취향에 관한 데이터를 추출하여 예측하는 방식이다. 

인공지능의 제일 일반적이고 중요한 용도는 데이터를 분류해내는 것이다. 이때의 분류classification는, 예를 들어 다양한 특징을 보이는 데이터가 있을 때 이를 몇 개의 그룹으로 나누어 판단하는 것을 의미한다. 그리고 이같은 분류는 그룹별로 차등적 결과가 나타날 수 있음을 암시하는 것이기도 하다. 

우선 법적 개념 구분으로 보면 차별은 직접 차별과 간접 차별로 구분할 수 있다. 그리고 직접 차별은 선호에 기초한 차별과 통계적 차별(통계치를 근거로 삼아 행하는 차별)로 추가적 구분을 하기도 한다. 이와 같이 선호에 기초한 차별과 통계에 기초한 차별은 개념적으로는 구분되는 것이지만 실제 상황에서는 구분이 어려울 수 있다. 종종 단편적이거나 편향된 경험을 객관적 통계로 인식하고, 이로부터 선호에 기초한 차별을 하는 것이다. 간접 차별은 판단 기준 값(threshold value)을 설정하기 어려워 직접 차별보다 그 판별이 더 어렵다. 

학습 데이터의 첫 번째 문제는 통계적인 한계의 가능성이다. 이는 모집단, 즉 실제 세상의 데이터를 학습 데이터가 통계적으로 충실하게 반영하지 못할 가능성에 관한 것이다. 두 번째 문제는 학습 데이터가 많은 경우에 과거의 상황에 기초한 데이터라는 것이다. 세 번째 문제는 데이터 레이블링 자체에 오류나 한계가 있을 수 있다는 점이다. 네 번째 문제는 레이블 누락의 가능성이 있다는 점이다. 

인공지능 차별에 관한 마지막 이야기는 차별의 악순환에 관한 것이다. 이는 인공지능을 활용한 예측값이 특정 방향의 경향성을 띠게 되고 점차 이러한 경향성이 강화하게 될 가능성을 말한다. = Feedback loops, Self-fulfilling prophecy

인공지능 유형 중 간단하고 투명한 유형으로 의사결정나무를 이용한 것을 들 수 있다. 의사결정나무를 이용한 모형은 구조가 투명해서 설명가능성이 높은 한편, 딥러닝 모형은 여러 레이어를 두고 의사결정을 하기 때문에 대체로 설명가능성이 높지 않다. 대체적으로 투명성이 높은 모형들은 성능이 떨어지는 경향이, 투명성이 낮은 모형들은 성능이 좋은 경향이 있다. 

개인정보보호와 프라이버시는 어떤 관계인가 생각해보자. 어느 한 개념이 다른 개념에 온전하게 포섭되는 것으로 보기는 어렵다. 다만 개인정보보호를 강조하는 이유는 프라이버시의 보호가 주요 목적인 경우가 많다고 개략적으로 말할 수 있다. 

인공지능과 관련된 법적 이슈들을 논의할 때 인공지능에게 법인격을 부여할 것인지에 대한 문제가 거론된다. 유럽연합 의회가 2017년에 낸 결의안에는 전자인 Electronic persons 이라는 표현이 등장하기도 했다. 근본적인 철학적인 관점에서는 법인격에 관한 논의는 인공지능에게 자율성이 있는지에 관한 논의로 쉽게 확장된다. 좀 더 현실적인 차원에서의 논의로는 법적 책임의 문제와 맞닿아 있다. 인공지능에게 법인격을 부여하는 것에 대한 현실적 유용성에 대해서도 계속해서 질문이 나타날 수 있다.

자동장치를 이용하는 상황에서 인간의 역할과 자동장치의 역할 사이에서 역할을 나누는 것은 무척이나 어려운 것이다. 일의적인 답을 마련하는 것은 적당치 않고, 개별 맥락이나 상황을 고려하여 각기 다른 메커니즘을 구상할 필요가 있음을 보여주는 것이기도 하다. 
- 부지불식 : 생각하지도 못하고 알지도 못함.

- 얼개 : 어떤 사물이나 조직의 전체를 이루는 짜임새나 구조.

- 묵시적 : 직접적으로 말이나 행동으로 드러내지 않고 은연중에 뜻을 나타내 보이는

- 인사 고과 : 인원 배치, 임금 책정, 교육 훈련 따위를 위하여 종업원이나 직원의 능력·성적·태도를 종합적으로 평가하는 일.

- 진양성 : 우수한 인재라 판단하여 채용을 했는데 실제로도 업무성과가 좋은 유형, 위양성 : 우수한 인재라 판단하여 채용을 했는데 실제로는 그렇지 못한 유형, 진음성과 위음성은 그 반대. 

- 단초 : 일이나 사건을 풀어나갈 수 있는 첫 머리.

- 지리한 : 지루한

- 수탁자 : 남의 부탁을 받거나 남의 물건 따위를 맡은 사람.

- 일의적 : 가장 중요한 의미를 갖는

- 인공지능의 작동에 관한 인간의 역할 = human in the loo p
Back to Top