네이버 뉴스 배열 공정성, 얼마나 증명했나

검토위 “사람 개입 불가능, 불가피한 개입해도 기록남아”
뉴스일자:2018-11-29 23:33:12

 

[취재진의 질의에 답하는 맹성현 검토위원장/자료=urban114] 

 

[도시미래=조미진 기자] 뉴스 배열 등에 공정성 논란이 있었던 네이버가 자사 뉴스 배열 시스템에 대해 외부 전문가들을 위촉해 지난 6개월간 검토를 받았고, 외부 검토위는 그 결과를 29일 발표했다. 이들은 기술적인 접근을 중심으로 검토 한 결과 기본적으로 편집자의 개입이 불가능한 구조이며 긍정적 요소가 많다고 밝혔다. 그러나 일각에서는 네이버가 위촉한 인물들이 검토위원이라는 점, 네이버 측이 제공한 기술 문서에 의존해 결론을 내린 점 등을 지적하고 있다. 

네이버는 지난해 스포츠 뉴스 배열조작 청탁 의혹이 불거지자 공식 사과와 함께 해당직원을 징계했다. 설상가상 드루킹 댓글조작 사건까지 벌어져 검찰조사를 받기도 했다. 이에 검색 및 콘텐츠 노출에 대한 신뢰 회복을 위해 모바일 앱 개편 및 뉴스시스템 개편 을 진행하고 있다. 이런 일련의 흐름 속에서 지난 5월 네이버 뉴스 알고리즘 검토위원회가 출범하게 됐다. 검토위원들은 네이버가 위촉한 외부 전문가들이다.

이날 검토위의 발표에 따르면, 검토위는 네이버 뉴스서비스를 △뉴스 검색(랭킹 알고리즘) △AiRS 뉴스 추천(개인 맞춤형 뉴스) △연예 및 스포츠 뉴스 등 3가지 분야로 나눠 약 6개월 간의 평가를 진행했다.

평가항목은 △서비스 데이터의 확보 과정 △검색결과 결정 알고리즘과 그에 반영되는 자질 △이용자에게 서비스가 공개되는 과정 △전체 과정에 대해 수립된 업무 절차 적절성 등 크게 4가지다.

검토위는 각 분야의 기술 프로세스에 대한 세부내용을 파악할 수 있는 문서와 데이터 샘플 등에 대한 상세 내용을 네이버 측으로부터 공유 받았다. 

[지난 6개월간의 네이버 뉴스 알고리즘 검토 결과를 발표하는 맹성현 위원장/자료=urban114]

검토위는 “전문가 집단이 한 인터넷 기업의 서비스 전반에 걸친 알고리즘과 이에 반영되는 자질을 구체적으로 검토하고, 발전 방안을 논의 한 것은 세계 최초의 시도로 매우 고무적인 일”이라며 이번 검토의 긍정적 의의를 설명했다.

뉴스 검색 서비스 영역에 대해서 검토위는 명확한 가이드라인을 기반으로 품질평가 방향이 정립돼 있었으며 앞으로도 계속 이러한 시스템을 정착시키는 것이 중요할 것이라고 평했다. 

또 네이버의 뉴스 랭킹 학습알고리즘으로 SVMRank가 사용되고 있으며, 다른 학습 알고리즘은 사용에 적합하지 않아 알고리즘 교체보다 더 좋은 자질의 발굴에 초점을 둬야 한다고 밝혔다. 특히 검색질의 중 이슈질의는 어뷰징(반복전송)방지를 위한 여러 자질이 중요한 역할을 하고 있다고 평했다.

그러면서 뉴스검색 결과는 알고리즘으로 자동 배치되기 때문에 관리자 개입은 원칙적으로 불가능한 구조이며, 뉴스검색 개발-운영-개선에 대한 의사결정 이력이 모두 기록되며, 이용자 피드백을 수집하고 반영하기에 실제 이용자들의 검색 품질 만족도를 꾸준히 평가하고 있음을 확인했다고 전했다. 

AiRS 뉴스 추천서비스 영역에서는 편집자 개입 없이 자동으로 뉴스 이용자 피드백데이터를 수집·학습해 데이터를 확보하고 있으며. 협력필터와 품질모델을 결합해 이용자의 기사 선호도와 품질을 고려한 개인화된 추천 점수를 계산하는 알고리즘을 활용하는 것을 확인했다고 말했다.

또 이 과정에서 이용자의 기존 관심사와 다른 분야의 기사도 함께 추천되도록 함으로써, ‘필터버블(Filter Bubbles, 확증편향)’ 문제를 최소화하고 있다고 밝혔다.

필터버블은 사용자가 보고 싶어하는 정보를 알고리즘이 선별해 제공함으로써 사용자의 관점에 동의하지 않는 정보로부터 해당 사용자를 분리시켜, 결국 자신만의 문화적, 이념적, 검품에 갇히는 것을 뜻한다.

아울러 이용자 피드백은 고객문의나 의견 접수 형태로 반영되고 있으며, 포커스 그룹 미팅을 통해 이용자 모니터링을 실시하는 등 서비스 개선 과정에 이용자의 참여가 실질적으로 고려되고 있다고 설명했다.
 
연예 및 스포츠 기사 추천서비스는 일반 분야 뉴스 기사와는 수집되는 기사의 양과 행태, 뉴스 정보의 유효기간 등이 매우 다른 점을 고려되고 있다고 전했다. 그러면서 해당 영역의 특성을 반영한 최신성과 기사 클릭 수치와 같은 피드백 정보를 바탕으로, 비 맞춤형 뉴스 추천서비스를 제공하고 있다고 검토위는 덧붙였다. 

또, 앞서 언급한 두 가지 서비스에 비해 데이터 기반의 기계학습이 아닌 규칙기반의 알고리즘을 바탕으로 서비스가 운영되고 있다고 고 설명하며, 이는 정형화된 특성이 존재하는 해당영역만의 특징을 반영한 것이라고 분석했다. 

연예 및 스포츠 기사 추천 알고리즘의 핵심 역할을 하는 자질이 현재는 체계적으로 적절히 활용되고 있으나 시간이 지남에 따라 효용성이 변화가 있을 수 있으므로, 자질에 대한 꾸준한 검증이 필요할 것이라고도 했다.

이번 검토에 대해 검토위는 “위원회의 목표는 건전한 포털 뉴스 서비스가 갖춰야 할 기본적인 요소들이 데이터, 알고리즘, 서비스 운영, 피드백, 절차 내에 존재하는지 확인하는 것이었다”고 전했다. 

그러나 “포털 뉴스 서비스가 따라야 할 저널리즘적 가치 자체에 대한 총체적이고 일반적인 기준이 존재하지 않는다”며 저널리즘적 가치에서의 공정성을 평가하는 것에 대해서는 어려움이 있음을 언급했다.

검토위는 총체적으로 네이버 뉴스 서비스의 자동화가 공정성과 신뢰성 문제 해결을 위한 효율적인 대안이라고 평가했다.

[네이버 뉴스 알고리즘 검토 결과를 발표하는 검토위원장을 맡은 맹성현 카이스트 교수/자료=urban114] 

단, 사고가 발생 할 경우는 인간이 충분히 개입할 수 있고, 개입한 것에 대해서는 기록이 되야 하며, 이 부분이 이루어지고 있기에 “긍정적이다”라고 설명했다. 그러면서 향후에도 체계적으로 관리돼야 한다는 평가를 전했다.

또 검토위는 “검색결과의 다양성, 균형성, 방향성을 모두 반영해 구현하는 것이 기술적으로 매우 도전적이나, 지속적인 노력이 필요하다”며 “외부 검토위의 독립성은 보장하되, 네이버의 내부 평가와 외부 검토위와의 업무상 연계성과 내실을 기하는 상호 네트워크 형상 방안을 추진해야 한다”고 말했다. 

그러나 발표 현장에서 일부 취재진 등 일각에서는 여전히 네이버 뉴스 배열 등의 공정성에 의문이 남는다는 견해를 나타내고 있다. 이날 한 취재진이 검토위에 “네이버에서 (알고리즘) 소스코드를 제공했나. 어떤 경우에도 편집자의 개입이 없는 것이 확실하냐”고 질의하자 맹 위원장은 “소스코드를 검증하지 않았다. 그건 2년짜리 프로젝트로 해야 한다. 수사하는 것도 아니기에 소스코드를 볼 이유가 없다”고 답하기도 했다.   




이 뉴스클리핑은 ufnews.co.kr에서 발췌된 내용입니다.