美연구팀, 문학작품 3000권 분석
“남성이 여성보다 4배 많이 등장”
27일(현지시간) 영국 일간 가디언에 따르면 미국 서던캘리포니아대 연구팀은 ‘구텐베르크 프로젝트’에 포함된 문학작품 3000권을 AI로 분석했다. 구텐베르크 프로젝트는 인류의 주요 문서 자료를 전자정보로 변한화 저장하는 작업이다.
분석 대상에는 장편소설, 단편소설, 시 등이 포함됐다. 장르는 어드벤처, 공상과학, 미스터리, 로맨스 등을 망라했다.
연구팀은 ‘NER’이라는 AI 분석 도구를 활용해 작품에 등장하는 이름과 성별 대명사 등 성별을 특정할 수 있는 단어를 검색했다.
분석 결과 소설 남성 인물의 등장 비율은 여성 인물보다 4배 높았다. 마얀 케즈리왈 연구원은 “소설 속 성비 불균형이 실제로 존재한다는 것이 확인됐다”며 “이는 소설을 읽는 독자에게 무의식적으로 영향을 줄 수 있다”고 지적했다.
여성 작가가 쓴 작품의 경우 이와 같은 등장인물의 성적 불균형이 덜한 것으로 나타났다.
등장인물을 묘사하는 표현에는 성별에 따라 편견이 반영된 것이 확인됐다. 여성에게는 ‘약하다’, ‘쾌활하다’, ‘예쁘다’, ‘멍청하다’ 등 형용사가 많이 쓰인 반면, 남성에게는 ‘지도력’, ‘힘’, ‘정치’ 등 단어가 많이 쓰였다.
연구팀은 “책은 사람들이 어떻게 세상을 들여다보고 있는지 알게 해 주며 그런 시각이 어떻게 변하고 있는지도 알려준다”고 설명했다.
이정수 기자