AI를 사용해 3억 명에게 언어를 교육하다
아마 지난해 목표 중에 외국어 배우기가 있으셨을 겁니다. 그 전 해, 전전 해에도요. 체육관 등록과 마찬가지로, 아무리 뜻이 좋아도 오래 못 가는 경우가 종종 있습니다. 새로운 언어를 능숙하게 익히는 데 필요한 시간은 차치하더라도 대부분의 사람들은 전통적인 학습 방식에 힘들어합니다. 수많은 웹 기반 언어 도구 또한 단조롭고 번거로울 수 있습니다.
피츠버그에 본사를 둔 스타트업인 Duolingo는 AI 기반 언어 학습 플랫폼을 통해 모든 것을 변화시키고 있습니다. 이 회사는 프랑스어와 타밀어부터 하와이어와 나바호어와 같이 소멸 위기에 처한 언어에 이르기까지 32개 이상의 언어 과정을 제공해 3억 명 이상의 사용자를 확보하고 있습니다.
Duolingo의 차별점은 개인 맞춤형 학습 접근 방식입니다. 이는 포인트 기반 보상 시스템을 통해 학습 경험을 게임화하여 사용자를 계속 참여시키고 숙련도를 높이는 방식입니다. 미국 국무부는 프랑스어나 이탈리아어와 같은 '카테고리 1' 언어를 배우는 데 600시간이 걸리는 것으로 추정합니다. 하지만 Duolingo는 하루에 단 15분이면 배울 수 있다고 생각합니다.
Duolingo는 AI 기반 적응형 배치 시험을 사용자에게 제공합니다. 시험에서는 과정에서 제공되는 실제 연습 문제를 사용해 사용자의 수준을 파악합니다. 따라서 4년 동안 고등학교 프랑스어를 배웠다면 가장 기본적인 과정을 처음부터 시작할 필요가 없습니다. 시험의 각 문제 또는 과제는 이전 질문에 맞게 답했는지 틀리게 답했는지 여부에 따라 적응형으로 제공됩니다.
Duolingo의 Research Director인 Burr Settles는 이 과정을 "단어의 난도, 문법, 시험에서 제시하는 방식 등이 모두 정확한 구성을 선택하는 데 중요한 역할을 합니다. 그래야 5분 이내에 사용자가 어느 수준에서 과정을 시작할지 제대로 알 수 있습니다."라고 설명합니다.
언어 수업은 간격 반복 학습이라는 개념을 사용하여 사용자가 개인화된 문제를 더욱더 긴 간격으로 연습할 수 있도록 설계되었습니다. 이는 단기간에 벼락치기를 하는 것보다 더 효과적인 것으로 입증되었습니다.
언어가 능숙해질수록 사용자는 다양한 방식으로 콘텐츠와 상호 작용하게 됩니다. 예를 들어, Duolingo는 커리큘럼의 단어 하나하나마다 사용자가 해당 단어를 본 횟수, 맞힌 횟수, 맞혔을 때의 방식, 연습한 시간을 기록합니다.
Burr는 "AI를 사용하면 주어진 상황에서 해당 단어를 기억할 확률을 언제든지 예측할 수 있습니다. 그리고 계속 연습해야 하는 것을 필요할 때 정확히 주입할 수 있습니다."라고 설명합니다.
"계속 연습하는 데 필요한 것을 필요할 때 정확히 주입할 수 있습니다."
Burr Settles
Duolingo
Research Director
"계속 연습하는 데 필요한 것을 필요할 때 정확히 주입할 수 있습니다."
Burr Settles
Duolingo
Research Director
lingo 뒤에서 벌어지는 학습의 과정
Duolingo는 이러한 AI를 구현하기 위해 인공 지능과 기계 학습의 부분 집합인 딥 러닝을 사용합니다. 딥 러닝은 신경망을 사용하여 뇌의 행동을 모방하여 데이터를 신속하게 분석하고 지능적인 예측을 수행합니다. 이 회사는 자연어 처리에 딥 러닝 알고리즘을 사용합니다. 이를 통해 사용자 로그 데이터를 분석하고 사용자가 정답을 맞힐 가능성을 예측할 수 있습니다. 이러한 예측은 학습 앱의 적응형 학습 테스트와 콘텐츠를 모두 개인화하기 위한 토대가 됩니다.
하지만 처음부터 이런 방식은 아니었습니다. Duolingo는 2009년 카네기멜론대학교(CMU)에서 Monolingo라는 번역 프로젝트를 진행하면서 시작되었습니다. 프로젝트의 목표는 사용자에게 Wikipedia나 뉴스 사이트의 기사 같은 문서를 번역하게 해서 외국어를 가르치는 것이었습니다. 당시 Monolingo(그리고 초기 Duolingo도)는 지금보다 훨씬 전통적인 인지 과학 알고리즘을 사용했습니다. 예를 들어, 기준 알고리즘은 직접 선별한 파라미터를 사용했습니다. 즉 알고리즘이 반드시 실제 데이터로 학습하지는 않았습니다. Duolingo 연구원들은 사용자를 대상으로 A/B 테스트를 통해 다양한 접근 방식을 알아보았습니다. 그 결과 연구원들이 목표로 한 개인화 수준에 맞춰 더 정교한 맞춤형 기계 학습 모델이 필요하다는 사실을 깨달았습니다.
Burr는 "매우 맞춤화된 문제이기 때문에 처음부터 새로 모든 것을 창안해야 했습니다. 이러한 사용 사례에서는 기본적인 인지적 접근 방식을 먼저 시도하여 데이터 수집을 시작한 다음 데이터가 확보되면 딥 러닝으로 정제하기 시작하는 것이 일반적인 수명 주기입니다."라고 전했습니다.
Duolingo는 이러한 사용자 지정 알고리즘(네이티브가 아닌 음성 인식부터 자동 채점을 위한 분류까지 모든 것)을 개발하기 위해 Amazon Web Services(AWS)의 PyTorch 딥 러닝 프레임워크를 사용합니다. 이러한 딥 러닝 모델은 Amazon EC2 P3 고성능 GPU 인스턴스를 사용해 훈련하고 프로덕션 환경에 배포합니다. 모델이 문제에 따라 한 번에 10만~3,000만 개의 데이터 포인트를 사용하여 매일 3억 건 이상의 예측을 수행할 가능성이 있기 때문에 속도와 확장성은 모델 훈련에 필수적입니다.
Burr는 "모델 훈련에 필요한 사용자 수, 테스트 수, 언어 수를 고려할 때 2주 분량의 데이터만으로도 충분하기 때문에 슬라이딩 윈도우를 사용할 예정입니다."라고 설명했습니다. 이 회사는 기계 학습을 위한 데이터 파이프라인을 관리하기 위해 데이터 관리에 Amazon DynamoDB를 사용하고, Amazon EBS와 함께 Amazon EMR을 임시 스토리지로 사용합니다. 또한 영구 스토리지에는 Amazon S3를, 주기적 배치 예측을 위한 계산을 수행하는 데는 Spark를 사용합니다.
또한 Duolingo는 애플리케이션에 쉽게 통합되는 딥 러닝 기반 텍스트 음성 변환 도구 Amazon Polly를 사용하여 테스트와 수많은 교육 과정에 목소리를 부여합니다. 이를 통해 애플리케이션을 더 생생하게 만듭니다.
이러한 딥 러닝 도구를 사용함으로써 예측 정확도와 사용자 참여도 모두 향상되었습니다. Duolingo를 사용하고 둘째 날 다시 찾은 사용자 수가 바로 12% 증가했습니다.
Burr와 Duolingo 팀은 테스트 보안, 사기 탐지, 생체 인식, 컨텍스트 이해를 위한 모델을 탐구하면서 딥 러닝을 통한 새로운 가능성을 계속 테스트하고 있습니다. 예를 들어, 질문에 틀리게 답했는데 왜 틀렸는지 명확하지 않을 수 있습니다. 단어를 잊어버려서 틀린 건가요? 아니면 동사 활용을 잘못한 것일 수도 있습니다.
Burr는 "우리가 받은 신호로는 원인이 무엇인지 항상 명확하게 알아내지 못합니다. 앞으로 AI가 할 일이 많습니다."라고 전했습니다.
Duolingo가 딥 러닝을 사용하여 언어 서비스를 개선해 나간다면, 새해에 결심한 목표 중 적어도 하나는 달성할 수 있게 될지도 모릅니다.