#1. 빅데이터를 활용하여 어휘의 우선순위를 계산했다.
130억 영문 텍스트 속 파생어 및 관련어휘를 표제어와 통합하는 작업을 거쳤고, 통합빈도수를 기준으로 표제어를 정렬했다. 또한, 주요 파생어들은 교재 속 표제어와 함께 표시하였다.
#2. 특이 사례들은 순위를 조정하였다.
예를들어, 초급 어휘인 ‘Giraffe(기린’는 단순 빈도수 기준으로는 최고난도 어휘로 분류된다. 유아용 교재엔 자주 등장하지만 그 외의 텍스트엔 매우 드물게 등장하는 단어이기 때문이다. 올보카는 해당 어휘를 초급 어휘에 해당되도록 순위를 조정하는 등, 난이도 최적화 작업을 진행 하였다.
#3. 외래어는 별도 학습이 가능하도록 필터링하였다.
우리나라에서 유난히 많은 외래어가 사용되는 만큼, 상당수 어휘는 철자만 익히면 단번에 체득 가능하다. 예를 들어 Lingerie (란제리, Veranda (베란다, Bourgeois (부르주아 등의 어휘는 얼핏 보면 생소하지만 발음과 스펠링만 익히면 손쉽게 외워진다.
#4. 일반 학습자 입장에서 불필요한 특수 용어들을 배제하였다.
일례로 ‘Paraffin’ 이란 단어는 ‘CnH2n+2의 화학식으로 표현되는 알케인 탄화수소(등유를 두루 일컫는 표현’인데, 빈도수로는 순위권에 들지만 일반적인 학습자에게 기대되는 어휘가 아니다. 또한, Google nGram 을 활용해 불필요한 고어들도 제거하였다.
#5. 교육부 지정 필수 영단어들은 우선순위 산정 시 가중치를 부여했다.
교육부가 공개한 필수 영단어 리스트는 영어 학습의 기초가 되는 어휘들을 담고 있다. 해당 어 휘들에 가중치를 부여함과 동시에 교재 내에서 교육부 지정 단어임을 표시하였다. 이는 올보카 를 우리나라 영어 학습환경에 최적화하기 위한 작업이었던 만큼 남녀노소 누구나 올보카로 평생 학습이 가능하다.