구글이 아랍어, 히브리어 번역에 신경망 기반 번역 기술을 도입했다.
해외 IT 전문매체 벤처비트는 30일(현지시간) “구글은 오늘 아랍어와 히브리어라는 두 가지 언어에 대해 신경망 기반 번역으로 전환했다. 구글은 지난 9월에 접근법(신경망 기반 번역)을 처음 사용하기 시작했으며 점차 더 많은 언어로 번역해 모든 103개국 언어 번역에 신경망 번역 도입을 목표로 삼고 있다”고 보도했다.
구글은 “이전에 사용했던 전통적인 구문 기반 기계 통계 번역 시스템 대신 신경망 기반 번역과 구글 번역 커뮤니티의 기여를 통해 아랍어 및 히브리어의 번역에 진출할 수 있었다”고 밝혔다.
현재 구글 신경망 기반 번역이 가능한 국가 언어는 중국어, 영어, 프랑스어, 독일어, 힌디어, 일본어, 한국어, 포르투갈어, 러시아어, 스페인어, 터키어 및 베트남어이다. 구글의 ‘라이벌’ 마이크로소프트 역시 점차 전통적인 기계 통계 번역에서 신경망 기반 번역으로 옮겨 현재 11개 언어를 번역하고 있다.
많은 양의 데이터에서 패턴을 찾아내는 AI의 핵심기술 딥러닝(심층학습)이 가장 잘할 수 있는 분야가 바로 번역이다. 인간이라면 불가능하지만, AI는 매일 쉬지 않고 번역을 학습하기 때문에 시간이 지날수록 똑똑해진다. 신경망 기계 번역은 기존의 단어와 구 단위의 번역 방식인 구문 기반 기계 통계번역에서 한 단계 나아간 방식이다.
기존의 기계 통계 번역은 품질을 향상하려면 많은 문장이나 단어 번역을 투입하는 방식이었다. 반면 신경망 기반 번역은 전체 문장을 하나의 단위로 번역해 문법 규칙에 맞는 자연스러운 문장을 찾아낸다. 특히 다양한 언어 조합에서 일정한 패턴을 찾음으로써, 번역에 사용할 수 있는 데이터가 부족할 때도 경험에 근거한 추측을 할 수 있어 완성도를 크게 끌어올렸다.
구글은 안드로이드, 지메일, 구글 맵스, 구글 플레이, 구글 검색 및 유튜브 등 다양한 서비스 개선에 신경망 네트워크가 직접 새로운 데이터를 생산하도록 하는 딥러닝 방식(Deep learning)을 사용하고 있다. /mcadoo@osen.co.kr
[사진] ⓒAFPBBNews = News1(무단전재 및 재배포 금지)