메타의 새로운 AI는 거의 100개 언어에 대한 음성과 텍스트를 번역할 수 있습니다.

메타의 AI는 100개 언어를 번역할 수 있습니다.

메타(Meta)는 새로운 “올인원” AI 번역 모델을 소개했는데, 이는 “보편적인 번역기를 만들기 위한 탐구”에서 큰 진전으로 소개되었습니다.

SeamlessM4T라고 불리는 이 모델은 거의 100개 언어에 걸쳐서 텍스트에서 음성, 음성에서 텍스트, 음성에서 음성, 텍스트에서 텍스트 등 다양한 종류의 번역을 처리할 수 있습니다. 다른 언어 번역기와 달리 SeamlessM4T는 하나의 시스템으로, 에러와 지연을 줄이고 번역 과정의 “효율성과 품질을 향상”시킨다고 메타는 말합니다.

SeamlessM4T는 메타의 이전 AI 작업을 기반으로 구축되었습니다. 2022년 7월에 메타는 No Language Left Behind 프로젝트를 시작했는데, 이 프로젝트는 200개 언어에 대해 AI를 사용하여 텍스트 간 번역을 수행하며, 특히 희귀한 언어나 적게 사용되는 언어의 번역을 개선하는 데 중점을 둡니다.

회사는 또한 AI로 개성을 가진 AI 봇과 대화하고, Facebook 및 Instagram 피드를 구성하는 방법에 대한 자세한 정보를 제공하는 모델도 출시했습니다.

메타와 같은 많은 주요 기술 회사들은 올해 AI 기반 도구와 서비스의 개발과 출시에 더 많은 관심을 기울이고 있습니다. Microsoft는 2월에 AI가 통합된 Bing 검색을 출시했는데, 이는 OpenAI의 ChatGPT를 구동하는 동일한 기술을 사용합니다. Amazon은 최근에 생성적 AI를 사용하여 고객 리뷰를 분석하고 요약할 것이라고 발표했으며, Google은 “온라인 검색을 재구상”하는 검색 생성 경험을 테스트하고 있습니다.

AI는 거의 모든 산업 부문을 혁신할 수 있으며, 피트니스부터 채용까지 모든 것에 AI가 적용되고 있습니다. 번역에 관해서도, AI는 구글 번역 앱과 같은 도구에서 결과에 맥락을 추가하는 데 사용됩니다. 생성적 AI의 급속한 발전은 기술의 위험과 사회에 미칠 잠재적 영향에 대한 우려도 제기하고 있습니다.

SeamlessM4T와 같은 메타의 이전 AI 모델들은 연구자와 개발자가 해당 기술 위에 빌드할 수 있도록 연구 라이선스로 공개됩니다. 메타는 또한 SeamlessAlign이라는 데이터셋에 프로젝트의 메타데이터를 공개합니다. 이는 메타의 AI가 훈련된 음성과 텍스트의 약 270,000 시간에 해당하는 데이터셋으로, 메타는 이것을 “가장 큰 오픈 소스 멀티모달 데이터셋”이라고 설명합니다.

SeamlessM4T에 대한 기술적인 정보는 메타의 AI 블로그나 회사의 연구 Github 페이지에서 확인하실 수 있습니다.

편집자 주: ENBLE은 일부 이야기를 생성하는 데 AI 엔진을 사용하고 있습니다. 자세한 내용은 이 게시물을 참조하십시오.