Meta의 새로운 AI 모델은 실시간 번역 전문가입니다.

Meta의 새로운 AI 모델은 번역 전문가입니다.

메타의 최신 AI 출력은 실시간 텍스트 및 음성 번역의 주요 발전입니다.

회사는 화요일에 SeamlessM4T를 출시했습니다. 이는 텍스트를 음성으로 번역하고 그 반대로 번역하는 다중모달 모델입니다. 메타는 SeamlessM4T가 “첫 번째 올인원 다국어 다중모달 AI 번역 및 전사 모델”이라고 주장하며, 이는 동시에 언어를 번역하고 전사하는 능력을 가지고 있다는 것을 의미합니다. SeamlessM4T는 최대 100개 언어에 대해 음성-텍스트, 음성-음성, 텍스트-음성 및 텍스트-텍스트 입력을 번역할 수 있습니다. 음성-음성 및 텍스트-음성 번역 출력은 35개 언어를 지원합니다.

트윗이 삭제될 수 있습니다.

Llama 2 및 AudioCraft를 포함한 최근 메타에 의해 출시된 기타 AI 모델과 마찬가지로, SeamlessM4T는 연구자 및 개발자들을 위해 연구 라이선스로 공개적으로 제공됩니다. 모델과 함께 메타는 SeamlessAlign이라는 훈련 데이터셋도 공개합니다. 이 데이터셋에는 270,000시간의 음성 및 텍스트 정렬이 포함되어 있습니다. 오픈AI 및 구글과 달리 메타는 모델을 오픈 소스로 공개적으로 제공하는 것을 강조하고 있습니다. 메타의 오픈 소스 모델 출시 접근법은 제너레이티브 AI 시스템의 투명성을 요구하는 AI 윤리학자들 사이에서 점수를 얻는 동시에 개발자들이 제품을 구축하고 개선할 수 있도록 하는 이중 효과를 가지고 있습니다.

메타의 오픈 소스 접근법은 이타적으로 보일 수 있지만, 이는 경쟁력 있는 시장에서 다른 대형 기술 기업들에 대항하는 전략적인 행동입니다. 또한 모든 AI 모델은 데이터 수집 문제도 직면해야 합니다. 블로그 게시물에 따르면, SeamlessM4T의 데이터셋(SeamlessAlign)은 공개적으로 이용 가능한 데이터로 구성되어 있으며, 저작권 보호 작품 및 개인 데이터 사용에 대한 윤리적 및 법적 문제가 있습니다.

메타의 발표에서는 SeamlessM4T에 대한 구체적인 계획을 상세히 설명하지 않았으며, 단지 “이 기본 모델이 어떻게 새로운 커뮤니케이션 기능을 가능하게 할 수 있는지 알아보고자 합니다”라는 힌트만 주었습니다. 다시 말해, 우리는 언젠가 WhatsApp이나 Instagram에서 SeamlessM4T의 소비자를 대상으로 한 버전을 볼 수 있을지도 모릅니다.