11월 20, 2025

✨ Meta는 기본적으로 1,600개 이상의 언어를 전사할 수 있는 Omnilingual ASR 모델을 갖춘 오픈 소스 AI로 돌아옵니다.

★ 8 전문 정보 ★

Meta는 1,600개 이상의 언어를 지원하는 새로운 다국어 자동 음성 인식(ASR) 시스템을 출시했습니다. 이는 99개만 지원하는 OpenAI의 오픈 소스 Whisper 모델을 능가하는 것입니다. 또한 아키텍처를 통해 개발자는 해당 지원을 수천 개 이상으로 확장할 수 있습니다. 제로샷 상황 내 학습이라는 기능을 통해 사용자는 추론 시 새로운 언어로 된 몇 가지 오디오와 텍스트 쌍의 예를 제공할 수 있으므로 모델이 재교육 없이 해당 언어의 추가 발화를 전사할 수 있습니다. 실제로 이를 통해 잠재적인 적용 범위가 5,400개 이상의

🎯 핵심 특징

✅ 고품질

검증된 정보만 제공

⚡ 빠른 업데이트

실시간 최신 정보

💎 상세 분석

전문가 수준 리뷰

📖 상세 정보

Meta는 1,600개 이상의 언어를 지원하는 새로운 다국어 자동 음성 인식(ASR) 시스템을 출시했습니다. 이는 99개만 지원하는 OpenAI의 오픈 소스 Whisper 모델을 능가하는 것입니다. 또한 아키텍처를 통해 개발자는 해당 지원을 수천 개 이상으로 확장할 수 있습니다. 제로샷 상황 내 학습이라는 기능을 통해 사용자는 추론 시 새로운 언어로 된 몇 가지 오디오와 텍스트 쌍의 예를 제공할 수 있으므로 모델이 재교육 없이 해당 언어의 추가 발화를 전사할 수 있습니다. 실제로 이를 통해 잠재적인 적용 범위가 5,400개 이상의 언어로 확장됩니다. 이는 알려진 문자가 있는 거의 모든 음성 언어입니다. 이는 정적 모델 기능에서 커뮤니티가 스스로 적응할 수 있는 유연한 프레임워크로의 전환입니다. 따라서 1,600개 언어가 공식 교육 범위를 반영하는 반면, 더 넓은 수치는 Omnilingual ASR의 주문형 일반화 능력을 나타내며, 이는 현재 출시된 음성 인식 시스템 중 가장 확장성이 뛰어납니다.무엇보다도 가장 좋은 점은 개방형이라는 것입니다.

📰 원문 출처

원본 기사 보기

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다