Meta lanza un sistema de IA que permite convertir voz en texto en más de 1.600 idiomas

Qué ha anunciado exactamente

  • El sistema se llama Omnilingual ASR.
  • Soporta más de 1.600 idiomas, incluyendo unas 500 lenguas que nunca antes habían tenido transcripción automática por IA.
  • Meta afirma que en el 78 % de esos idiomas la tasa de error (error de caracteres) baja del 10 %.
  • Incluso para lenguas con muy pocos datos disponibles —menos de 10 horas de audio transcrito— en el 36 % de los casos también obtienen errores por debajo del 10 %.

Cómo lo han logrado — la tecnología detrás

  • Omnilingual ASR se basa en un modelo de voz (encoder) multilingüe, wav2vec 2.0, adaptado por Meta, con variantes de distinto tamaño para distintos casos de uso (desde dispositivos con pocos recursos hasta sistemas servidores potentes).
  • También han liberado públicamente (open-source) tanto los modelos como un corpus de voz transcrita — el Omnilingual ASR Corpus — que incluye audios de 350 lenguas “poco atendidas” hasta ahora, con la intención de facilitar el desarrollo de más herramientas multilingües.
  • Gracias al diseño del modelo, es posible añadir nuevos idiomas con sólo unos pocos ejemplos pareados de audio + texto, sin necesidad de enormes cantidades de datos. Esto permite escalar la transcripción a lenguas muy minoritarias de forma más fácil y rápida.

Por qué importa — implicaciones y alcance global

  • Este avance reduce la brecha tecnológica: muchas comunidades que hablan lenguas minoritarias o poco representadas en internet podrán acceder a herramientas de voz a texto, lo que mejora su inclusión digital.
  • Puede facilitar la preservación lingüística (transcripciones digitales de lenguas con pocos recursos), el acceso a la tecnología en comunidades marginadas y mejorar servicios como educación, salud o comunicación en lenguas locales.
  • Al ser open-source, investigadores, desarrolladores y comunidades pueden usar, auditar y adaptar la tecnología libremente, lo que democratiza más aún su desarrollo.

Fuente: La Vanguardia

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *