Curiosidades

SeamlessM4T: el traductor de Meta con IA y en cien idiomas

"SeamlessM4T" aprovecha los avances hechos en otros modelos de la compañía Meta y es un avance que podría marcar un hito en la comunicación global. Detalles.

Por Redacción Pilar a Diario 11 de septiembre de 2023 - 08:30

La Inteligencia Artificial sigue en auge. Los diferentes usos a los que puede ser sometida ha hecho que diferentes aplicaciones las incorporen a sus sistemas. En ese sentido, Meta, empresa matriz de Facebook, Instagram, WhatsApp, presentó SeamlessM4T, un nuevo modelo de inteligencia artificial (IA), que realiza traducciones y transcripciones de casi cien idiomas como parte de sus trabajos para el desarrollo de un traductor universal.

Este anuncio promete cambiar la forma en que las personas de todo el mundo se comunican y colaboran, derribando las barreras lingüísticas que durante mucho tiempo han obstaculizado la comprensión mutua.

“SeamlessM4T”, sigue un enfoque de sistema único para reducir los errores y los retrasos en los procesos de traducción. Además, aprovecha los avances hechos en otros modelos de la compañía, como No Language Left Behind, el traductor universal de voz y los modelos de voz multilingüe masivos.

Así, según podemos leer en su blog, Meta ha presentado SeamlessM4T, un modelo de IA multimodal capaz de realizar traducciones entre 100 idiomas. Multimodal, en este contexto, quiere decir que permite entradas y salidas tanto escritas como de audio, aunque su alcance en lo referido al número de idiomas varía en función del tipo de medio de entrada y/o salida empleado. Estas son sus capacidades, según podemos leer en el blog:

  • Reconocimiento automático de voz para casi 100 idiomas
  • Traducción de voz a textopara casi 100 idiomas de entrada y salida
  • Traducción de voz a voz, compatible con casi 100 idiomas de entrada y 35 (+ inglés) idiomas de salida
  • Traducción de texto a textopara casi 100 idiomas
  • Traducción de texto a voz, compatible con casi 100 idiomas de entrada y 35 (+ inglés) idiomas de salida

“Construir un traductor de idiomas universal, como el ficticio Pez de Babel de (la novela) Guía del autoestopista galáctico, es un desafío porque los sistemas de voz a voz y de voz a texto existentes sólo cubren una pequeña fracción de los idiomas del mundo”, aseguró Meta en su blog de IA.

“Pero creemos que el trabajo que anunciamos hoy es un importante paso adelante en este viaje”, añadieron.

Junto a este modelo, Meta también facilitó el conjunto de datos de traducción multimodal abierto SeamlessAlign, que cuenta con un total de 270.000 horas de alineaciones de voz y texto.

Mark Zuckerberg explica para qué sirve "SeamlessM4T". (Sitio Andino).webp

  • ¿PARA QUÉ SERVIRÁ ESTA NUEVA HERRAMIENTA?

Como explica Mark Zuckerberg (dueño de META) en su perfil de Facebook, este nuevo modelo de IA multimodal permitirá que las personas puedan comunicarse, independientemente de si hablan varios idiomas diferentes, sin necesidad de conocerlos. El objetivo de Meta es implementar y habilitar con el tiempo esta herramienta de traducción y transcripción en Facebook, Instagram, WhatsApp, Messenger y Threads.

A su vez, Meta informa que han publicado los metadatos de SeamlessAlign, el conjunto de datos de traducción multimodal abierto más amplio hasta la fecha, con un total de 270.000 horas de muestras de voz y texto extraídas. Este proyecto ha sido todo un desafío, ya que los modelos existentes de traductores de voz a voz y de voz a texto tienen limitaciones en cuanto a idiomas se refiere.

Aunque esta herramienta todavía no está disponible para ser usada por el público general, los investigadores y desarrolladores tendrán acceso al proyecto. Además, cualquiera que lo desee, puede acceder a una demo desde un ordenador o smartphone, en la que puede grabar un pequeño fragmento de voz y este será traducido al idioma escogido. SeamlessM4T, un “todo en uno”, ha sido posible gracias al desarrollo previo de otras herramientas de Meta de traducción automática como Language Left Behind (NLLB), Universal Speech Translator y Massively Multilingual Speech.

Dejá tu comentario

Te Puede Interesar