banner

Blog

Jul 10, 2023

Scopri Meta SeamlessM4T: traduttore multilingue

Meta ha appena lanciato un nuovo straordinario strumento chiamato SeamlessM4T. Questo elegante modello di intelligenza artificiale può trascrivere e tradurre quasi 100 lingue ed è un grande passo avanti nel rendere le barriere linguistiche un ricordo del passato.

L'azienda afferma che SeamlessM4T, traduzione automatica massivamente multilingue e multimodale, può convertire la voce in testo e il testo in parlato per quasi 100 lingue. Identifica 100 lingue di input e le trasforma in 35 lingue di output per le funzioni di sintesi vocale e di sintesi vocale.

Poiché è distribuito sotto la licenza Creative Commons CC BY-NC 4.0, i ricercatori sono liberi di migliorarlo. Le informazioni per SeamlessAlign, parte del set di dati di traduzione aperta di Meta, sono state rese disponibili insieme a SeamlessM4T. A differenza dei grandi modelli di traduzione esistenti che dividono la traduzione tra diversi sistemi, SeamlessM4T completa l'intero lavoro di traduzione in un'unica operazione, secondo Meta, rendendolo "un passo avanti significativo".

Se SeamlessM4T funziona come previsto, uno dei suoi aspetti interessanti è la sua presunta capacità di rilevare il cambio di codice o la transizione tra due o più lingue all'interno di una singola frase. Ad esempio, Meta ha mostrato in un video come la modella riesce immediatamente a distinguere tra hindi, telugu e inglese.

Vanta il potenziale per discernere immediatamente quando un parlante attraversa le lingue, come dimostrato in un video accattivante in cui distingue senza sforzo tra hindi, telugu e inglese. Questa capacità potrebbe rivoluzionare la comunicazione interculturale, favorendo un mondo in cui la lingua non sia più una barriera.

"In linea con il nostro approccio alla scienza aperta, stiamo rilasciando pubblicamente SeamlessM4T con una licenza di ricerca per consentire a ricercatori e sviluppatori di sviluppare questo lavoro. Stiamo anche rilasciando i metadati di SeamlessAlign, il più grande set di dati di traduzione multimodale aperto fino ad oggi, per un totale di 270.000 ore di allineamenti vocali e di testi estratti", afferma Meta.

Cos'è Llama2: Spiegazione dell'IA di Meta

Per produrre modelli più leggeri e gestire più informazioni, Meta ha affermato di aver modificato il suo toolbox di modellazione di sequenze Fairseq per generare SeamlessM4T.

Secondo Meta, ha creato un sistema in grado di riconoscere frasi dannose o delicate durante la creazione di SeamlessM4T. Secondo la definizione data da Meta, le parole tossiche sono quelle la cui "traduzione può incitare all'odio, alla violenza, al linguaggio volgare o all'abuso". L'obiettivo è quello di essere in grado di identificare i casi in cui la tossicità introdotta dalla traduzione di output non esisteva precedentemente nel contenuto originale.

Cos'è Llama2
CONDIVIDERE