MERCUSUAR.CO – Meta sudah mengumumkan kalau mereka akan merilis SeamlessM4T model AI yang bisa menerjemahkan dan menyalin ucapan sampai 100 bahasa. Model tersebut bisa berguna untuk mengkomunikasikan serta menguasai informasi dalam bahasa yang tidak diketahui orang.
“Hari ini kami merilis SeamlessM4T, model AI multimodal baru yang memungkinkan orang- orang yang berbicara dalam berbagai bahasa berkomunikasi dengan lebih efektif,” kata CEO Meta Mark Zuckerberg dalam suatu postingan di Channel Instagram- nya seperti dilansir dari Gadgets Now.
Zuckerberg berkata kalau model AI itu bisa melakukan terjemahan ucapan-ke-teks, teks-ke-ucapan, ucapan-ke-ucapan, terjemahan teks-ke-teks, serta pengenalan suara sampai 100 bahasa. Perusahaan berencana untuk mengintegrasikan model AI dalam terjemahan dan transkripsi ke Facebook, Instagram, WhatsApp, Messenger, dan Threads.
Cara kerja model AI SeamlessM4T
Menurut Meta, model penerjemah SeamlessM4T ini mendukung pengenalan ucapan sampai 100 bahasa, tetapi jumlah tersebut lebih sedikit jika menyangkut terjemahan teks-ke-ucapan. Berikut detail kemampuan model AI tersebut:
- Pengenalan ucapan untuk hampir 100 bahasa
- Terjemahan ucapan-ke-teks untuk hampir 100 bahasa masukan dan keluaran
- Terjemahan ucapan-ke-ucapan, mendukung hampir 100 bahasa masukan dan 36 bahasa keluaran (termasuk bahasa Inggris).
- Terjemahan teks-ke-teks untuk hampir 100 bahasa
- Terjemahan teks-ke-ucapan, mendukung hampir 100 bahasa masukan dan 35 bahasa keluaran (termasuk bahasa Inggris).
“Kami merilis secara publik SeamlessM4T di bawah lisensi riset buat memungkinkan peneliti dan pengembang meningkatkan karya ini. Kami pula merilis metadata SeamlessAlign, kumpulan data terjemahan multimodal terbuka terbesar sampai saat ini, total 270.000 jam ucapan serta penyelarasan teks,” kata perusahaan itu.
Bagi Meta, SeamlessM4T dibangun berdasarkan kemajuan sebelumnya dalam bidang ini seperti No Language Left Behind (NLLB), model terjemahan mesin teks-ke-teks yang mendukung 200 bahasa, yang diintegrasikan ke dalam Wikipedia selaku salah satu penyedia terjemahan.
Perusahaan pula membagikan demo Universal Speech Translator, yang merupakan sistem terjemahan ucapan- ke- ucapan langsung pertama buat bahasa Hokkien, sebuah bahasa yang tidak mempunyai sistem penulisan yang banyak digunakan.
Meta pula segera meluncurkan Massively Multilingual Speech yang menyediakan pengenalan ucapan, identifikasi bahasa, serta teknologi sintesis ucapan di lebih dari 1,100 bahasa.