Meta Merilis Model AI untuk Terjemahkan Ucapan di Antara Berbagai Bahasa

Meta Merilis Model AI untuk Terjemahkan Ucapan di Antara Berbagai Bahasa
Model SeamlessM4T dapat melakukan terjemahan ucapan ke teks, ucapan ke ucapan, teks ke ucapan, dan teks ke teks hingga 100 bahasa termasuk Bahasa Arab standar modern. Perusahaan induk Facebook, Meta Platforms, pada hari Selasa merilis model Artificial Intelligence (AI) yang mampu menerjemahkan dan menyalin ucapan dalam puluhan bahasa, sebuah potensi dasar untuk alat yang memungkinkan komunikasi real-time lintas bahasa. Perusahaan tersebut mengatakan dalam sebuah posting blog, bahwa model SeamlessM4T-nya dapat mendukung terjemahan antara teks dan ucapan dalam hampir 100 bahasa, serta terjemahan ucapan ke ucapan penuh untuk 35 bahasa, termasuk Bahasa Arab standar modern, Persia Barat, dan Urdu. Meta telah membangun inovasi masa lalu yang menggabungkan teknologi yang sebelumnya hanya tersedia dalam model terpisah, seperti No Language Left Behind (NLLB) dan Penerjemah Ucapan Universal, untuk membuat model multibahasa terpadu ini. CEO Mark Zuckerberg mengatakan, dia membayangkan alat seperti itu memfasilitasi interaksi antara pengguna dari seluruh dunia di metaverse, kumpulan dunia virtual yang saling berhubungan di mana dia mempertaruhkan masa depan perusahaan. Meta membuat model tersedia untuk umum untuk penggunaan non-komersial, kata posting blog tersebut. Perusahaan media sosial terbesar di dunia telah merilis banyak model AI gratis tahun ini, termasuk model bahasa besar yang disebut Llama yang menimbulkan tantangan serius bagi model berpemilik yang dijual oleh OpenAI yang didukung Microsoft dan Google Alphabet. Zuckerberg mengatakan ekosistem AI terbuka bekerja untuk keuntungan Meta, karena perusahaan memiliki lebih banyak keuntungan dengan secara efektif mengumpulkan sumber pembuatan alat yang menghadap konsumen untuk platform sosialnya daripada dengan mengenakan biaya untuk akses ke model. Meskipun demikian Meta menghadapi pertanyaan hukum yang serupa dengan industri lainnya seputar data pelatihan yang diserap untuk membuat modelnya. Pada Juli komedian Sarah Silverman dan dua penulis lainnya mengajukan tuntutan hukum pelanggaran hak cipta terhadap Meta dan OpenAI, menuduh perusahaan tersebut menggunakan buku mereka sebagai data pelatihan tanpa izin. Untuk model SeamlessM4T, peneliti Meta mengatakan dalam makalah penelitian bahwa mereka mengumpulkan data pelatihan audio dari 4 juta jam audio mentah yang berasal dari repositori data web yang dirayapi yang tersedia untuk umum, tanpa menentukan repositori mana. Seorang juru bicara Meta tidak menanggapi pertanyaan tentang asal usul data audio tersebut. Data teks berasal dari kumpulan data yang dibuat tahun lalu yang menarik konten dari Wikipedia dan situs web terkait, kata makalah penelitian itu. Meta dikatakan telah melakukan penelitian ekstensif tentang mitigasi toksisitas dan bias dalam model AI generatifnya, sehingga menghasilkan model yang lebih sadar dan responsif terhadap potensi masalah. Awal tahun ini, Meta bergabung dengan Alphabet, Microsoft, dan OpenAI untuk mengumumkan kerangka kerja bersama mengenai penggunaan AI yang bertanggung jawab guna memitigasi risiko yang terkait dengan alat AI generatif. (ArabNews/Red)