Meta Rilis Fitur AI di Facebook, Instagram, dan WhatsApp, tetapi Akurasi Jawaban Dipertanyakan

oleh -235 Dilihat
Chatbot Arena LLM Leaderboard, sumber : lmarena.ai

Wanua.id – Perusahaan teknologi Meta resmi merilis fitur kecerdasan buatan mereka, Meta AI, di berbagai platform media sosial seperti Facebook, Instagram, dan WhatsApp. Langkah ini menandai integrasi kecerdasan buatan secara langsung dengan jaringan media sosial populer, memberikan kemudahan akses bagi para penggunanya.

Namun, kehadiran Meta AI tidak lepas dari sorotan. Banyak pengguna melaporkan bahwa jawaban yang dihasilkan oleh Meta AI seringkali tidak akurat. Salah satu penyebab utamanya adalah keterbatasan integrasi dengan data terbaru serta kemampuan pencarian web yang belum optimal. Berbeda dengan mesin pencari khusus, Meta AI masih kesulitan mengakses informasi secara real-time dari web.

Untuk mengetahui sejauh mana akurasi berbagai model bahasa besar (LLM) dalam kecerdasan buatan, para peneliti dari SkyLab dan LMArena mendirikan platform crowdsourcing bernama Chatbot Arena. Platform ini melibatkan pengguna dalam menilai respons yang dihasilkan oleh berbagai LLM.

Berdasarkan leaderboard Chatbot Arena, beberapa LLM buatan Google dan OpenAI mendominasi peringkat sepuluh besar. Dua model unggulan dari Google, Gemini-Exp-1206 dan Gemini-2.0-Flash-Thinking-Exp-1219, menempati posisi teratas dengan skor masing-masing 1.372 dan 1.368. Penilaian ini diperoleh dari 14.652 dan 8.003 pengguna.

Menariknya, di tengah dominasi Google dan OpenAI, muncul LLM Grok-2-08-13 milik perusahaan xAI, yang didirikan oleh Elon Musk. Model ini meraih skor 1.288 dari hampir 61 ribu pengguna, hanya unggul tipis dari model Yi-Lightning milik perusahaan asal Tiongkok, 01.AI, yang mendapatkan skor 1.287 dari 29.185 pengguna.

Metodologi Chatbot Arena melibatkan perbandingan berpasangan, di mana pengguna diminta untuk mengajukan pertanyaan kepada dua LLM anonim. Setelah menerima jawaban, pengguna memberikan suara pada LLM yang dianggap lebih baik. Identitas model hanya akan diungkap setelah pemungutan suara selesai.

Untuk memastikan analisis yang andal, Chatbot Arena menggunakan teknik statistik seperti Bradley-Terry model dan E-values. Platform ini telah beroperasi sejak April 2023 dan berhasil mengumpulkan lebih dari 240 ribu suara dari sekitar 90 ribu pengguna, dengan lebih dari 100 ribu pertanyaan yang diajukan dalam berbagai bahasa.

Dengan persaingan ketat di dunia kecerdasan buatan, Meta masih memiliki pekerjaan rumah besar untuk meningkatkan akurasi dan kemampuan pencarian real-time Meta AI agar dapat bersaing dengan para pemain utama di industri ini.

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *