Restartid.com – Dalam persaingan ketat dunia kecerdasan buatan, Alibaba tidak tinggal diam. Setelah DeepSeek menjadi aplikasi AI paling banyak diunduh secara global, raksasa teknologi asal Tiongkok ini meluncurkan model AI terbaru mereka, Qwen2.5-VL. AI ini diklaim mampu menangani berbagai tugas kompleks, mulai dari menganalisis teks dan gambar, membaca dokumen, memahami video, hingga mengontrol komputer.
Bahkan, Alibaba dengan percaya diri menyatakan bahwa Qwen2.5-VL lebih unggul dibandingkan GPT-4o dari OpenAI, Claude 3.5 Sonnet dari Anthropic, serta Gemini 2.0 Flash dari Google dalam beberapa aspek utama. Lantas, apa saja keunggulan AI terbaru ini?
Keunggulan Qwen2.5-VL: Pesaing Kuat dalam Dunia AI Multimodal
Qwen2.5-VL adalah bagian dari seri Qwen terbaru yang dikembangkan oleh Alibaba. Model ini telah tersedia untuk diuji coba melalui aplikasi Qwen Chat, dan bahkan dapat diunduh melalui platform pengembang AI Hugging Face.
Menurut tim Qwen, AI ini memiliki berbagai kemampuan canggih yang membedakannya dari model lain, di antaranya:
- Menganalisis Grafik dan Diagram
- Qwen2.5-VL dapat memahami berbagai jenis diagram dan grafik, memungkinkan analisis data yang lebih cepat dan efisien.
- Mengekstrak Data dari Dokumen
- AI ini bisa mengenali faktur, formulir, serta dokumen lainnya, mempermudah bisnis dalam memproses data secara otomatis.
- Memahami Video Panjang
- Salah satu fitur unggulannya adalah kemampuannya dalam memahami video berdurasi berjam-jam, termasuk mengenali karakter dalam film dan serial TV.
- Memesan Tiket & Navigasi Aplikasi
- Dalam demonstrasi yang dilakukan, Qwen2.5-VL mampu membuka aplikasi Booking.com di ponsel Android dan memesan tiket pesawat dari Chongqing ke Beijing secara otomatis.
Keunggulan ini mirip dengan fitur “Operator” yang diperkenalkan oleh OpenAI, di mana AI dapat melakukan tugas-tugas langsung di perangkat pengguna.
Alibaba Tegaskan Qwen2.5-VL Menggunakan Data Hak Cipta
Salah satu perbedaan besar antara Qwen2.5-VL dan model AI lainnya adalah pendekatan Alibaba dalam pelatihan modelnya.
Alibaba menegaskan bahwa AI mereka dilatih menggunakan materi berhak cipta, yang memungkinkan AI ini untuk mengenali karakter film, produk komersial, hingga berbagai merek terkenal. Ini memberikan kemampuan lebih dalam memahami konten multimedia dibandingkan pesaingnya, yang sering kali dibatasi oleh regulasi hak cipta ketat.
Namun, pendekatan ini juga menimbulkan pertanyaan terkait etika dan legalitas, terutama dalam penggunaannya di luar Tiongkok.
Kekurangan Qwen2.5-VL: Masih Terbatas di Beberapa Aspek
Meski menawarkan berbagai fitur unggulan, Qwen2.5-VL masih memiliki beberapa keterbatasan, di antaranya:
- Kurang Optimal dalam Mengontrol Komputer
- Dalam pengujian pada sistem operasi Linux, AI ini hanya mampu berpindah tab, tetapi gagal menjalankan tugas yang lebih kompleks.
- Benchmark OSWorld menunjukkan bahwa model ini memiliki skor rendah dalam meniru lingkungan komputer nyata.
- Regulasi Ketat dari Tiongkok
- Seperti model AI lainnya yang dikembangkan di Tiongkok, Qwen2.5-VL tunduk pada regulasi ketat, sehingga tidak dapat menjawab pertanyaan sensitif terkait politik, terutama yang berhubungan dengan Tiongkok dan Taiwan.
- Lisensi Ketat untuk Penggunaan Komersial
- Model unggulan Qwen2.5-VL-72B memiliki lisensi khusus Alibaba.
- Pengembang atau perusahaan dengan lebih dari 100 juta pengguna aktif bulanan harus mendapatkan izin dari Alibaba untuk menggunakan model ini secara komersial.
Varian Qwen2.5-VL: Fleksibilitas untuk Berbagai Pengguna
Untuk menjangkau lebih banyak pengguna, Alibaba juga merilis varian lebih kecil dari Qwen2.5-VL, yaitu:
- Qwen2.5-VL-3B
- Qwen2.5-VL-7B
Dua versi ini memiliki lisensi yang lebih fleksibel dibandingkan model unggulannya, sehingga dapat digunakan oleh lebih banyak pengembang tanpa batasan ketat.
Kesimpulan: Mampukah Alibaba Bersaing di Kancah AI Global?
Qwen2.5-VL jelas menunjukkan bahwa Alibaba semakin serius dalam mengembangkan teknologi AI multimodal. Dengan berbagai fitur canggih, terutama dalam pemahaman video, analisis dokumen, dan navigasi aplikasi, model ini berpotensi menjadi pesaing kuat bagi GPT-4o, Claude 3.5 Sonnet, dan Gemini 2.0 Flash.
Namun, tantangan besar masih menanti Alibaba, terutama dalam mengatasi batasan regulasi dan meningkatkan kemampuannya dalam pengendalian perangkat komputer.
Apakah Qwen2.5-VL akan menjadi standar baru dalam AI multimodal? Atau justru masih kalah bersaing dengan raksasa AI Barat? Waktu yang akan menjawabnya.