Qwen 2.5 dari Alibaba: Model Open-Source Terbaik untuk Matematika dan Koding
Alibaba’s Qwen 2.5 is top open-source model in math and coding https://dailyai.com/2024/09/alibabas-qwen-2-5-is-top-open-source-model-in-math-and-coding/

By Sang Ruh 23 Sep 2024, 15:23:38 WIB | 👁 24 Programming
Qwen 2.5 dari Alibaba: Model Open-Source Terbaik untuk Matematika dan Koding

Keterangan Gambar : Qwen 2.5 dari Alibab


Alibaba Rilis Lebih dari 100 Model AI Sumber Terbuka, Termasuk Qwen 2.5 72B

Alibaba baru-baru ini meluncurkan lebih dari 100 model AI sumber terbuka, termasuk Qwen 2.5 72B, yang mengungguli model sumber terbuka lainnya dalam benchmark matematika dan pemrograman. Sementara perhatian industri AI banyak tertuju pada upaya Meta dengan Llama 3, Qwen 2.5 dari Alibaba telah berhasil menutup kesenjangan secara signifikan.

Keluarga model Qwen 2.5 yang baru dirilis memiliki ukuran mulai dari 0,5 hingga 72 miliar parameter, dengan model dasar yang umum serta model yang fokus pada tugas-tugas tertentu. Alibaba mengklaim bahwa model-model ini memiliki "pengetahuan yang lebih baik dan kemampuan yang lebih kuat dalam matematika dan pemrograman," dengan model khusus yang ditujukan untuk coding, matematika, dan berbagai modalitas termasuk bahasa, audio, dan visi.

Alibaba Cloud juga mengumumkan peningkatan pada model unggulannya, Qwen-Max, yang tidak dirilis sebagai sumber terbuka. Meskipun benchmark Qwen 2.5 Max terlihat menjanjikan, model Qwen 2.5 72B lah yang paling menarik perhatian para penggemar sumber terbuka.

Benchmark menunjukkan bahwa Qwen 2.5 72B mengalahkan model flagship Meta yang jauh lebih besar, Llama 3.1 405B, dalam beberapa aspek, terutama dalam matematika dan pemrograman. Jarak antara model sumber terbuka dan model proprietary seperti yang dibuat oleh OpenAI dan Google juga semakin menyusut.

Pengguna awal Qwen 2.5 72B melaporkan bahwa model ini hampir setara dengan Sonnet 3.5 dan bahkan mengalahkan model o1 dari OpenAI dalam pemrograman. Alibaba menyatakan bahwa model-model baru ini dilatih menggunakan dataset besar yang mencakup hingga 18 triliun token. Model Qwen 2.5 memiliki jendela konteks hingga 128k dan dapat menghasilkan output hingga 8k token.

Peralihan ke model yang lebih kecil, lebih mampu, dan gratis ini kemungkinan akan berdampak lebih luas bagi banyak pengguna dibandingkan model yang lebih canggih seperti o1. Kemampuan edge dan on-device dari model ini memungkinkan pengguna untuk mendapatkan manfaat besar dari model gratis yang dapat dijalankan di laptop mereka.

Selain LLM, Alibaba juga merilis pembaruan signifikan pada model bahasa visualnya dengan memperkenalkan Qwen2-VL, yang dapat memahami video berdurasi lebih dari 20 menit dan mendukung tanya jawab berbasis video. Model ini dirancang untuk integrasi ke dalam ponsel, mobil, dan robot untuk memungkinkan otomatisasi operasi yang memerlukan pemahaman visual.

Alibaba juga memperkenalkan model teks-ke-video baru sebagai bagian dari keluarga model pembangkit gambar, Tongyi Wanxiang. Model ini dapat menghasilkan konten video berkualitas sinematik dan animasi 3D dengan berbagai gaya artistik berdasarkan prompt teks. Demos yang ditampilkan terlihat mengesankan dan alat ini gratis untuk digunakan, meskipun pengguna perlu mendaftar dengan nomor ponsel China.

View all comments

Write a comment