Teknologi

Tes Benchmark, Code Llama Besutan Meta Lampaui GPT-3.5

×

Tes Benchmark, Code Llama Besutan Meta Lampaui GPT-3.5

Share this article
Ilustrasi Code Llama
Code Llama Besutan Meta Lampaui GPT-3.5 (Unsplash)

Ayo24 – Pada tanggal 18 bulan September 2023 lalu, dunia menyambut dengan antusiasme hadirnya ‘Llama 2 (LLaMa2),’ generasi terbaru dari model bahasa besar berbasis kecerdasan buatan (AI) yang diumumkan sebagai open source oleh Meta.

Namun, dalam waktu singkat, tepatnya 40 hari setelah LLaMa2, Meta menggebrak dengan inovasi terbaru, yaitu ‘Code Llama,’ model AI generasi baru yang mampu memahami dan menghasilkan kode komputer serta bahasa manusia secara bersamaan.

‘Code Llama’ adalah terobosan terbaru dalam dunia kecerdasan buatan.

Model ini memiliki kemampuan unik untuk memahami dan menghasilkan kode komputer dari perintah bahasa manusia, yang saat ini terbatas pada bahasa Inggris.

Salah satu aspek hebat dari Code Llama adalah bahwa ia tersedia secara gratis untuk tujuan penelitian dan komersial, membuka pintu bagi pengembang dan peneliti untuk meningkatkan produktivitas mereka.

Code Llama didasarkan pada ‘Llama 2’ dan hadir dalam tiga model berbeda, masing-masing dengan jumlah parameter yang besar, yaitu 70 miliar, 130 miliar, dan 34 miliar.

Setiap model telah dilatih dengan 500 miliar token kode dan data terkait dengan kode.

Model 7B (70 miliar) dan 13B (130 miliar) memiliki kemampuan khusus untuk menyisipkan kode ke dalam kode yang sudah ada, sehingga memungkinkan penyelesaian kode yang cepat dan efisien.

Ketiga model tersebut dirancang untuk memenuhi berbagai kebutuhan layanan dan persyaratan waktu respons yang berbeda.

Misalnya, model 7B dapat digunakan dengan GPU tunggal, sementara model 34B memberikan hasil terbaik dan dukungan pengkodean yang lebih baik.

Model-model berukuran lebih kecil, seperti 7B dan 13B, sangat cocok untuk tugas-tugas dengan kebutuhan waktu respons yang rendah, seperti penyelesaian kode real-time.

Selain itu, Code Llama mampu menghasilkan program yang lebih panjang, dan semakin panjangnya rangkaian perintah yang diberikan, semakin kompleks pula kode yang dihasilkan.

Ini memberikan manfaat besar bagi pengguna yang ingin memasukkan lebih banyak konteks dari basis kode mereka, sehingga menghasilkan hasil yang lebih relevan.

Hal ini juga dapat membantu pengembang dan peneliti dalam men-debug skenario yang melibatkan basis kode besar yang sulit dijangkau secara manual.

Code Llama memiliki dua varian tambahan, yaitu ‘Code Llama – Python’ dan ‘Code Llama – Instruct,’ yang dioptimalkan untuk bahasa Python dan tugas spesifik. Code Llama – Python, misalnya, telah ditingkatkan untuk memahami dan menghasilkan kode Python dalam skala yang lebih detail.

LLaMa2
Hasil tes benchmark beberapa AI (Meta)

Untuk menguji performa Code Llama, Meta menggunakan dua benchmark, yaitu HumanEval dan MBPP (Mostly Basic Python Programming).

Hasilnya mengesankan, di mana Code Llama mengungguli model bahasa besar yang ada.

Sebagai contoh, Code Llama 34B mencatatkan 53,7% dalam uji HumanEval dan 56,2% dalam uji MBPP, angka yang mengungguli solusi terkini yang tersedia.

Leave a Reply

Your email address will not be published. Required fields are marked *