SAN FRANCISCO - Laboratorium Kecerdasan Buatan atau Artificial Intelligence (AI) terapan Amerika Serikat, Cognition, baru-baru ini meluncurkan Devin, insinyur perangkat lunak AI yang sepenuhnya otonom pertama di dunia.

Dengan bantuan Devin, para insinyur dapat fokus pada masalah yang lebih penting dan tim teknik dapat berupaya mencapai tujuan yang lebih ambisius.

Dilansir dari situs resmi Cognition, dengan penalaran dan perencanaan jangka panjang, Devin dapat merencanakan dan melaksanakan tugas teknis rumit yang memerlukan ribuan keputusan. Devin dapat mengingat konteks yang relevan di setiap langkah, belajar seiring waktu, dan memperbaiki kesalahan.

"Kami juga telah melengkapi Devin dengan alat pengembang umum termasuk shell, editor kode, dan browser dalam lingkungan komputasi sandbox, semua yang dibutuhkan manusia untuk melakukan pekerjaan mereka," kata Scott Wu, penggagas Devin sekaligusvpendiri Cognition.

"Terakhir, kami memberi Devin kemampuan untuk berkolaborasi secara aktif dengan pengguna. Devin melaporkan kemajuannya secara real time, menerima masukan, dan bekerja sama dengan Anda melalui pilihan desain sesuai kebutuhan," ujarnya.

Wu mencontohkan, Devin dapat mempelajari cara menggunakan teknologi asing.

"Setelah membaca postingan blog, Devin menjalankan ControlNet di Modal untuk menghasilkan gambar dengan pesan tersembunyi".

Selain itu, Devin dapat membangun dan menerapkan aplikasi secara "end to end".
Devin membuat website interaktif yang mensimulasikan Game of Life.

"Ini secara bertahap menambahkan fitur yang diminta oleh pengguna dan kemudian menyebarkan aplikasi ke Netlify," ujarnya.

Devin juga dapat secara mandiri menemukan dan memperbaiki bug di basis kode, dengan membantu memelihara dan men-debug buku pemrograman kompetitif sumber terbuka miliknya.

Devin dapat melatih dan menyempurnakan model AI-nya sendiri.‍ Devin menyiapkan penyesuaian untuk model bahasa besar hanya dengan memberikan tautan ke repositori penelitian di GitHub.

"Devin dapat mengatasi bug dan permintaan fitur di repositori open source. Hanya dengan adanya tautan ke masalah GitHub, Devin melakukan semua penyiapan dan pengumpulan konteks yang diperlukan," kata Wu.

Dia menjelskan, fevin dapat berkontribusi pada repositori produksi yang matang. Wu bahkan mencoba memberi Devin pekerjaan nyata di Upwork dan Devin juga bisa melakukannya.

"‍Di sini , Devin menulis dan men-debug kode untuk menjalankan model visi komputer. Devin mengambil sampel data yang dihasilkan dan menyusun laporan di akhir," tuturnya.


Penampilan Devin

Wu mengevaluasi Devin di SWE-bench , sebuah tolok ukur yang meminta agen untuk menyelesaikan masalah GitHub dunia nyata yang ditemukan dalam proyek sumber terbuka seperti Django dan scikit-learn.

Dari hasil tes, Devin menyelesaikan 13,86 persen masalah secara menyeluruh, jauh melebihi penyelesaian mutakhir sebelumnya sebesar 1,96 persen Bahkan ketika diberikan file yang tepat untuk diedit, model terbaik sebelumnya hanya dapat menyelesaikan 4,80 persen masalah.

*Devin dievaluasi pada 25 persen subset acak dari kumpulan data. Devin tidak dibantu, sedangkan semua model lainnya dibantu (artinya model diberi tahu secara pasti file mana yang perlu diedit)," kata Wu.

Dia menambahkan, Devin saat ini berada dalam akses awal seiring peningkatan kapasitas perusahaan.

Baca Juga: