?>

Dünyanın ilk yapay zeka yazılım mühendisi başarısız oldu

Cognition AI tarafından geliştirilen ve Devin olarak adlandırılan dünyanın ilk yapay zeka yazılım mühendisi, kendisine verilen görevlerin yüzde 85’inde başarısız olarak sınıfta kaldı.

Teknoloji - 2 ay önce

Cognition AI tarafından geliştirilen ve Devin olarak adlandırılan dünyanın ilk “yapay zeka yazılım mühendisi” görünüşe göre işini yapmakta oldukça kötü. Yapılan son değerlendirmeler, bu yeni nesil aracın vaat edilen potansiyelden çok uzak olduğunu ortaya koyuyor. Testlerde Devin’in, kendisine verilen görevlerin yalnızca yüzde 15’ini başarıyla tamamladığı görüldü.

BEKLENTİLER BÜYÜKTÜ

Donanımhaber'de yer alan ayrıntılarda aktardığına göre 2024 yılının başlarında Cognition AI tarafından tanıtılan Devin, yazılım mühendislerine yardımcı olmayı amaçlayan bir otomasyon aracı olarak geliştirildi. Aralık 2024'te aylık 500 dolarlık abonelik ücretiyle genel kullanıma sunulan Devin'in, uygulama geliştirme ve hata giderme gibi görevleri baştan sona otonom bir şekilde gerçekleştirebildiği iddia edildi. Araç, Slack üzerinden komut alıyor ve Docker tabanlı bir çalışma ortamında terminal, tarayıcı, kod düzenleyici ve planlayıcı gibi araçlarla çalışıyor.

Cognition AI'nin açıklamasına göre Devin; API entegrasyonu, kod incelemeleri, altyapı yönetimi gibi görevleri yerine getirebiliyor. Hatta DoorDash üzerinden yemek siparişi verebilecek kadar "kişisel asistan" işlevi gördüğü de belirtiliyor. Bunlar, başlı başına çok büyük bir olay ve iddia.

Bu arada Devin, bir “bileşik yapay zeka sistemi”, yani OpenAI'nı GPT-4o'sunu içeren ve zaman içinde gelişmesi beklenebilecek bir dizi temel yapay zeka modeline dayanıyor. Teorik olarak onların yapabildikleri her şeyi yapması bekleniyor.

SONUÇLAR HAYAL KIRIKLIĞI OLDU

Saygın bir AI araştırma ve geliştirme laboratuvarı olan Answer.AI'dan üç veri bilimcisi Hamel Husain, Isaac Flath ve Johno Whitaker, bu iddiaları test etmek için bir dizi denemeler gerçekleştirdi. Devin ile test edilen 20 görevden sadece üçü başarıyla tamamlanabildi. Devin’in tamamladığı görevler arasında Notion veritabanından Google Sheets’e veri aktarma ve gezegen hareketlerini takip edebilen bir uygulama geliştirme bulunuyor. Ancak daha karmaşık görevlerde Devin, teknik çıkmazlara saplandı veya hatalı çözümler üretti.

Araştırmacılar, Devin'in temel engelleri fark edemediğini ve uygulanabilir olmayan çözümleri zorlamaya devam ettiğini belirtti. Örneğin, Devin’den birden fazla uygulamayı Railway platformuna dağıtması istendiğinde, bu platformun böyle bir özelliği desteklemediğini anlamadı. Günlerce çözüm arayarak zaman kaybetti ve hayali özellikler "uydurdu." Araştırmacılar, Devin’in arayüzünün kullanıcı dostu olduğunu ve bazı görevlerde umut verici sonuçlar verdiğini kabul etseler de, aracın güvenilir olmaktan uzak olduğunu vurguladı: “Daha da endişe verici olan, hangi görevlerin başarılı olacağını tahmin edemememizdi. İlk başarılarımıza benzer görevler bile karmaşık, zaman alıcı yollarla başarısız oluyordu.”

Haftanın Öne Çıkanları

Kartalkaya Kayak Merkezindeki otel sahibi kim? Mazhar Murtezaoğlu kimdir?

2025-01-21 15:09 - Gündem

AKP’li Şamil Tayyar’dan ‘denetim’ çıkışı: ‘Turizm belgeli işletmelerin denetimi bakanlığa aittir’

2025-01-23 01:39 - Siyaset

Mardin'de silahlı kavga: 17 yaşındaki genç hayatını kaybetti

2025-01-17 01:39 - Asayiş

Zafer Partisi lideri Ümit Özdağ'a destek için 'Vatan Emniyet' önünde toplanıldı

2025-01-21 00:38 - Siyaset

Tanju Özcan 'kirli bilgiler geliyor' dedi: Savcı ve bilirkişilere 'baskı' iddiası

2025-01-24 00:08 - Siyaset

Fenerbahçe'den Zalgiris karşısında muhteşem geri dönüş!

2025-01-18 00:00 - Spor

Yanan otelin yetkilisi 3 gün önce konuşmuş: 'Oteller hazır, misafirlerini bekliyor'

2025-01-21 15:08 - Gündem

Adı Süper Lig devleriyle anılıyordu: Eyüpspor'dan Ahmed Kutucu için transfer açıklaması

2025-01-20 00:09 - Spor

Hacı Sabancı kimdir, kaç yaşında? Hacı Sabancı babalık davası sonucu ne oldu?

2025-01-19 00:39 - Biyoğrafi

Son Dakika... AFAD duyurdu: Çanakkale açıklarında 5.2 büyüklüğünde deprem!

2025-01-22 00:08 - Gündem

İlgili Haberler

Elon Musk'tan yeni hamle; yapay zeka şirketi X'i satın aldı

00:00 - Teknoloji

Şirketler artık klasik CV ile alım yapmıyor: Yapay zekâ başrolde

00:00 - Teknoloji

Dünya Ekonomik Forum Raporu’na göre mesleklerin yüzde 22’si dönüşecek: İşler kökten değişiyor

00:00 - Teknoloji

PlayStation'da binlerce oyunda indirim başladı

00:00 - Teknoloji

Online basın bülteni servisi inceledi: Siber saldırılarda tarihi rekor, 1,3 milyar kişi mağdur!

00:00 - Teknoloji

Günün Manşetleri

19 Mart'ın faturası büyüyor: Mehmet Şimşek yine para ve ikna yolunda!

13:09 - Ekonomi

Toplum sağlığı derneklerinden gözaltı sürecine tepki: 'Uygulamalar derhal sonlandırılmalıdır�

13:08 - Sağlık

Genç polisin acı ölümü: Arbede sırasında fenalaştı, hastanede şehit oldu

11:08 - Gündem

Amasya'da 'İmamoğlu' protestosu: 'Meydanlar durmayacak!'

10:38 - Gündem

Samsun’da KESK, DİSK, TTB ve TMMOB ses yükseltti: ‘Geleceğimizden vazgeçmiyoruz’

09:39 - Gündem