Yapay zekaya ne kadar güveniyorsunuz?

Ceyhun Mısırlıoğlu - ceyhunm@gmail.com 17 Kas 2024

OpenAI'ın bir sonraki 'dev atılımı' yakında inecek ve bilgisayarınızı kontrol edecek!

Sohbet robotlarını unutun, yapay zekanın bir sonraki büyük numarasının sizin adınıza bilgisayar tabanlı işleri yürütebilecek yapay zeka ajanları olması bekleniyor ve yeni bir rapor OpenAI'nin versiyonunun çok yakında çıkacağını iddia ediyor.

Bloomberg ve bir kaç kaynağa göre OpenAI'nin kod adı 'Operator' olan yeni aracı Ocak ayında piyasaya sürülebilir. Görünüşe göre başlangıçta bir araştırma önizlemesi olarak ve geliştiricilerin ellerini almaları için şirketin uygulama programlama arayüzü (API) aracılığıyla yayınlanacak.

Yapay zeka ajanları, bilgisayarınızı sizin adınıza gözetim olmadan çalıştırmak üzere tasarlanmıştır. Anthropic'in Claude için geliştirdiği benzer 'bilgisayar kullanım' aracı gibi OpenAI'nin Operatörünün de kod yazmak ya da seyahat rezervasyonu yapmak gibi eylemleri gerçekleştirebilmesi bekleniyor.

Google'ın kısa süre önce sizin için web'de gezinebilen Jarvis adlı yapay zeka aracını sızdırmasıyla bu alan bir sonraki büyük yapay zeka savaş alanı olarak şekilleniyor. The Information'a göre, Aralık ayında OpenAI'yi geride bırakabilir.

Bloomberg'in kaynağına göre, Google'ın çözümü gibi OpenAI'nin eşdeğerinin de “görevleri bir web tarayıcısında yürüten genel amaçlı bir araç” olması bekleniyor. Yani, sizin adınıza masaüstü uygulamalarına pilotluk yapmaya tam olarak hazır olmasa da, OpenAI'nin Operatörü oldukça güçlü bir başka tarayıcı uzantısı gibi görünüyor.

Teknoloji devlerinin yapay zeka aracılarının bir sonraki büyük bilgi işlem platformu olduğunu düşündüklerine şüphe yok. Yakın tarihli bir Reddit AMA'da OpenAI CEO'su Sam Altman, “Bence bir sonraki dev atılım gibi hissedilecek şey bu olacak” dedi.

Altman, “IMHO bu 2025'te büyük bir tema olacak” diye ekleyerek bu belirgin atılımın da yakında geleceğini belirtti. Anthropic, Microsoft, Google ve OpenAI'den gelen son duyurular ve sızıntılar bunu kesinlikle destekliyor.

Bununla birlikte, yapay zeka aracılarının gözetim olmadan özerk bir şekilde çalışması beklendiğinden, büyük miktarda güven de talep edebilirler. ChatGPT Search gibi web'de sizin için arama yapan araçların en önemli eksikliklerinden biri de ilk sürümleri olmaları ve hala hata yapabilmeleri.

Ekim ayında OpenAI, kendi yapay zeka modellerinin doğruluğunu ölçmek için 'SimpleQA' adlı yeni bir kıyaslama yayınladı ve son o1 önizleme modeli, yeni kıyaslamada yalnızca %42'lik bir başarı oranı elde ederek oldukça kötü bir performans gösterdi.

Dolayısıyla, YZ aracıları 2025'te bir sonraki büyük hype özelliği olsa da, bilgisayar tabanlı işlerimizi otomatikleştirmeleri için onlara güvenmemiz en azından dikkatli bir gözetim olmadan biraz zaman alabilir.