OpenAI, yapay zeka alanında yeni bir dönemi başlatan önemli bir adım atıyor. Şirket, kullanıcılar adına basit çevrimiçi görevleri yerine getirebilen ilk yapay zeka ajanı olan "Operator"ı duyuruyor. Bu gelişme, yapay zekanın günlük hayatımıza entegrasyonunda önemli bir dönüm noktası olarak görülüyor.

Operator nedir ve nasıl çalışır?

Operator, OpenAI'ın geliştirdiği yeni bir model olan Computer-Using Agent (CUA) tarafından desteklenen bir web uygulaması. Bu uygulama, konser bileti almak veya çevrimiçi market alışverişi yapmak gibi basit görevleri bir tarayıcı üzerinden gerçekleştiriyor.

CUA modeli, grafiksel kullanıcı geliştirmeleriyle (butonlar, metin programları, menüler) etkileşim geçişi için tasarlanmış, GPT-4o tabanlı bir çok modlu bir dil modeli. Bu özellik, Operator'ın çoğu web sitesinde görev yapabilmesini sağlayabilir.

OpenAI’da bilim insanı olan Reiichiro Nakano, “Geleneksel olarak, modellerin yazılımları kullanma şekli özel API’ler aracılığıyla olmuştur” diyor. Nakano, bu yaklaşımın birçok uygulamayı ve çoğu web sitesini erişilemez kıldığını belirtiyor: “Ancak, insanların günlük olarak kullandığı arayüzlerini kullanabilen bir model oluşturursanız, daha önce erişilemeyen yepyeni bir yazılım yelpazesinin kapılarını açmış olursunuz.”

Operator'ın yetenekleri ve performansı

OpenAI, Operator'ın benzer rakip araçlardan daha iyi performans gösterdiğini iddia ediyor. Şirket, CUA modelini çeşitli endüstri kıyaslamalarına tabi tutuyor ve etkileyici sonuçlar elde edildiğini belirtiyor. Örneğin, OSWorld adlı kıyaslamada CUA, PDF dosyalarını birleştirme veya bir görüntüyü manipüle etme gibi görevlerde 38.1 başarı oranı elde ettiğini aktarıyor. 

Ayrıca, bir tarayıcıda görevleri ne kadar iyi gerçekleştirdiğini test eden WebVoyager kıyaslamasında CUA, yüzde 87'lik bir puanı elde ettiği vurgulanıyor. Bu sonuç, Google DeepMind'ın Mariner aracının yüzde 83.5'lik ve Computer Use'un yüzde 56'lık skorlarından daha yüksek olduğunu gösteriyor.

Güvenlik ve etik kaygılar

OpenAI, CUA'nın güvenliğini test etmek için "kırmızı takımları" kullandığını söylüyor. Bu testler, kullanıcıların tehlikeli istekleri (örneğin, biyolojik silah yapımı hakkında araştırma) karşısında kırmızı takımların nasıl davrandığını, ayrıca web sitelerinde gizli talimatlara karşı nasıl bir tepki, öneri ve hata içerebildiği gibi güvenlik testlerini araştırıyor.

OpenAI araştırmacısı Casey Chu, "Modeli, harici yan etkileri olan herhangi bir şey yapmadan önce durup kullanıcıdan bilgi istemesi için eğittik," diyerek güvenlik önlemlerini aktarıyor.

Operator'ın kullanımı ve avantajları

Operator'ı kullanmak için, kullanıcılar bir metin kutusuna talimatlar yazıyor. Ancak bu talimatlar kullanıcının kendi bilgisayarındaki tarayıcıyı açmak yerine, OpenAI'ın sunucusunda çalışan uzak bir tarayıcıya gönderiliyor. OpenAI, bu durumun sistemi daha verimli hale getirdiğini iddia ediyor.

Operator Bulut ortamında çalıştığı için, aynı anda birden fazla görevi yerine getirebiliyor. OpenAI araştırmacısı Yash Kumar, Operator'ı evde kullandığını ve özellikle market alışverişi konusunda yardımcı olduğunu belirtiyor.

İş birlikleri ve gelecek planları

OpenAI, Operator'ın yeteneklerini genişletmek için OpenTable, StubHub, Instacart, DoorDash ve Uber gibi çeşitli işletmelerle iş birliği yaptığını belirtiyor. Bu iş birlikleri kesinleşmese de, Operator'ın belirli görevler için önceden ayarlanmış web sitelerini önerdiği görülüyor.

Gelecek beklentileri

Operator, büyük dil modellerinin soru cevaplamaktan çok daha fazlasını yapma potansiyelini gösteren heyecan verici bir örnek. Ancak OpenAI, Operator'ın hala deneysel bir çalışma olduğunu ve hata yapabileceğini belirtiyor.

Allen AI Enstitüsü (AI2) CEO'su Ali Farhadi, "Metin ve görüntü oluşturmaktan yeni şeyler yapmaya geçmek doğru yöndür. Bu, iş dünyasının önünü açar ve yeni sorunları çözer," diyerek bu tür araçların potansiyelini vurguluyor.

Operator'ın lansmanı, yapay zeka üstünlüğü için verilen mücadelenin yeni bir cepheye taşındığını gösteriyor: bilgisayar ekranlarımız. Önümüzdeki dönemde, bu tür araçların daha da gelişmesi ve günlük hayatımızda daha fazla yer edinmesi bekleniyor. Ancak bu gelişmeler beraberinde etik ve güvenlik konularında yeni tartışmaları da getirecek gibi görünüyor.

Bağlantı kopyalandı!