Daha az zaman harcayarak günlük işlerinizi halletmek ister misiniz? Tam bu noktada ChatGPT Agent devreye giriyor. 17 Temmuz’da OpenAI tarafından duyurulan bu yapay zeka asistanı, kullanıcının belirlediği hedefleri gerçekleştirmek için kendi sanal bilgisayarında eylemler yapabilir, komutlar çalıştırabilir ve çok adımlı görevleri planlayabilir. Bu yazıda öncelikle yapay zeka asistanının nasıl çalıştığını, hayatınızı nasıl kolaylaştıracağını, nasıl erişim sağlanabileceğinizi, mimarisini ve son olarak da performansını kanıtlayan test sonuçlarını adım adım inceleyeceğiz.
ChatGPT Agent Nedir ve Nasıl Çalışır?
ChatGPT, başlangıçta yalnızca metin üretme, özet çıkarma, çeviri yapma, kod yazma, e-posta taslağı hazırlama, fikir önerme ve genel bilgi sağlama gibi konuşmaya dayalı görevlerde kullanılabiliyordu. Kullanıcılar, modelden aldığı metinsel çıktıları manuel olarak alıp başka sistemlerde uygulamak zorundaydı. Artık ChatGPT Agent ile bu sınır ortadan kalktı. Artık model sadece öneri sunmakla kalmıyor; aynı zamanda işlemleri kullanıcı adına gerçekleştirebiliyor. Geliştirilen bu yeni yetenek sayesinde, ChatGPT belirli bir hedef doğrultusunda çok adımlı görevleri kendi sanal ortamında yürütebiliyor, komutlar çalıştırabiliyor ve bu süreci baştan sona takip edebiliyor.
Peki Neler Yapabilir?
ChatGPT Agent, seninle birlikte çalışan, işlerini hızlandıran ve seni pek çok zahmetli adımdan kurtaran dijital bir eylemci gibi hareket eder. Zamanını boşa harcamana gerek kalmaz. Tatil planı yaparken en uygun uçak bileti ve konaklama seçeneklerini senin yerine araştırabilir. Akşam yemeği için gitmek istediğin restorana rezervasyon oluşturabilir. Alışveriş yapmak istediğin ürünleri çeşitli web sitelerinde tarayarak senin adına seçebilir ve süreci ödeme adımına kadar taşıyabilir. Ayrıca bir takım arkadaşı gibi davranarak toplantı kayıtlarını ve e‑postalarını inceleyip özetleyebilir. Sana özel bir çalışma planı hazırlayabilir. Gerekirse e‑postalara senin yerine yanıt verebilir ve yazışmaları baştan sona yürütebilir. Tüm bu işlemleri kendi sanal ortamında gerçekleştirirken güvenliği ön planda tutar. Kritik adımlarda senin onayını alır ve kontrolü her zaman sende bırakır. Kısacası, ChatGPT Agent yalnızca sohbet eden bir yapay zekâ değil; gerektiğinde araştıran, analiz eden, hazırlayan ve senin yerine adım atan bir dijital çalışma arkadaşına dönüşür.
ChatGPT Agent'a Nasıl Erişilir?
ChatGPT Agent, şu anda yalnızca ChatGPT’nin Pro, Plus ve Team abonelik planlarına dâhil kullanıcılar için erişilebilir durumdadır. Bu özelliğe ulaşmak için, ChatGPT arayüzünde sohbet ekranının üst kısmında bulunan araçlar menüsünden “Agent Mode” / “Ajan Modu” seçeneği seçilmelidir. Agent’ın etkinleştirilmesi herhangi bir konuşmanın herhangi bir anında yapılabilmektedir.
Kullanım hakları bakımından her abonelik planı farklı limitlerle çalışır. Pro kullanıcıları, ayda yaklaşık 400 agent mesajı kullanma hakkına sahiptir. Plus ve Team kullanıcılarına ise bu hak daha sınırlı olup ayda 40 mesaj erişim tanınır.
ChatGPT Agent Mimarisi
ChatGPT Agent sistemi, daha önce OpenAI tarafından geliştirilen üç yapının birleşiminden oluşmaktadır. Bunlardan ilki, bir kullanıcı gibi tarayıcı üzerinde işlem yapabilen Operator sistemidir. Web sitelerinde gezinme, butonlara tıklama, formları doldurma gibi eylemleri gerçekleştirme yeteneği bu yapıdan alınmıştır. İkinci kaynak, derin içerik taramaları yapabilen ve belgeler arasında mantıklı çıkarımlar kurarak kullanıcıya anlamlı özetler sunabilen Deep Research sistemidir. Bu sayede Agent, sadece yüzeysel bilgilerle değil, çok katmanlı ve araştırmaya dayalı içeriklerle de çalışabilmektedir. Üçüncü unsur ise, ChatGPT’nin dil anlayışı, diyalog kurma yeteneği ve görevleri yorumlayıp yönetebilme becerisidir.
ChatGPT Agent geliştirilirken sadece yetenekli ve çok yönlü olması değil, güvenli bir şekilde çalışması da dikkat edilen bir diğer kısımdır. Çünkü artık model, gerçek dünyayı etkileyen işlemler yapmaktadır. Bu nedenle mimari, kontrolün her zaman son kullanıcıda kalacağı şekilde tasarlanmıştır. Örneğin satın alma işlemi gibi önemli sonuçları olan işlemlerde agent kullanıcının onayını isterken e-posta göndermek gibi kritik öneme sahip belli görevler için kullanıcının aktif olarak izlemesi beklenir. Banka transferleri gibi yüksek riskli görevleri ise aktif olarak reddedecek şekilde eğitilmiştir.
Bunlara ek olarak, gizliliği korumak için kontroller eklenmiştir. ChatGPT ayarlarından gezinme verileri silinebilir ve aktif web sitesi oturumları kapatılabilir. ChatGPT’nin tarayıcıda yaptığı işlemler sırasında girilen şifreler, kişisel bilgiler saklanmaz.
Benchmarks ve Performans Ölçümleri
ChatGPT Agent’ın yetenekleri, farklı alanlara yönelik çeşitli değerlendirme testleriyle ölçülmüştür. Uzman düzeyinde bilgi gerektiren sorulara verilen yanıtların kalitesini değerlendiren Humanity’s Last Exam (HLE) testi, henüz yayımlanmamış zor matematik problemlerinin çözüldüğü FrontierMath testi, veri bilimi görevlerini içeren DSBench testi ve gerçek dünyadan alınan Excel dosyaları üzerinde yapılan SpreadsheetBench testi gibi çok sayıda kıyaslamada değerlendirme yapılmıştır. Bu testler, gerçek dünyaya yakın senaryolarla modelin analiz, karar verme ve işlem yürütme becerilerini ölçmeyi amaçlamaktadır.
Bu değerlendirmeler sonucunda, ChatGPT Agent; BrowseComp testinde web üzerinde zor bulunan bilgileri arayıp bulma becerisiyle, WebArena testinde ise gerçek sitelerde işlem yapma yeteneğiyle diğer modellere kıyasla daha başarılı performans göstermiştir. Ayrıca, finansal modelleme alanında yapılan değerlendirmelerde, karmaşık tablo oluşturma, formül yazma ve finansal analiz görevlerini en doğru ve etkili şekilde yerine getiren sistem olmuştur.
Kaynakça