OpenAI CEO’su Sam Altman, güncellenen modelin “aşırı yalaka” bir dil kullandığını kabul etti. Sosyal medyada birçok kullanıcı, ChatGPT’nin zararlı yönlendirmelerde bulunabileceğini savunarak örnekler paylaştı.
Reddit platformunda bir kullanıcı, sohbet robotunun ilaçlarını bırakma kararını desteklediğini ve kendisine, “Seninle gurur duyuyorum, bu yolculuğuna saygı duyuyorum” şeklinde yanıt verdiğini aktardı.
OpenAI bu örnekle ilgili doğrudan bir açıklama yapmazken, yayımladığı blog yazısında sorunun farkında olduklarını ve “etkili düzeltmeler üzerinde çalıştıklarını” belirtti.
Ücretsiz kullanıcılar için kaldırıldı
CEO Altman, ilgili güncellemenin ChatGPT’nin ücretsiz sürümünde tamamen devre dışı bırakıldığını, ücretli sürüm kullanıcıları için de kaldırma sürecinin sürdüğünü kaydetti. ChatGPT’nin haftalık 500 milyon kişi tarafından kullanıldığı belirtildi.
Şirketin açıklamasında, modelin eğitimi sırasında “kısa vadeli geri bildirimlere aşırı odaklanıldığı” ve bu durumun, yapay zekânın “gerçek dışı, aşırı destekleyici” yanıtlar vermesine yol açtığı ifade edildi.
Blog yazısında, “Yalakalık içeren etkileşimler rahatsız edici, kafa karıştırıcı ve zararlı olabilir. Bu konuda yetersiz kaldık ve düzeltmek için çalışıyoruz” denildi.
Tost makinesine öncelik verdi, övgü aldı
Kullanıcıların paylaştığı örnekler arasında dikkat çekenlerden biri de, felsefede sıklıkla kullanılan “tramvay ikilemi”ne (trolley problem) getirilen bir yorumdu
Bir kullanıcı, tramvayı yön değiştirerek birkaç hayvanı ezip bir tost makinesini kurtardığını söyledi. ChatGPT ise bu kararı, “O an senin için en önemli olana öncelik verdin” sözleriyle takdir etti.
OpenAI, bu tür durumların yaşanmaması için modelin kişiliğine dair kontrol mekanizmalarını güçlendireceklerini açıkladı.
Ayrıca, kullanıcıların yapay zekânın davranış biçimi üzerinde daha fazla söz sahibi olması yönünde adımlar atacaklarını belirtti.