Top OpenAI'nin ChatGPT'si Cevaplarken Başarısız Oluyor

Tam olarak 6 aydır OpenAI’s ChatGPT yayında. Aslında, şirket son zamanlarda ChatGPT 4’ü piyasaya sürdü. Bu teknoloji dünyayı yeni bir seviyeye taşıdı.

ChatGPT, yapay zeka tarafından desteklenen bir dil modelidir ve dil çevirisi, bilgi özeti oluşturma ve soruları yanıtlama gibi birçok faaliyeti gerçekleştirmek için eğitilmiştir. Modelin olağanüstü yetenekleri, geniş bir ilgi çekmiş ve sonuç olarak birçok insan istihdam olanaklarını sorgulamaya başlamıştır.

GPT-4 dil işleme modeli, büyük miktarda veriyi analiz etmek için kullanılabilir ve analiz bulgularına dayanarak içerik oluşturabilir. Ayrıca, yeni teknoloji, belirli bir veri noktası hakkında tüketicilere bilgi sunmak için büyük miktarda metni analiz edebilmektedir.

Şüphesiz ki teknolojinin uzun süre kalacağı açık bir şekilde ortadadır. Tabii ki, teknoloji kullanıcılara birçok alanda yardımcı olmaktadır. Birçok durumda, yazı yazmaktan en zor soru kağıtlarını çözmeye kadar her şeyi başarabilme yeteneğini göstermiştir. ChatGPT'nin başaramayacağı hiçbir şey yoktur. Ancak, ChatGPT için bazı şeyler daha zor olabilir.

1. Yapay zeka destekli ChatGPT, Hindistan'da arzu edilen Ortak Giriş Sınavı (JEE)'nı geçemedi ve bir gerileme yaşadı. Ortak Giriş Sınavı, zorluğuyla tanınır ve her yıl Hindistan'ın en prestijli mühendislik okullarına kabul kazanmak isteyen binlerce öğrenciyi çeker. Karmaşık diyagramlar ve sayıları içeren zor bir nicel sınavdır.

İTÜ ve ODTÜ gibi saygın eğitim kurumlarına katılmak isteyen öğrenciler öncelikle Yükseköğretim Sınavı'ndan geçmek zorundadır. Raporlara göre, ChatGPT JEE Advanced sınavında iyi bir performans sergilemedi.

ChatGPT'nin testteki performans sonuçları tatmin edici olmaktan uzaktı, çünkü sadece kağıttaki toplam sorunun 11'ini çözebildi.

2. ChatGPT, geçmişte son derece önemli ve zorlu olan bir dizi testte başarılı olmuştur. Özellikle, Tıp Fakülteleri Milli Geçiş ve Kabul Sınavı (NEET) dahilindeki 200 sorunun tamamını denedi ve başarıyla cevapladı. NEET sınavında adayların toplam 200 sorudan 180'ini yanıtlamaları gerekmektedir.

Buna rağmen, ChatGPT tüm 200 soruya cevap vermeyi denedi ve performansının sonuçları 800 üzerinden 359 oldu. Özellikle ChatGPT, NEET sınavının Biyoloji bileşeninde oldukça iyi bir performans sergiledi ve bu bölümde sorulan sorulara daha iyi doğrulukla cevap verdi. ChatGPT'nin NEET sınavındaki performansı, JEE Advanced sınavını geçmeden bile diğer alanlarda başarılı olabileceğini göstermektedir.

ChatGPT'nin JEE Advanced testinde yaşadığı mağlubiyet, en gelişmiş yapay zeka modellerinde bile mevcut olan sınırlamaları göstermektedir. Yapay zeka, pek çok farklı endüstriyi etkileyebilme potansiyeline sahip olsa da, zorlu görevlerde insan zekasıyla rekabet edebilmesi için hala yol kat etmesi gerekmektedir.

OpenAI'nin sohbet botu ChatGPT başka bir rekabetçi sınavda başarısız oldu.

3. ChatGPT, Analytics India Magazine (AIM) tarafından isteği üzerine Union Public Service Commission (UPSC) sınavına girdi. UPSC sınavı dünyanın en zorlu rekabetçi sınavlarından biri olarak kabul edilir. Her yıl 10 lakh aday UPSC sınavına girer, ancak sadece %5'i başarılı olabilir.

AIM, UPSC Prelims 2022 için ChatGPT'ye 100 soru sağladı.

Chatbot, UPSC'ye ait 2022 Prelims sınavında kötü bir performans sergiledi. Gerekli olan puan 87,54 iken, Soru Kağıdı 1 (Set A) üzerinde sadece 54 aldı. Bu, ChatGPT'nin UPSC testini geçemediğini göstermektedir.

Sorular, Hint genel bilimi, tarih, coğrafya, ekonomi, ekoloji ve güncel olaylar konularına dayanıyordu. Sohbet robotu, konumlar ve ekonomilerle ilgili sorularda başarılı oldu, ancak 2021'den önce gerçekleşen tarihi olaylar hakkında sorulduğunda acı bir şekilde başarısız oldu.

ChatGPT'nin veri setinin yalnızca 2021'e kadar uzanması, AI bot'un sınavın tüm sorularını doğru bir şekilde cevaplayamamasının muhtemel belirleyici faktörüdür.

4. Bunun dışında, ChatGPT için CLAT sınav sonuçları da benzer şekilde ortalamanın üzerindeydi. CLAT UG sınavında AI aracı, soruların yalnızca %50.83'ünü doğru bir şekilde çözebildi. ChatGPT, mantık ve nicel soru kategorilerinde başarılı olamadı. Ancak, İngilizce ve Güncel Konular kategorilerinde olağanüstü bir performans sergiledi. Kavramlara dayalı sorulara geldiğinde bu araç büyük zorluklar yaşadı.

Kasım 2022'de piyasaya sürülen ChatGPT, Amerika Birleşik Devletleri'nde oldukça başarılı bir performans sergilemiştir. Bu yapay zeka teknolojisi, Amerika Birleşik Devletleri Tıp Lisanslama Sınavı (USMLE) ve çeşitli MBA sınavlarını başarıyla geçmiştir. Buna ek olarak, Google Seviye 3 Mühendisleri için gerçekleştirilen mülakatlarda da başarılı olmuştur.

Veteriner profesyonelleri, son zamanlarda ChatGPT'nin bir köpeğin durumunu doğru bir şekilde teşhis edebildiğini ve hayvanın hayatını kurtardığını görünce şaşkına döndü.

Birçok ülke, ancak şu anda ChatGPT konusunda farklı görüşlere sahip ve yeni yenilikle ilgili güçlü önlemler almak için hazırlar. Son zamanlarda, Almanya ve İtalya da dahil olmak üzere iki büyük ülkede teknoloji yasaklandı. Bu ülkeler, OpenAI'nin ChatGPT'sinin, yaş doğrulama sistemi gibi önlemeleri olmaksızın, küçüklere rahatsız edici materyallere maruz kalma riskini ortadan kaldırmadığını iddia ediyor.

Alman veri koruma komiseri Ulrich Kelber, Chat-GPT'nin kullanıcı verilerinin güvenliğiyle ilgili endişeler nedeniyle Almanya'da potansiyel bir yasağa tabi olabileceği konusunda bir uyarıda bulundu. Bu, İtalya'da yaşananlara benzer bir durum olabilir.

Hadi, gelecekte yapay zeka destekli teknolojinin nasıl davranacağını görelim.

Okuduğunuz için teşekkür ederiz! Daha fazla bilgilendirici makale için takipte kalın!

OpenAI'nin ChatGPT'si Sorulara Yanıt Verirken Başarısız Oluyor

İlgili Makaleler