ChatGPT nasıl çalışır?

yeni-yeşil.jpg

ChatGPT , yapay zeka destekli en yeni araçlardan biridir, ancak arka planda çalışan algoritmalar aslında 2020'den beri çok çeşitli uygulama ve hizmetlere güç vermektedir. Bu nedenle, ChatGPT'nin nasıl çalıştığını anlamak için temel dil hakkında konuşarak başlamalıyız. ona güç veren motor.

ChatGPT'deki GPT çoğunlukla GPT-3 veya Generative Pre-trained Transformer 3'tür, ancak GPT-4 artık ChatGPT Plus aboneleri tarafından kullanılabilir ve muhtemelen yakında daha da yaygınlaşacaktır. GPT modelleri, OpenAI (ChatGPT ve görüntü oluşturucu DALL·E 2'nin arkasındaki şirket) tarafından geliştirilmiştir, ancak Bing'in AI özelliklerinden Jasper ve Copy.ai gibi yazma araçlarına kadar her şeyi desteklerler. Aslında, şu anda mevcut olan AI metin oluşturucuların çoğu GPT-3 kullanıyor ve muhtemelen bir sonraki adım olarak GPT-4'ü sunacak.

ChatGPT, GPT-3'ü ilgi odağı haline getirdi çünkü yapay zeka metin oluşturucuyla etkileşim sürecini herkes için basit ve en önemlisi ücretsiz hale getirdi. Artı, bu bir sohbet robotu ve insanlar SmarterChild'den beri iyi bir sohbet robotunu seviyor.

GPT-3 ve GPT-4 şu anda en popüler Büyük Dil Modelleri (LLM'ler) olsa da, önümüzdeki birkaç yıl içinde muhtemelen çok daha fazla rekabet olacak. Örneğin Google, kendi dil motoru Pathways Language Model (PaLM 2) tarafından desteklenen AI sohbet robotu Bard'a sahiptir. Ancak şimdilik, OpenAI'nin teklifi fiili endüstri standardıdır. İnsanların eline geçmesi için en kolay araçtır.

Öyleyse "ChatGPT nasıl çalışır?" temelde: GPT-3 ve GPT-4. Ama biraz daha derine inelim.

ChatGPT nedir?

ChatGPT, OpenAI tarafından oluşturulmuş bir uygulamadır. GPT dil modellerini kullanarak, sorularınızı yanıtlayabilir, kopya yazabilir, e-posta taslağı hazırlayabilir, sohbet edebilir, farklı programlama dillerinde kodu açıklayabilir, doğal dili koda çevirebilir ve daha fazlasını yapabilir veya en azından doğal dile dayalı olarak yapmaya çalışabilir. beslemenizi ister. Bu bir sohbet robotu, ama gerçekten çok iyi.

2.png

Evcil hayvanınız hakkında bir Shakespeare sonesi yazmak veya bazı pazarlama e-postalarının konu satırları için birkaç fikir edinmek istiyorsanız, bununla oynamak harika olsa da, OpenAI için de iyidir. Bu, gerçek kullanıcılardan çok sayıda veri almanın bir yoludur ve GPT'nin gücü için süslü bir demo işlevi görür; aksi halde, makine öğrenimine derinlemesine girmediğiniz sürece biraz bulanık gelebilir.

Şu anda ChatGPT iki GPT modeli sunmaktadır. Varsayılan GPT-3.5 daha az güçlüdür ancak herkes tarafından ücretsiz olarak kullanılabilir. Daha gelişmiş GPT-4, ChatGPT Plus aboneleriyle sınırlıdır ve onlar bile her gün yalnızca sınırlı sayıda soru alırlar.

ChatGPT'nin en büyük özelliklerinden biri, onunla yaptığınız konuşmayı hatırlayabilmesidir. Bu, daha önce sorduğunuz her şeyden bağlamı toplayabileceği ve ardından bunu sizinle konuşmasını bilgilendirmek için kullanabileceği anlamına gelir. Ayrıca yeniden çalışma ve düzeltme talep edebilirsiniz ve bu, daha önce tartıştığınız her şeye geri dönecektir. Yapay zeka ile etkileşim kurmayı gerçek bir ileri geri gibi hissettiriyor.

Bunu gerçekten hissetmek istiyorsanız, gidip şimdi ChatGPT ile beş dakika oynayarak geçirin (ücretsizdir!) ve sonra nasıl çalıştığını okumak için geri gelin.

ChatGPT nasıl çalışır?

Bu muazzam veri kümesi, insan beyninden sonra modellenen derin öğrenme sinir ağı [ ... ] oluşturmak için kullanıldı; bu, ChatGPT'nin herhangi bir cümlede hangi metnin geleceğini tahmin ederek metin verilerindeki kalıpları ve ilişkileri öğrenmesine [ ... ] izin verdi .

ChatGPT isteminizi anlamaya çalışarak ve ardından üzerinde eğitildiği verilere dayanarak sorunuzu en iyi şekilde yanıtlayacağını tahmin ettiği sözcük dizilerini söyleyerek çalışır.

Aslında o eğitimden bahsedelim. Bu, yeni oluşan yapay zekaya bazı temel kuralların verildiği bir süreçtir ve ardından kendi algoritmalarını geliştirmek için ya durumlara konur ya da üzerinde çalışması için bir sürü veri verilir.

GPT-3, yaklaşık 500 milyar "belirteç" üzerinde eğitildi ve bu, dil modellerinin daha kolay anlam atamasına ve makul takip eden metni tahmin etmesine olanak tanıyor. Daha uzun veya daha karmaşık kelimeler genellikle birden çok simgeye bölünse de, birçok kelime tek belirteçlerle eşlenir. Ortalama olarak, belirteçler kabaca dört karakter uzunluğundadır. OpenAI, GPT-4'ün iç işleyişi konusunda sessiz kaldı, ancak daha da güçlü olduğu için hemen hemen aynı veri kümesi üzerinde eğitildiğini güvenle varsayabiliriz.

resim3.png
resim4.png

Tüm belirteçler, insanlar tarafından yazılan devasa bir veri topluluğundan geldi. Bu, tüm farklı konularda, tarzlarda ve türlerde kitaplar, makaleler ve diğer belgeleri ve açık internetten kazınmış inanılmaz miktarda içeriği içerir. Temel olarak, insan bilgisinin toplamını aşmasına izin verildi.

Bu muazzam veri kümesi, ChatGPT'nin metin verilerindeki kalıpları ve ilişkileri öğrenmesine ve insan benzeri oluşturma yeteneğinden faydalanmasına olanak tanıyan, insan beyninden sonra modellenen karmaşık, çok katmanlı, ağırlıklı bir algoritma olan derin öğrenme sinir ağı oluşturmak için kullanıldı. herhangi bir cümlede hangi metnin gelmesi gerektiğini tahmin ederek yanıtlar.

Gerçekten de, bu büyük ölçüde şeylerin altını çiziyor. ChatGPT cümle düzeyinde çalışmaz; bunun yerine kelimelerin, cümlelerin ve hatta paragrafların veya stanzaların takip edebileceği metinler üretir. Bu, telefonunuzdaki bir sonraki kelimeyi açıkça tahmin eden metin tahmini değildir; herhangi bir istem için tamamen tutarlı yanıtlar oluşturmaya çalışıyor.

ChatGPT'nin çeşitli farklı istemlere yanıt verme yeteneğini daha da geliştirmek için, insan geri bildirimiyle pekiştirmeli öğrenme (RLHF) adı verilen bir teknikle diyalog için optimize edildi. Esasen insanlar, karşılaştırma verileriyle (iki veya daha fazla model yanıtının AI eğitmenleri tarafından sıralandığı) bir ödül modeli oluşturdu, böylece AI hangisinin en iyi yanıt olduğunu öğrenebildi.

5.png

Oluşturduğu sinir ağına geri dön. Tüm bu eğitime dayalı olarak, GPT-3'ün sinir ağı, bir girdi (sizin isteminiz) almasına izin veren 175 milyar parametreye veya değişkene sahiptir ve ardından, farklı parametrelere (ve az miktarda rastgelelik) verdiği değerlere ve ağırlıklara dayalıdır. ), isteğinizle en iyi eşleştiğini düşündüğü şeyi çıkarır. OpenAI, GPT-4'ün kaç parametreye sahip olduğunu söylemedi, ancak 175 milyardan fazla ve bir zamanlar söylenti olan 100 trilyon parametreden daha az olduğu kesin bir tahmin. Tam sayı ne olursa olsun, daha fazla parametre otomatik olarak daha iyi anlamına gelmez. GPT-4'ün artan gücünün bir kısmı, muhtemelen GPT-3'ten daha fazla parametreye sahip olmasından kaynaklanmaktadır, ancak büyük olasılıkla çoğu, nasıl eğitildiğine ilişkin iyileştirmelere bağlıdır.

Sonunda, hayal etmenin en basit yolu, çocukken oynadığınız "cümleyi tamamlama" oyunlarından biri gibi.

Sonunda, hayal etmenin en basit yolu, çocukken oynadığınız "cümleyi tamamlama" oyunlarından biri gibi. Örneğin, GPT-3 kullanarak ChatGPT'ye "Zapier is..." istemini verdiğimde, şöyle yanıt verdi:

"Zapier, tekrar eden görevleri otomatikleştirmek ve iş akışlarını iyileştirmek için kullanıcıların farklı web uygulamalarını birbirine bağlamasına olanak tanıyan web tabanlı bir otomasyon aracıdır."

Bu, Zapier'in ne yaptığını açıklayan yüzlerce makalede bulabileceğiniz türden bir cümle, bu yüzden burada tükürdüğü türden bir şey olması mantıklı. Ancak editörüm ona aynı istemi verdiğinde şöyle dedi:

"Zapier, kullanıcıların farklı web uygulamalarını birbirine bağlamasına ve bunlar arasındaki iş akışlarını otomatikleştirmesine olanak tanıyan web tabanlı bir otomasyon aracıdır."

Bu oldukça benzer, ancak tam olarak aynı tepki değil. Bu rastgelelik (bazı GPT-3 uygulamalarında "sıcaklık" adı verilen bir ayarla kontrol edebileceğiniz) ChatGPT'nin yalnızca her bir yanıta stok yanıtla yanıt vermemesini sağlar. Her istemi tüm sinir ağı boyunca her seferinde çalıştırıyor ve her şeyi taze tutmak için burada burada birkaç zar atıyor. Zapier'in Mars'tan gelen bir renk olduğunu iddia etmeye başlamak pek olası değil, ancak göreceli olasılıklarına göre aşağıdaki kelimeleri karıştıracak.

(Ne pahasına olursa olsun, ChatGPT GPT-4 üzerinde çalışırken şöyle dedi: " Zapier, kullanıcıların çeşitli çevrimiçi uygulamalar ve hizmetler arasındaki görevleri entegre etmesine ve otomatikleştirmesine olanak tanıyan web tabanlı bir otomasyon aracıdır." Hemen hemen aynı!)

Bilgiyi değil, kelimeleri tükürmek

ChatGPT'nin yapımcıları, düzeltmek için çok çalışmalarına rağmen, yanlış (ve muhtemelen zararlı) bilgiler üretebileceğini söyleyen ilk kişilerdir.

İşte evcil bir örnek. GPT-3 ve GPT-4 kullanan ChatGPT'den "Harry Guinness..." sorusuna yanıt vermesini istediğimde GPT-3 ilk olarak hangi Harry Guinness olduğunu sorarak yanıt verdi. Harika soru - kelimenin tam anlamıyla ikimiz varız! Ben de "Yazar Harry Guinness" dedim (bu benim). GPT-4 kim olduğumu hemen tahmin etti, ancak her iki yanıt da büyüleyiciydi:

GPT-3: Harry Guinness, İrlanda'da yaşayan bir serbest yazar ve gazetecidir. The New York Times, The Guardian, The Huffington Post ve Popular Mechanics gibi çeşitli yayınlar için yazmıştır. Teknoloji ve fotoğrafçılıktan seyahat ve kültüre kadar uzanan konuları kapsar.

GPT-4: Harry Guinness, İrlandalı bir yazar, fotoğrafçı ve teknoloji uzmanıdır. How-To Geek, Lifehacker ve Tuts+ gibi çeşitli yayınlar için yazmıştır. Çalışmaları öncelikle teknoloji, öğreticiler ve ipuçlarının yanı sıra fotoğrafçılık ve görüntü düzenlemeye odaklanmaktadır. Guinness, okuyucuların karmaşık konuları anlamalarına veya sorunları basit bir şekilde çözmelerine yardımcı olan ayrıntılı kılavuzlar oluşturma konusunda bir ün kazanmıştır.

GPT-3'ün ilk ve son satırları, neredeyse kelimesi kelimesine çeşitli web sitelerimden ve web'deki yazar biyografilerimden alınmıştır (gerçi normalde kendimi bir gazeteci değil, serbest yazar ve fotoğrafçı olarak listelememe rağmen). Ancak yayınların listesi temel olarak oluşturulmuştur. The New York Times için yazdım ama The Guardian , The Huffington Post veya Popular Mechanics için yazmadım (düzenli olarak Popular Science için yazıyorum, bu yüzden bu nereden gelmiş olabilir).

GPT-4, fotoğrafçı kısmını doğru yapıyor ve aslında adına yazdığım bazı yayınları listeliyor ki bu etkileyici, ancak en çok gurur duyacağım yayınlar bunlar değil. Her zaman en doğru yanıtı vermese de, OpenAI'nin GPT-4'ün doğruluğunu GPT-3'e göre nasıl artırabildiğinin harika bir örneği.

Ancak GPT-3'e geri dönelim, çünkü hatası ChatGPT'de perde arkasında neler olup bittiğine dair ilginç bir örnek sunuyor. Aslında benim hakkımda hiçbir şey bilmiyor. İnternetten kopyala/yapıştır ve bilginin kaynağına güvenmek bile değil. Bunun yerine, sahip olduğu milyarlarca veri noktasına dayanarak bir sonraki sözcük dizisini tahmin ediyor.

Örneğin: The New York Times, Wired , Outside , The Irish Times ve tabii ki Zapier gibi yazdığım yerlerden çok daha fazla The Guardian ve The Huffington Post ile gruplandırılmıştır. Dolayısıyla , The New York Times'tan sonra ne gelmesi gerektiğini hesaplaması gerektiğinde, benim hakkımda yayınlanan bilgilerden yararlanmıyor; sahip olduğu tüm eğitim verilerinden büyük yayınların listesini çıkarır. Çok zekice ve makul görünüyor, ama doğru değil.

GPT-4 çok daha iyi bir iş çıkarıyor ve yayınları alt üst ediyor, ancak söylediklerinin geri kalanı gerçekten makul devam cümleleri gibi geliyor. İtibarım için büyük bir takdir olduğunu düşünmüyorum: sadece bir biyografinin söylediği türden bir şey söylüyor. Aslında hemen hemen aynı tekniği kullanmasına rağmen, nasıl çalıştığını gizlemede GPT-3'ten çok daha iyidir.

Yine de, GPT'nin ne kadar iyileştiği çok etkileyici. Şimdilik, GPT-4 bir premium aboneliğe bağlı olduğundan, göreceğiniz ChatGPT içeriğinin çoğu GPT-3'ü temel alacaktır, ancak bu durum bir sonraki süreçte değişebilir. GPT-5'in neler getireceğini kim bilebilir?

ChatGPT API'si nedir?

OpenAI, teknolojisiyle sadece biz yaklaşımına sahip değil. Şirket, geliştiricilerin ChatGPT'nin gücünü kendi uygulamalarına ve hizmetlerine (elbette bir ücret karşılığında) entegre etmelerini sağlayan bir API platformuna sahiptir.

Zapier, ChatGPT'yi binlerce başka uygulamaya bağlamanıza ve iş açısından kritik iş akışlarınıza yapay zeka eklemenize olanak tanıyan kendi ChatGPT entegrasyonunu güçlendirmek için ChatGPT API'yi kullanır. İşte başlamanız için bazı örnekler, ancak ChatGPT'yi temel olarak herhangi bir uygulamadan tetikleyebilirsiniz.

Zapier'in OpenAI entegrasyonu ile OpenAI'nin DALL·E ve Whisper gibi diğer modellerinden de yararlanabilirsiniz. Doğrudan kullanmakta olduğunuz uygulamalardan görüntü oluşturma ve ses transkripsiyonunu içeren iş akışlarını otomatikleştirin.

İlgili okuma: ChatGPT'yi pazarlama metni yazmak için nasıl kullanabilirsiniz (ve ne zaman kullanmamalısınız)

HIX.AI ile yapay zekanın gücünün kilidini açın!