ChatGPT Nedir ve Nasıl Kullanabilirsiniz? OpenAI, karmaşık soruları konuşma yoluyla yanıtlayan ChatGPT adlı uzun biçimli bir soru yanıtlama yapay zekasını tanıttı. Devrim niteliğinde bir teknoloji çünkü insanların bir soru sorduklarında ne demek istediklerini öğrenmek için eğitildi .
Pek çok kullanıcı, insan kalitesinde yanıtlar sağlama becerisine hayranlık duyuyor ve sonunda insanların bilgisayarlarla etkileşimini bozma ve bilgilerin alınma şeklini değiştirme gücüne sahip olabileceği hissine ilham veriyor.
ChatGPT Nedir?
ChatGPT, OpenAI tarafından GPT-3.5’e dayalı olarak geliştirilen büyük bir dil modeli sohbet robotudur. Diyalog biçiminde etkileşime geçme ve şaşırtıcı derecede insani görünebilen yanıtlar sağlama konusunda olağanüstü bir yeteneğe sahiptir. Büyük dil modelleri, bir dizi kelimede bir sonraki kelimeyi tahmin etme görevini yerine getirir.
İnsan Geri Bildirimiyle Güçlendirmeli Öğrenim (RLHF), ChatGPT’nin yönergeleri takip etme ve insanlar için tatmin edici yanıtlar üretme becerisini öğrenmesine yardımcı olmak için insan geri bildirimlerini kullanan ek bir eğitim katmanıdır.
ChatGPT’yi Kim Yaptı?
ChatGPT, San Francisco merkezli yapay zeka şirketi OpenAI tarafından oluşturuldu. OpenAI Inc., kar amaçlı OpenAI LP’nin kar amacı gütmeyen ana şirketidir.
OpenAI, komut adı verilen metin yönergelerinden görüntüler oluşturan derin öğrenme modeli olan iyi bilinen DALL·E ile ünlüdür. CEO, daha önce Y Combinator’ın başkanı olan Sam Altman’dır. Microsoft, 1 milyar dolarlık bir ortak ve yatırımcıdır . Azure AI Platform’u ortaklaşa geliştirdiler .
Büyük Dil Modelleri – ChatGPT Nedir ve Nasıl Kullanabilirsiniz?
ChatGPT, büyük bir dil modelidir (LLM). Büyük Dil Modelleri (LLM’ler), bir cümlede hangi kelimenin geleceğini doğru bir şekilde tahmin etmek için büyük miktarda veriyle eğitilir.
Veri miktarını artırmanın, dil modellerinin daha fazlasını yapma yeteneğini artırdığı keşfedildi. Stanford Üniversitesi’ne göre :
“GPT-3’ün 175 milyar parametresi var ve 570 gigabayt metin üzerinde eğitildi. Karşılaştırma için, selefi GPT-2, 1,5 milyar parametrede 100 kattan daha küçüktü. Ölçekteki bu artış, modelin davranışını büyük ölçüde değiştirir — GPT-3, cümleleri İngilizce’den Fransızca’ya çevirmek gibi, üzerinde açıkça eğitilmediği görevleri çok az veya hiç eğitim örneği olmadan gerçekleştirebilir. Bu davranış çoğunlukla GPT-2’de yoktu. Ayrıca, bazı görevler için GPT-3, bu görevleri çözmek için açıkça eğitilmiş modellerden daha iyi performans gösteriyor, ancak diğer görevlerde yetersiz kalıyor.”
Stanford Üniversitesi’ne göre
LLM’ler, bir cümledeki bir dizi kelimedeki bir sonraki kelimeyi ve sonraki cümleleri tahmin eder – bir tür otomatik tamamlama gibi, ancak akıl almaz bir ölçekte.
Bu yetenek, paragraflar ve tüm içerik sayfalarını yazmalarına olanak tanır. Ancak LLM’ler, bir insanın ne istediğini her zaman tam olarak anlamadıkları için sınırlıdır.
İşte ChatGPT’nin yukarıda bahsedilen İnsan Geri Bildirimi ile Güçlendirmeli Öğrenim (RLHF) eğitimi ile en son teknoloji geliştirdiği yer burasıdır.
ChatGPT Nasıl Eğitildi?
GPT-3.5, ChatGPT’nin diyalogu öğrenmesine ve insani bir yanıt verme tarzına ulaşmasına yardımcı olmak için Reddit tartışmaları gibi kaynaklar da dahil olmak üzere internetten gelen kod ve bilgilerle ilgili büyük miktarda veri üzerinde eğitildi.
ChatGPT ayrıca insan geri bildirimi (İnsan Geri Bildirimiyle Güçlendirmeli Öğrenim adlı bir teknik) kullanılarak eğitildi, böylece yapay zeka bir soru sorduklarında insanların ne beklediğini öğrendi. LLM’yi bu şekilde eğitmek devrim niteliğindedir çünkü LLM’yi bir sonraki kelimeyi tahmin edecek şekilde eğitmenin ötesine geçer.
Mart 2022 tarihli , İnsan Geri Bildirimiyle Talimatları İzleyecek Dil Modelleri Eğitimi başlıklı bir araştırma makalesi , bunun neden çığır açan bir yaklaşım olduğunu açıklıyor:
“Bu çalışma, büyük dil modellerini belirli bir grup insanın yapmalarını istediği şeyi yapmaları için eğiterek olumlu etkisini artırma amacımızla motive edildi. Varsayılan olarak dil modelleri, yalnızca bu modellerin yapmasını istediğimiz şeyin bir vekili olan bir sonraki sözcük tahmini hedefini optimize eder. Sonuçlarımız, tekniklerimizin dil modellerini daha yararlı, doğru ve zararsız hale getirme konusunda umut vaat ettiğini gösteriyor. Dil modellerini büyütmek, doğal olarak onları bir kullanıcının amacını takip etmede daha iyi yapmaz. Örneğin, büyük dil modelleri doğru olmayan, zehirli veya kullanıcıya yardımcı olmayan çıktılar üretebilir. Başka bir deyişle, bu modeller kullanıcılarıyla uyumlu değil.”
Mart 2022 tarihli , İnsan Geri Bildirimiyle Talimatları İzleyecek Dil Modelleri Eğitimi başlıklı bir araştırma makalesi
ChatGPT’yi oluşturan mühendisler, iki sistemin, GPT-3’ün ve yeni InstructGPT’nin (ChatGPT’nin “kardeş modeli”) çıktılarını derecelendirmek için yüklenicileri (etiketleyiciler olarak adlandırılır) işe aldı. Derecelendirmelere dayanarak, araştırmacılar aşağıdaki sonuçlara vardı:
“Etiketçiler, GPT-3 çıktılarına kıyasla InstructGPT çıktılarını önemli ölçüde tercih ediyor. InstructGPT modelleri, GPT-3’e göre doğrulukta iyileştirmeler gösteriyor. InstructGPT, GPT-3’e göre toksisitede küçük gelişmeler gösteriyor, ancak önyargı göstermiyor.”
Derecelendirmelere dayanarak, araştırmacılar
Araştırma makalesi, InstructGPT sonuçlarının olumlu olduğu sonucuna varıyor. Yine de, iyileştirme için yer olduğunu da kaydetti.
“Genel olarak, sonuçlarımız, insan tercihlerini kullanarak büyük dil modellerine ince ayar yapmanın, çok çeşitli görevlerdeki davranışlarını önemli ölçüde iyileştirdiğini, ancak güvenlik ve güvenilirliklerini iyileştirmek için yapılması gereken çok iş olduğunu gösteriyor.”
Araştırma makalesi
ChatGPT’yi basit bir sohbet robotundan ayıran şey, bir sorudaki insan niyetini anlamak ve yardımcı, doğru ve zararsız cevaplar sağlamak için özel olarak eğitilmiş olmasıdır.
Bu eğitim nedeniyle, ChatGPT belirli soruları sorgulayabilir ve sorunun anlamsız kısımlarını atabilir. ChatGPT ile ilgili başka bir araştırma makalesi, insanların neyi tercih ettiğini tahmin etmek için yapay zekayı nasıl eğittiklerini gösteriyor.
Araştırmacılar, doğal dil işleme yapay zekasının çıktılarını derecelendirmek için kullanılan metriklerin, metriklerde iyi puan alan ancak insanların beklentileriyle uyumlu olmayan makinelerle sonuçlandığını fark ettiler. Araştırmacılar sorunu şu şekilde açıkladı:
“Birçok makine öğrenimi uygulaması, yalnızca tasarımcının amaçladığı şeyin yaklaşık temsili olan basit ölçümleri optimize eder. Bu, tıklama tuzağını teşvik eden YouTube önerileri gibi sorunlara yol açabilir.”
Araştırmacılar sorunu şu şekilde açıkladı
Bu yüzden tasarladıkları çözüm, insanların tercihlerine göre optimize edilmiş yanıtlar verebilecek bir yapay zeka oluşturmaktı.
Bunu yapmak için, farklı cevaplar arasındaki insan karşılaştırmalarının veri setlerini kullanarak yapay zekayı eğittiler, böylece makine, insanların tatmin edici cevaplar olarak değerlendirdiği şeyleri tahmin etmede daha iyi hale geldi.