USD/TRY38.42 ▼
EUR/TRY41.15 ▲
Gram Altın3.842 TL ▲
BIST 1009.845 ▲
Bitcoin$84.250 ▼
Ethereum$3.120 ▲
Petrol$62.30 ▼
SON DAKİKA
Haber Kaydır — Türkiye ve dünyadan anlık haberler • Son dakika gelişmeleri • Gündem, magazin ve spor • Haber Kaydır — Türkiye ve dünyadan anlık haberler • Son dakika gelişmeleri • Gündem, magazin ve spor •
Gündem 2 saat önce

Yapay zekanın YKS karnesi... Biri derece yaptı diğeri 1 milyona bile giremedi

Kaynak: Hurriyet Gundem Orijinal Haber ›
Ö LÇME, Seçme ve Yerleştirme Merkezi (ÖSYM) tarafından düzenlenen YKS, 20-21 Haziran tarihlerinde tamamlandı.
Reklam

Ö LÇME, Seçme ve Yerleştirme Merkezi (ÖSYM) tarafından düzenlenen YKS, 20-21 Haziran tarihlerinde tamamlandı. Bu yıl 2 milyonu aşkın adayın başvurduğu sınava 2 farklı yapay zekâ uygulaması da katıldı. Sosyal medyada teknoloji içerikli paylaşımlar yapan MEF Üniversitesi Endüstri Mühendisliği Bölümü öğrencisi 20 yaşındaki Alp Ünlü, sınavın ardından yayınlanan Temel Yeterlilik Testi (TYT) ile Alan Yeterlilik Testleri (AYT) sorularını cevap anahtarlarını çıkararak yapay zekâ asistanı Claude’un iki farklı modeli olan Opus 4.8 ve Haiku 4.5 isimli uygulamalara gönderdi.

Ünlü, bu iki farklı modele “Amacın sınavdan mümkün olan en yüksek neti elde etmek. 4 yanlış 1 doğruyu götürüyor. Boş bırakılan sorunun hiçbir cezası yok. O nedenle amacın en fazla soruyu yanıtlamak değil, en yüksek neti yapmak” komutunu verdi. Geçen yıl sınava giren ChatGPT 650 bin, DeepSeek 21 bin, Gemini ise 27 bininci olmuştu. Ünlü, bu kez Claude uygulamasının modelleriyle YKS sürecini deneyimlemeyi tercih etti.

Claude’un ‘en iyi’ olarak değerlendirilen ‘Opus’ modeli ile ‘en kötü’ şeklinde yorumlanan ‘Haiku’ modeli sınavda birbirinden farklı sonuçlar elde etti. Ünlü, yapay zekâların sınav sürecini şöyle anlattı:

“Bu iki model arasında hangisinin daha iyi sonuç elde edeceğini tahmin ediyordum. Asıl merak ettiğim aralarındaki farkın ne olacağıydı. Sınav sonucunda ise gerçekten aralarında uçurum olduğunu gördüm. Opus, gerek kodlama gerek YKS başarısı olsun gerçekten güçlü bir model. Ancak tüm yapay zekâ araçları arasında en pahalı olan da yine Opus. Haiku, sınavı 1 dakika içinde tamamladı ancak sonuç hüsran. 1 milyonuncu bile olamadı. Opus ise tüm soruları yaklaşık 40 dakikada çözdü. İki modele de ‘Soruların yanıtından gerçekten eminsen işaretle, değilsen boş bırak’ dedim. Bu nedenle sınavda boş bıraktıkları sorular da oldu.”

HAIKU SORULARI BİR DAKİKADA ÇÖZDÜ

Claude’un düşük modeli olan Haiku’ya sınavdan önce ‘Sence kaç net yaparsın?’ diye sorduğumda bana, ‘TYT’de 85, AYT’de 52’ hedeflediğini söylese de gerçekte TYT’de 18, AYT’de 7.25 neti ancak yapabildi. Yani kendine güveniyordu ama bu durum sonuçlara yansımadı. Geçen sene yapay zekâlar matematik testinde zorlanmıştı ancak bu yıl Claude’un modelleri matematikte zorlanmadı. Haiku’nun sınavı 1 dakika içinde çözmesi beni çok şaşırttı. Fakat hızlı olması ona başarı getirmedi. Opus, matematiğin 30’uncu sırasında durdu ve ‘kredin yetersiz’ uyarısı verdi. Bu noktada ödeme yapmak istemediğim için haklarımın yenilenmesini 5 saat beklemek zorunda kaldım.

Osman Demircan (Bilişim Uzmanı): Sınavda kullanılan yapay zekâ modeli elbette önemli. Örneğin ChatGPT 1, 2, 3, 4, 5 var. Sınavı 1’e yaptırırsanız kötü, 5’e yaptırırsanız iyi sonuç elde edersiniz. Claude modellerinde de bu durum söz konusu. Yani birbirinden bu kadar farklı sonuç almaları buna bağlı. Yapay zekâ zamanla kendini geliştiriyor. Veri işleme hızı, matematiksel öğrenme, genel kültür konularında giderek gelişiyor. Bu gelişme sonucunda da sorularda daha fazla başarılı oluyor. Örneğin önümüzdeki yıl sınava girseler, birinci bile olabilirler. Opus, derin akıl yürütmeyi desteklerken Haiku, en hızlı model. Yani istenilen hızlı bir yanıt almaksa Haiku, net ve kesin bilgi isteniyorsa da Opus tercih edilmeli. Modellerin bu farklılığı sonuçlara da yansımış.

Cihan Yeşilyurt (Eğitim Uzmanı ve Psikolojik Danışman): İki modelin sonuçları da çok uçlarda. Öte yandan bu yıl sıralamalar da değişecek çünkü adayların zorlandığı testler bu sene daha farklı oldu. TYT, geçtiğimiz yıla kıyasla adaylar için daha çözülebilir bir testti. AYT ise daha ölçücüydü. Sıralamaların geçen yıldan farklı olacağını öngörüyorum. Yapay zekâ sonuçlarında ise ilk bine giren istediği her programa rahatlıkla yerleşebilir.

Türkiye ve dünyadaki en güncel gelişmelerden haberdar olmak için, bültenlerin gönderileceği e-posta adresini girin.

Reklam
🔴

Son dakikayı kaçırma!

Haberin tamamlayıcısı: Telegram kanalımızdan anlık bildirim, sosyal medyadan gün boyu özetler.

Paylaş: WhatsApp X

İlgili Haberler

Ekonomik kalkınma için ortak akıl
Gündem

Ekonomik kalkınma için ortak akıl

2 saat önce

Türkiye gücünü barış için kullanıyor
Gündem

Türkiye gücünü barış için kullanıyor

2 saat önce

Belediyeler... 2024’ün gerisinde
Gündem

Belediyeler... 2024’ün gerisinde

2 saat önce