>
Dersin Adı | Dersin Kodu | Dersin Türü | Dersin Düzeyi | Dersin Yılı | Dersin Verildiği Dönem | AKTS Kredisi |
---|---|---|---|---|---|---|
Pekiştirmeli Öğrenme | BLM446 | Seçmeli | Lisans | 4 | Bahar | 5 |
Dr. Öğr. Üyesi Alpaslan Burak İNNER
1) Pekiştirmeli öğrenmenin ne olduğunu tanmlar
2) Probleme göre algoritma, politika tanımlar ve farklı politika uygular.
3) İlkel durumdan daha karmaşık durumlara kadar politika gradyan yöntemlerini uygular.
4) Pekiştirmeli öğrenmende kullanılan kod standartlarını ve kitaplıklarını takip eden ortak kod algoritmalarını gerçekleştirir.
5) Yaklaşık çözümleri anlar ve bunlarla çalışır.
Program Yeterlilikleri | |||||||||||||
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | ||
Öğrenme Kazanımları | |||||||||||||
1 | Yüksek | ||||||||||||
2 | Orta | Yüksek | Yüksek | ||||||||||
3 | Yüksek | Yüksek | Yüksek | ||||||||||
4 | Yüksek | ||||||||||||
5 | Orta | Orta |
Yüz Yüze
Yok
Olaslılık
Pekiştirmeli öğrenme bir ajanın veya ajanlardan oluşan bir sistemin, çevreleriyle etkileşim kurarak bir hedefi gerçekleştirmeyi öğrendiği bir makine öğrenimi alanıdır. Son yıllarda hem teorik hem de uygulamalı alanlarda pekiştirmeli öğrenme araştırmalarında başarı sağlamıştır. Robotik, örüntü tanıma, kişiselleştirilmiş tedaviler gibi birçok çeşitli alanda uygulanmıştır. Bu ders öncelikle öğrencileri pekiştirmeli öğrenme problemlerini anlamaya ve dinamik programlamaya, Monte Carlo ve Temporal-Difference yöntemlerinden gelen algoritmaları ele almaya yönelik eğitmeye odaklanır. Öğrenciler, son teknoloji politika optimizasyon algoritmalarını kullanarak daha büyük bir durum uzayı ortamlarına doğru ilerleyeceklerdir.
1) Anlatım
2) Benzetim
3) Bireysel Çalışma
4) Problem Çözme
5) Proje Temelli Öğrenme
Yarıyıl İçi Çalışmalarının Başarıya Oranı |
70% |
|||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
|
||||||||||||
Yarıyıl Sonu Sınavının Başarıya Oranı |
30% |
|||||||||||
Toplam | 100% |
Türkçe
İstenmemekte