Denetimli (Supervised) Öğrenme ve Denetimsiz (Unsupervised) Öğrenme

Mihriban Tekeş
5 min readMay 7, 2020

--

Denetimli makine öğrenmesi nedir ve denetimsiz makine öğrenmesi ile nasıl bir ilişkisi vardır? Bu yazıda, denetimli öğrenme ve denetimsiz öğrenmeyi inceleyeceğiz.

Makine Öğrenim sistemleri, eğitim sırasında aldıkları denetim miktarına ve türüne göre sınıflandırılabilir. Dört ana kategori vardır: denetimli öğrenme, denetimsiz öğrenme, yarı denetimli öğrenme ve pekiştirmeli ölğrenme.

Denetimli (Supervised) Öğrenme

Denetimli öğrenme, bir modelin etiketli (labeled) bir veri kümesi (data set) üzerinde eğitildiği, yani hem giriş (input) hem de çıkış (output) parametrelerine sahip bir türdür. Makine öğrenmesinde sıklıkla kullanılır.

Denetimli öğrenme, giriş değişkenlerimizin (x) ve bir çıkış değişkenimizin (Y) olduğu ve girdiden çıktıya mapping fonksiyonunu öğrenmek için bir algoritma kullanan öğrenme şeklidir.

Y = f (X)

Denetimli öğrenmede, girdi özelliklerini bir çıktıyla eşleştirmek için optimize edilmiş fonksiyonu (model) arıyoruz. Amaç, mapping fonksiyonuna çok iyi şekilde benzemeye çalışmaktır çünkü yeni giriş verilerimiz (x) olduğunda, bu veriler için çıkış değişkenlerini (Y) tahmin edebilelim.

Bu optimize edilmiş işlevi bulmak için, elimizdeki tüm özellik ve çıktılara sahip bir veri setimiz var. Bu verilerden örüntüleri öğrenerek veya bularak, mapping fonksiyonunu elde ederiz. Algoritmamız eğitim veri seti üzerinden tahminler yapmaya başlar ve algoritma kabul edilebilir bir performans seviyesine ulaştığında öğrenme durur.

Denetimli öğrenme problemleri çıkışa (output) bağlı olarak regresyon ve sınıflandırma problemleri olarak gruplandırılabilir.

Tipik denetimli öğrenmenin alt bölümlerinden birisi sınıflandırmadır (classification).

Sınıflandırma, bir sınıflandırma probleminde, çıktı değişkeninin “spam” veya “spam değil” gibi bir kategori olması durumudur. Spam filtresi bunun iyi bir örneğidir. Birçok mail örneği sınıflarıyla (spam veya değil) birlikte eğitilmiştir ve modelimiz yeni maillerin nasıl sınıflandırılacağını öğrenir.

Diğer bir alt bölüm ise, regresyondur.

Regresyon problemi, çıktı değişkeninin “tl” veya “ağırlık” gibi gerçek bir değer olduğu durumudur. Yani bir değer (genellikle sürekli (continuous) ) arıyorsak, buna regresyon denir. Mesela predictors olarak adlandırılan bir dizi özellik (kilometre, yaş, marka vb.) verildiğinde, bir otomobilin fiyatı gibi bir sayısal değer tahmin etmektir. İşte bu tür bir göreve regresyon denir. Bir sistemi eğitmek için, hem predictors hem de etiketler (label) (yani örneğimizde fiyatları) dahil olmak üzere birçok araba örneği vermemiz gerekmektedir.

****Makine öğrenmesindeki predictor değişkenler, girdi verilerini veya genellikle veriler aracılığıyla belirlenen ampirik bir ilişki yoluyla hedef değişkenle eşlenen değişkenleri kapsamaktadır.

Bazı regresyon algoritmalarının sınıflandırma için de kullanılabileceğini ve tam tersi olduğunu unutmayın. Örneğin, Lojistik Regresyon, belirli bir sınıfa ait olma olasılığına karşılık gelen bir değer (örneğin, spam olma olasılığı % 20) olabileceğinden, sınıflandırma için yaygın olarak kullanılır.

Sınıflandırma ve regresyon konularını başka bir yazıda detaylı inceleyeceğiz.

İşte en önemli denetimli öğrenme algoritmalarından bazıları:

  • k-Nearest Neighbors
  • Linear Regression
  • Logistic Regression
  • Support Vector Machines (SVMs)
  • Decision Trees and Random Forests
  • Neural networks **

**Autocoders ve restricted Boltzmann makineleri gibi bazı sinir ağı mimarileri denetimsiz olabilir.

Denetimsiz (Unsupervised) Öğrenme

Denetimsiz öğrenmede, tahmin edebileceğiniz gibi, eğitim verileri etiketsizdir. Sistem öğretmen olmadan öğrenmeye çalışır. Ham verileri organize verilere dönüştüren bir Makine Öğrenimi türüdür.

Bilgisayar, etiketlenmemiş verilerle eğitilir. Çoğunlukla desen algılama ve tanımlayıcı modellemede kullanılır. Yalnızca giriş verilerinizin (X) olduğu ve karşılık gelen çıkış değişkenlerinin olmadığı öğrenme biçimidir.

Denetimsiz öğrenmenin amacı, veriler hakkında daha fazla bilgi edinmek için verilerin temelini oluşturan yapıyı veya dağılımı modellemektir. Bunlara denetimsiz öğrenme denir, çünkü yukarıdaki denetimli öğrenmenin aksine doğru cevaplar yoktur ve öğretmen yoktur. Bu algoritmalar özellikle bizlerin veride ne arayacağımızı bilmediğimiz durumlarda yararlıdır.

Model gözlem yoluyla öğrenir ve verilerdeki yapıları bulur. Modele bir veri kümesi verdiğimizde, içinde kümeler oluşturarak veri kümesindeki desenleri ve ilişkileri otomatik olarak bulur. Yapamayacağı şey, kümeye etiket eklemektir, bunlar şeker veya bunlar çikolata diyemez, ancak tüm şekerleri çikolatadan ayıracaktır.

Farklı tatlılardan görüntü verileri verdiğimizi varsayalım. Denetimsiz Öğrenme algoritması aynı tür tatlıları gruplayacak ve kümeler oluşturacaktır. Dahası, bir tatlı çeşidini başka bir çeşitten ayırır ve kullanıcıya kolay anlaşılır bir arayüz sağlar. Böylece, Denetimsiz Öğrenme, organize edilmemiş ham verileri organize forma dönüştürür.

Bazı Denetimsiz Öğrenme Uygulama Örnekleri:

  • YouTube Video Öneri Sistemi
  • Facebook Arkadaş, Grup veya Sayfa Öneri Sistemi.
  • E-ticaret Web Sitesi ile ilgili Ürünler Öneri Sistemi.

Denetimsiz öğrenme problemleri ayrıca kümeleme (clustering) ve association problemleri olarak gruplandırılabilir.

Kümeleme: Kümeleme sorunu, satın alma davranışı yoluyla müşterileri gruplama gibi verilerdeki doğal gruplamaları keşfetmek istediğimiz yerdir.

Örneğin, blogunuzun ziyaretçileri hakkında çok fazla veriniz olduğunu varsayalım. Benzer ziyaretçilerin gruplarını algılamaya çalışmak için bir kümeleme algoritması çalıştırdığımızı varsayalım . Algoritmamıza ziyaretçilerin hangi gruba ait olduğunu söylemeyiz, algoritmamız bu bağlantıları bizim yardımımız olmadan bulur.

Başka bir örnek verelim, ziyaretçilerimizin % 30’unın makine öğrenmesiyle ilgilenen ve genellikle akşamları blogumuzu okuyan kızlar olduğunu, % 50’sinin ise hafta sonları ziyaret eden genç yazılım severler olduğunu fark edebiliriz. Hiyerarşik bir kümeleme algoritması kullanırsanız, her grubu daha küçük gruplara ayırabilir.iz Bu, yayınlarımızı her grup için farklı hedeflememize yardımcı olabilir.

Association: Association kuralı öğrenme, X satın alan kişiler de Y satın alma eğiliminde olduğu gibi verilerimizin büyük bölümlerinde nitelikler arasındaki ilginç ilişkileri keşfetmek olduğu ilişkilendirme kuralı öğrenmesidir. Örneğin, bir süpermarkete sahip olduğumuzu varsayalım. Satış günlüklerimizde bir association kuralı çalıştırmak, barbekü sosu ve patates cipsi satın alan kişilerin de biftek alma eğiliminde olduğunu ortaya çıkarabilir. Bu nedenle, bu öğeleri birbirine yakın yerleştirmek isteyebiliriz.

ÖZET
Bu yazıda, denetimli eğitim ile denetimsiz eğitimi inceledik.

Denetimli: Tüm veriler etiketlidir ve algoritmalar giriş verilerinden çıktıyı tahmin etmeyi öğrenir.
Denetimsiz: Tüm veriler etiketsizdir ve algoritmalar, giriş verilerinden doğal yapıyı öğrenir.

Aklınıza takılan bir şey olursa sosyal medyadan bana ulaşabilirsiniz. İyi çalışmalar 🙂

--

--

Mihriban Tekeş

Machine Learning Engineer who also loves Game Development.