loader
banner

Naive Bayes Sınıflandırma, ünlü matematikçi Thomas Bayes tarafından 1812 yılında koşullu olasılıkların hesaplanması için ortaya atılmış olan Bayes teorisinin makine öğrenimi algoritmalarına uyarlanmış bir halidir. Bayes teorisi koşullu olasılığı ve buna bağlı marjinal olasılıkları belirlemek için kullanılan bir yöntemdir.

P(A|B) = B olayı gerçekleştiği durumda A olayının da gerçekleşme olasılığıdır. Örneğin üç ayrı üretim hattından çıkan kalemler olsun. Kalemlerin %30’u X, %30’u Y ve %40’ı Z hattında üretiliyor diyelim. Yine makinelerin hatalı kalem üretme olasılığı sırasıyla %5, %4,, %3 olsun. Kalemin X hattından çıkma olasılığı A, hatalı kalem üretilme olasılığı B dersek P(A|B) hatalı üretilen kalemin X hattından çıkma olasılığıdır. İki olasılığında birlikte gerçekleşmesi gerekir. Üretilen kalem X hattında çıkmış olmalı ek olarak hatalı üretilmiş olmalıdır.

P(A) = A olayının gerçekleşme olasılığı. Yukarıdaki örnekten devam edersek, üretilmiş olan kalemin X hattından gelme olasılığı.

P(B|A) = A olayı gerçekleştiğinde B olayının gerçekleşme olasılığı. Üretilmiş olan kalemin X hattından gelme olasılığı.

P(B) = B olayının gerçekleşme olasılığı. Hatalı kalem üretilme olasılığı.

 

Bayes bize olasılıkların sınıflandırılması konusunda yardım eder. Bir üretim hattının hatalı kalem üretmesiyle, üretilmiş hatalı bir kalemin hangi ürettim hattından gelmiş olabileceği iki farklı olasılıktır. Bayes olasılıklar arasındaki bu nedensellik ilişkisini doğru bir şekilde kurar.

Naive Bayes Sınıflandırma

Naive Bayes makine öğrenimi algoritması ise bayes teorimine göre olasılıkların hesaplanıp istenen değişkenin en yüksek olasılığa göre sınıflandırılması işlemidir. Bu alandaki en popüler örnek spam maillerin filtrelenmesidir. Kullanıcılar tarafından spam olarak işaretlenen mailların içeriği makine tarafından analiz edilir. Bu alandaki her kullanıcı geri dönüşü aslında makineye bir öğrenme geri beslemesi yapıyordur. Örneğin X para kazandınız almak için tıklayın ya da Afrika’daki belli bir miras iddiası ile size gelen maillar kullanıcılar tarafından spam olarak işaretlendikten sonra içerikleri taranır. Bu içeriklerde frekansı yüksek olan kelimeler ya da kelime grupları olasılık algoritmasının temelini oluşturur. Artık öğrenen makine “Afrika”, “Nijerya” gibi kelime gruplarını gördüğünde maili spam olarak sınıflandırabilir.

Buradaki Bayesian bağlantı tıpkı arızalı olan bir kalemin X hattından gelme olasılığı gibi içinde “Afrika” sözcüğü geçen mailin spam olma olasığıdır. İçinde Afrika sözcüğü geçen her mail spam değildir ve spam olarak yargılanması farklı koşullu olasılıklara bağlıdır.

Naive Bayes Sınıflandırma

Elbette makine öğrenim algoritması Bayes’in ikili olasılık formülünden çok daha fazla koşullu olasılığı ve değişkeni kullanmak zorundadır ancak olasılığı sınıflandırma metodu ve koşulluluk zinciri aynı mantığa dayanmaktadır.

İlgili Yazılar : https://www.intelkit.com/makine-ogrenimi-algoritmalari-1-temel-kavramlar/

 

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir