Makine Öğrenmesi Nedir?

Muhtemelen makine öğrenimi ve yapay zeka terimlerini biliyorsunuz. Belki de makine öğrenimi algoritmalarının insanları satranç, GO ve StarCraft gibi karmaşık oyunlarda nasıl mağlup ettiği veya makine öğrenimi ve yapay zekanın daha iyi tıbbi teşhisler ve tedaviler sağlamak için kullanıldığını duymuşsunuzdur.

Photo by Possessed Photography on Unsplash

Yapay Zeka (AI):

Yapay zeka, tıp, pazarlama, insan kaynakları ve hatta sanat gibi çok çeşitli alanları etkiliyor! Kendi kendine giden arabalardan sahte yüzlere (deep fake) kadar, yapay zeka ve makine öğreniminin toplumumuzun geleceği ve işleyiş şeklimiz için etkileri var. Bu yüzden yapay zekayı araştırmaya ve hatta yapay zeka konusunda eğitim vermeye çok fazla yatırım yapıldı. Peki yapay zeka ve makine öğrenimi tam olarak ne anlama geliyor?

Öncelikle yapay zeka hakkında konuşalım. Yapay zeka (AI), bilgisayarların akıllıca davranmasını sağlamak için çok sayıda araçtan oluşur. Robotik ve makine öğrenimi dahil olmak üzere çeşitli alt alanlardan oluşur. Son yıllarda, makine öğrenimi, yapay zekanın en yaygın alt kümesi haline geldi.

Makine Öğrenimini Tanımlama:

Makine öğrenimini tanımlamak çokta basit değildir. Makine öğreniminin birçok uygulaması vardır ve diğer bazı alanlarla çakışır. Bir alan olarak makine öğreniminin hızlı büyümesiyle birleştiğinde, makine öğreniminin sınırları bulanık olabilir. Makine öğrenimini, verilerden çıkarımlar ve tahminler yapmak için bir dizi araç olarak tanımlamak doğrudur. Makine öğreniminin neler yapabileceğini daha iyi anlamak için çıkarım ve tahmin görevlerini karşılaştıralım.

Photo by Andy Kelly on Unsplash

Tahmin, gelecekteki olayların sonucuyla ilgilidir. Örneğin yarın yağmur yağacak mı? Çıkarım daha belirsizdir çünkü konu içgörü çizmekle ilgilidir. Olayların ve davranışların nedenlerini, örneğin neden yağmur yağdığını anlayabiliriz. Ay, nem ve sıcaklık gibi faktörlerin bir kombinasyonunu elde edebiliriz. Örneğin, farklı hava koşulları türleri nelerdir? Yağmur veya kapalı hava durumu gibi. Sonuç olarak, bu görevler birlikte çalışabilir çünkü çıkarımlar tahmin yapmaya yardımcı olur, ancak farklı makine öğrenimi türleri gerektirirler. Peki, hepsi nasıl çalışıyor? Makine öğrenimi yöntemleri öncelikle istatistik ve bilgisayar biliminden yararlanır. Makine öğrenimi son derece güçlüdür çünkü bilgisayarlara açıkça programlanmadan öğrenme yeteneği verir. Yani, bilgisayar adım adım talimatlar olmadan öğrenebilir. Esasen, makine öğrenimi mevcut verilerden kalıpları öğrenir ve bunları yeni verilere uygular. Örneğin, spam’ın neye benzediğini kendi başına öğrenmek için arşivlenmiş e-postaları işleyebilir. Ardından öğrendiklerini kullanarak yeni e-postalardaki istenmeyen postaları tespit edebilir. Makine öğreniminin başarılı olması için yüksek kaliteli verilere ihtiyacı vardır.

Veri Bilimi:

Belki merak ediyor olabilirsiniz: veri bilimi burada nereye sığar? Veri bilimi, verilerden içgörüleri keşfetmek ve iletmekle ilgilidir. Makine öğrenimi, özellikle verilerden tahminler yapmak için veri bilimi çalışmaları için genellikle önemli bir araçtır.

Makine Öğrenimi Modeli:

Makine öğrenimini tanımladık, ancak pratikte nasıl görünüyor? Cevap, makine öğrenimi modelleridir. Makine öğrenimi modeli, kedileri veya trafikteki saatlik değişiklikleri nasıl tanıdığımız gibi gerçek dünyadaki bir sürecin istatistiksel bir temsilidir. Veri kullanılarak bir süreç modellenir.

Bir sonuç elde etmek için bir modele yeni girdiler girebiliriz.

Örneğin, geçmiş trafik verilerine dayalı bir model yaparsak, yarın öğleden sonra trafiğin ne kadar yoğun olacağını tahmin etmek için modele gelecek bir tarih girebiliriz. Çıktı, bir sonucun olasılığı bile olabilir, örneğin bir tweet’in sahte olma olasılığı gibi.

Makine Öğrenimi Kavramları:

Şimdi, makine öğrenimindeki önemli kavramları ele alacağız. Üç tür makine öğrenimi vardır. İlki pekiştirmeli (reinforcement learning) öğrenmedir. Bu kavram bir robotun bir satranç oyununda yoluna veya sonraki hamlesine karar vermesi gibi sıralı eylemlere karar vermek için kullanılır. Pekiştirmeli öğrenme diğerleri kadar yaygın değildir ve oyun teorisi gibi karmaşık matematiksel işlemler kullanır. En yaygın türler denetimli (supervised) ve denetimsiz (unsupervised) öğrenmedir. Ana farkları eğitim verilerinde yatmaktadır.

Eğitim verileri: Makine öğreniminin mevcut verilerden kalıpları “öğrendiğini” ve yeni verilere uyguladığını söylediğimizi hatırlıyor musunuz? Bu mevcut verilere “eğitim verileri” diyoruz. Bir model kurulurken ve eğitim verilerinden öğrenirken, buna “model eğitimi” diyoruz. Bu, verilerin boyutuna bağlı olarak nanosaniyelerden haftalara kadar sürebilir.

Denetimli Öğrenme Eğitim Verileri

Denetimli bir öğrenme modeli için eğitim verilerine bakalım. Bir hastanın kalp hastalığı olup olmadığını tahmin etmek için bir model eğitmek istiyoruz. Göğüs ağrısı yaşayan ve kalp hastalığı için test edilmiş hastaların kayıtlarına sahibiz.

Hedef değişkenimiz “kalp hastalığı”, çünkü tahmin etmek istediğimiz şey budur.

“True” ve “False” değerleri, hedef değişken için etiketlerdir, yani bir hastanın kalp hastalığı olması doğru mu yanlış mıdır. Etiketlerin bu biçimde gelmesi gerekmez — sayılar veya kategoriler olabilirler.

Bu satırlar, modelimizin öğreneceği gözlemler veya örneklerdir. Bunlardan mümkün olduğunca fazlasını almalısınız.
Sütunlar Özniteliklerdir.

Öznitelikler, hedefi tahmin etmeye yardımcı olabilecek farklı bilgi parçalarıdır. Yaş, kolesterol ve sigara içme alışkanlıkları kalp hastalığının bilinen faktörleridir. Makine öğreniminin büyüsü, emin olmadıklarımız da dahil olmak üzere birçok özelliği aynı anda analiz edebilmemiz ve farklı özellikler arasındaki ilişkileri bulabilmemizdir. Modeli eğitmek için veri olarak etiketler ve öznitelikleri giriş değerleri olarak kullanırız.

Eğitim tamamlandığında, modele yeni girdi verebiliriz. Bizim durumumuzda yeni bir hastadır ve model çıktı olarak tahminini verir.

Tahmin

Denetimli vs Denetimsiz Öğrenme:

Kalp hastalığı için farklı tedaviler vardır. Farklı hasta türleri belirli tedavilere daha iyi veya daha kötü yanıt verir. Sahip olduğumuz farklı hasta türlerini anlamak için denetimsiz öğrenmeyi kullanabiliriz. Veri kümemizi yalnızca kalp hastalığı olan hastaları içerecek şekilde filtreleyelim. Bunu bir kümeleme modeline aktarabiliriz ve öznitelik benzerliğine göre hasta kategorileri alabiliriz. Örneğin, belirli bir yaş aralığındaki yüksek kolesterol ve kan şekeri seviyesine sahip hastalar kategorilerden biri olabilir. Unutmayın, bu kategorileri ve hatta bunu çalıştırmadan önce kategori sayısını bilmiyorduk. Bu çıktıyla hastaları gruplayabilir ve her grup için daha iyi tedavileri araştırabiliriz.

Kümeleme Modeli (Denetimsiz Öğrenme)

Şimdi, yeni bir hastayla, özellikleri modele girebilir ve hangi hasta tipine en uygun olduklarını öğrenebiliriz.

Kümeleme Tahmini

Makine Öğrenimi İş Akışı:

Şimdiye kadar eğitim verilerinin bir modelin öğrenmesine izin vermek için kullanıldığını biliyoruz, ardından bu model tahmin yapmak için kullanılabilir. Ama aradaki adımlar nelerdir? Şimdi, bir model oluşturmaya giden dört adımdan oluşan makine öğrenimi iş akışını tanıtacağız.

Makine Öğrenmesi İş Akışı

Adım 1 — Öznitelik Çıkarımı : İlk adım, öznitelikleri çıkarmaktır. Veri kümeleri genellikle doğal olarak temiz gelmez, bu nedenle veri kümesini yeniden biçimlendirirken yapılacak işler vardır. Ek olarak, hangi özelliklerle başlamak istediğinize karar vermelisiniz.

Adım 2 — Veri Setini Bölme : Bundan sonra, veri kümesini iki veri kümesine bölmemiz gerekir: test ve eğitim veri kümesi. Bunu yapmanın nedeni son adımda netleşecektir. Şimdilik, iki veri kümesi olduğunu unutmayın!

Adım 3 — Modeli Eğitimi : Bunu yapmak için, eğitim veri kümesi seçilen bir makine öğrenimi modeline girilir. Farklı kullanım durumları ve karmaşıklık düzeyleri arasından seçim yapabileceğiniz birçok farklı makine öğrenimi modeli vardır. Bir sinir ağından lojistik regresyona kadar bazı model örneklerini duymuş olabilirsiniz.

Adım 4 — Değerlendirme : Şimdi bir modelimiz var ve değerlendirilmesi gerekiyor! Ortaya çıkan modelin kullanılabilir olacağını varsayamayız. Modeli değerlendirmenin en iyi yolu ne olabilir? Modelimizin performansını değerlendirmenin birçok yolu vardır. Örneğin, tahminlerin ortalama hatasını hesaplayabiliriz. Bunun gibi hem denetimli hem de denetimsiz öğrenme için birçok değerlendirme yöntemi vardır.

Bu yazıda makine öğrenimini ve bunun veri bilimi ve yapay zeka ile ilişkisini tanımlayarak başladık. Ardından, önemli makine öğrenimi kavramlarını ortaya çıkardık ve makine öğrenimi iş akışına geçtik. Vakit ayırıp okuduğunuz için teşekkür ederim.

Kaynaklar: Turhan Can Kargın Medium

Yorum bırakın