Yapay Öğrenme Uygulamalarında Biyomedikal Verilerin Doğru Kullanımı: Ses Verisinden Parkinson Teşhisi Üzerine Bir Durum Çalışması


GÜMÜŞ E. , KURŞUN O. , SERTBAŞ A.

Tıptekno'10 Tıp Teknolojileri Ulusal Kongresi, Antalya, Türkiye, 14 - 16 October 2010

  • Basıldığı Şehir: Antalya
  • Basıldığı Ülke: Türkiye

Özet

Biyomedikal veri kümeleri üzerinde, bu verilere özgü küçük örnekleme, sınıfların dengesiz dağılımı, veride aynı kişiden alınan farklı örneklerin var olması (ve bundan kaynaklanan hatalı çapraz geçerleme) gibi özelliklerden dolayı, hazır yapay öğrenme (machine learning) programlarını sınıflandırma için kullanırken dikkat edilmesi gereken önemli noktalar vardır. Bu bildiride bu tip sorunlar detaylandırılacak ve nasıl üstesinden gelinebileceğinden bahsedilecektir. Durum çalışması olarak, konuya uygunluğu ve yapay öğrenme alanında yeni ve popüler bir veri kümesi olması itibariyle California Üniversitesi (UCI) Yapay Öğrenme veri tabanında bulunan Parkinson hastalığının uzaktan teşhisine yönelik olan, Parkinson hastası ve sağlıklı kontrol bireylerinin ses kayıtlarından çıkartılan çeşitli ses özelliklerini içeren PD veri kümesi kullanılmıştır. Çalışmamız sonucunda görüldü ki, başka çalışmalarda seçilen özelliklerle, önerdiğimiz doğru şekliyle çapraz geçerleme uygulandığında sadece %75 çıkan sınıflandırma başarısı, yine önerdiğimiz düzeltilmiş şekliyle seçilen özellik altkümesine uygulandığında %85’e çıkmaktadır.