Veri Madenciliği Yöntemleri ile Tam Kan Sayımı Sonuçlarından Covıd-19 Test Sonuçlarının Tahmini

dc.authorid0000-0001-8335-3976en_US
dc.contributor.advisorAcılar, Ayşe Merve
dc.contributor.authorBozkurt, Aybüke
dc.date.accessioned2021-08-25T10:32:33Z
dc.date.available2021-08-25T10:32:33Z
dc.date.issued2021en_US
dc.departmentNEÜ, Fen Bilimleri Enstitüsü, Bilgisayar Mühendisliği Anabilim Dalıen_US
dc.descriptionYüksek Lisans Tezien_US
dc.description.abstract2019 yılında Çin’in Wuhan kentinde ilk vakaları görülen COVID-19 hastalığı tüm dünyayı etkisi altına almıştır. Başlangıçta sebebi belli olmadığı ve grip, soğuk algınlığı gibi hastalıklarla benzer etkileriyle karşılaşıldığı için hızla yayılmış ve Dünya Sağlık Örgütü tarafından pandemi olarak ilan edilmiştir. Hastalığın hızla yayılımının önüne geçmek ve teşhisini hızlandırmak için yeni yöntemler aranarak, makine öğrenmesi algoritmalarından faydalanılmıştır. COVID-19 şüphesi ile hastanelere ulaşan bireyler içerisinde hastane verileri bir araya getirilerek veri setleri oluşturulmuştur. Brezilya’daki Albert Einstein Hastane’ sini ziyaret eden bireylere ait rutin kan sayımı sonuçları ve COVID-19 test sonuçları kullanılarak oluşturulan bu tez çalışmasında, eksik verilerin tamamlanması için K-En Yakın Komşu(KNN) algoritması, dengesiz veri problemi için SMOTE algoritması, gürültülü verilerin temizlenmesi için dağılım grafikleri ve özellik seçimi için Temel Bileşen Analizi (TBA) kullanılarak veri seti oluşturulmuştur. Oluşturulan veri seti makine öğrenmesi algoritmalarından Destek Vektör Makineleri, Rastgele Orman ve Naive Bayes algoritmalarıyla sınıflandırılarak test edilmiştir. Elde edilen sonuçlar ışığında Rastgele Orman algoritması %99.2 genel doğruluk ile en yüksek başarıyı elde etmiştir.en_US
dc.description.abstractThe COVID-19 disease, the first cases of which were seen in Wuhan, China in 2019, has affected the whole world. It spread rapidly and was declared a pandemic by the World Health Organization, as the cause was not clear at the beginning and similar effects were encountered with diseases such as flu and colds. In order to prevent the rapid spread of the disease and to accelerate its diagnosis, new methods were sought and machine learning algorithms were used. Data sets were created by bringing together hospital data among individuals who reached hospitals with the suspicion of COVID-19. In this thesis study, which was created using routine blood count results and COVID-19 test results of individuals visiting Albert Einstein Hospital in Brazil, the K-Nearest Neighbor (KNN) algorithm to complete the missing data, the SMOTE algorithm for the unbalanced data problem, the noisy data. The data set was created using scatter plots to clean up the data and Principal Component Analysis (PCA) for feature selection. The generated data set has been tested by classifying with Support Vector Machines, Random Forest and Naive Bayes algorithms from machine learning algorithms. In the light of the results obtained, the Random Forest algorithm achieved the highest success with an overall accuracy of 99.2%.en_US
dc.identifier.citationBozkurt, A. (2021). Veri madenciliği yöntemleri ile tam kan sayımı sonuçlarından Covid-19 test sonuçlarının tahmini. (Yayınlanmamış Yüksek Lisans Tezi). Necmettin Erbakan Üniversitesi, Fen Bilimleri Enstitüsü Bilgisayar Mühendisliği Anabilim Dalı, Konyaen_US
dc.identifier.urihttps://hdl.handle.net/20.500.12452/7731
dc.language.isotren_US
dc.publisherNecmettin Erbakan Üniversitesi Fen Bilimleri Enstitüsüen_US
dc.relation.publicationcategoryTezen_US
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.subjectCOVID-19en_US
dc.subjectDestek Vektör Makineleri (DVM)en_US
dc.subjectK-En Yakın Komşu(KNN)en_US
dc.subjectNaive Bayesen_US
dc.subjectSMOTEen_US
dc.subjectSupport Vector Machine (DVM)en_US
dc.subjectK-Nearest Neighbor(KNN)en_US
dc.titleVeri Madenciliği Yöntemleri ile Tam Kan Sayımı Sonuçlarından Covıd-19 Test Sonuçlarının Tahminien_US
dc.title.alternativePrediction of Covıd-19 Test Results from Whole Blood Count Results By Data Mining Methodsen_US
dc.typeMaster Thesisen_US

Dosyalar

Orijinal paket
Listeleniyor 1 - 1 / 1
Yükleniyor...
Küçük Resim
İsim:
Aybüke Bozkurt.pdf
Boyut:
1.52 MB
Biçim:
Adobe Portable Document Format
Açıklama:
Yüksek Lisans Tezi
Lisans paketi
Listeleniyor 1 - 1 / 1
Küçük Resim Yok
İsim:
license.txt
Boyut:
1.44 KB
Biçim:
Item-specific license agreed upon to submission
Açıklama: