Veri Madenciliği Yöntemleri ile Tam Kan Sayımı Sonuçlarından Covıd-19 Test Sonuçlarının Tahmini
dc.authorid | 0000-0001-8335-3976 | en_US |
dc.contributor.advisor | Acılar, Ayşe Merve | |
dc.contributor.author | Bozkurt, Aybüke | |
dc.date.accessioned | 2021-08-25T10:32:33Z | |
dc.date.available | 2021-08-25T10:32:33Z | |
dc.date.issued | 2021 | en_US |
dc.department | NEÜ, Fen Bilimleri Enstitüsü, Bilgisayar Mühendisliği Anabilim Dalı | en_US |
dc.description | Yüksek Lisans Tezi | en_US |
dc.description.abstract | 2019 yılında Çin’in Wuhan kentinde ilk vakaları görülen COVID-19 hastalığı tüm dünyayı etkisi altına almıştır. Başlangıçta sebebi belli olmadığı ve grip, soğuk algınlığı gibi hastalıklarla benzer etkileriyle karşılaşıldığı için hızla yayılmış ve Dünya Sağlık Örgütü tarafından pandemi olarak ilan edilmiştir. Hastalığın hızla yayılımının önüne geçmek ve teşhisini hızlandırmak için yeni yöntemler aranarak, makine öğrenmesi algoritmalarından faydalanılmıştır. COVID-19 şüphesi ile hastanelere ulaşan bireyler içerisinde hastane verileri bir araya getirilerek veri setleri oluşturulmuştur. Brezilya’daki Albert Einstein Hastane’ sini ziyaret eden bireylere ait rutin kan sayımı sonuçları ve COVID-19 test sonuçları kullanılarak oluşturulan bu tez çalışmasında, eksik verilerin tamamlanması için K-En Yakın Komşu(KNN) algoritması, dengesiz veri problemi için SMOTE algoritması, gürültülü verilerin temizlenmesi için dağılım grafikleri ve özellik seçimi için Temel Bileşen Analizi (TBA) kullanılarak veri seti oluşturulmuştur. Oluşturulan veri seti makine öğrenmesi algoritmalarından Destek Vektör Makineleri, Rastgele Orman ve Naive Bayes algoritmalarıyla sınıflandırılarak test edilmiştir. Elde edilen sonuçlar ışığında Rastgele Orman algoritması %99.2 genel doğruluk ile en yüksek başarıyı elde etmiştir. | en_US |
dc.description.abstract | The COVID-19 disease, the first cases of which were seen in Wuhan, China in 2019, has affected the whole world. It spread rapidly and was declared a pandemic by the World Health Organization, as the cause was not clear at the beginning and similar effects were encountered with diseases such as flu and colds. In order to prevent the rapid spread of the disease and to accelerate its diagnosis, new methods were sought and machine learning algorithms were used. Data sets were created by bringing together hospital data among individuals who reached hospitals with the suspicion of COVID-19. In this thesis study, which was created using routine blood count results and COVID-19 test results of individuals visiting Albert Einstein Hospital in Brazil, the K-Nearest Neighbor (KNN) algorithm to complete the missing data, the SMOTE algorithm for the unbalanced data problem, the noisy data. The data set was created using scatter plots to clean up the data and Principal Component Analysis (PCA) for feature selection. The generated data set has been tested by classifying with Support Vector Machines, Random Forest and Naive Bayes algorithms from machine learning algorithms. In the light of the results obtained, the Random Forest algorithm achieved the highest success with an overall accuracy of 99.2%. | en_US |
dc.identifier.citation | Bozkurt, A. (2021). Veri madenciliği yöntemleri ile tam kan sayımı sonuçlarından Covid-19 test sonuçlarının tahmini. (Yayınlanmamış Yüksek Lisans Tezi). Necmettin Erbakan Üniversitesi, Fen Bilimleri Enstitüsü Bilgisayar Mühendisliği Anabilim Dalı, Konya | en_US |
dc.identifier.uri | https://hdl.handle.net/20.500.12452/7731 | |
dc.language.iso | tr | en_US |
dc.publisher | Necmettin Erbakan Üniversitesi Fen Bilimleri Enstitüsü | en_US |
dc.relation.publicationcategory | Tez | en_US |
dc.rights | info:eu-repo/semantics/openAccess | en_US |
dc.subject | COVID-19 | en_US |
dc.subject | Destek Vektör Makineleri (DVM) | en_US |
dc.subject | K-En Yakın Komşu(KNN) | en_US |
dc.subject | Naive Bayes | en_US |
dc.subject | SMOTE | en_US |
dc.subject | Support Vector Machine (DVM) | en_US |
dc.subject | K-Nearest Neighbor(KNN) | en_US |
dc.title | Veri Madenciliği Yöntemleri ile Tam Kan Sayımı Sonuçlarından Covıd-19 Test Sonuçlarının Tahmini | en_US |
dc.title.alternative | Prediction of Covıd-19 Test Results from Whole Blood Count Results By Data Mining Methods | en_US |
dc.type | Master Thesis | en_US |