Mekansal verilerin kümeleme analizi ile değerlendirilmesi
Yükleniyor...
Dosyalar
Tarih
2018
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
Necmettin Erbakan Üniversitesi, Fen Bilimleri Enstitüsü
Erişim Hakkı
info:eu-repo/semantics/openAccess
Özet
Teknolojik gelişmeler sayesinde her geçen gün iş, toplum, bilim ve mühendislik, sağlık ve günlük hayatla ilgili her alandan sürekli olarak veriler toplanmakta ve bu veriler büyük kapasiteli veritabanlarında saklanmaktadır. Bu veritabanlarında yer alan verilerin insanoğlunun hayatında daha faydalı olabilmesi için çeşitli tekniklerle işlenerek anlam kazandırılması yani "bilgi"ye dönüştürülmesi gerekmektedir. Veri Madenciliği disiplini çeşitli algoritma ve teknikler kullanılarak büyük veritabanlarında yer alan veri yığınlarından anlamlı bilginin elde edilmesine imkân sağlamıştır. Bu çalışma kapsamında "Veri Madenciliği" disiplini, veri madenciliğinin kullanım alanları ve veri madenciliği model ve teknikleri açıklanmıştır. Ayrıca mekânsal verilerin analizinde veri madenciliği tekniklerinin kullanımı üzerinde durulmuştur. Bu kapsamda Türkiye'deki 2011, 2012 ve 2013 yıllarına ait Trafik Kaza istatistik veri setleri üzerinde k-ortalama yöntemi, k-medoids yöntemi ve Birleştirici Hiyerarşik Kümeleme (AGNES) yöntemleri kullanılarak kümeleme analizi yapılmış ve kümeleme analizi sonuçları kullanılarak çok değişkenli haritalar üretilmiştir. Üretilen haritalar karşılaştırılarak bu haritaların risk yönetimi ve planlamada kullanılabilirliği tartışılmıştır. 2011, 2012 ve 2013 yıllarına ait verilerin AGNES kümeleme analizi sonuçlarıyla hazırlanan çok değişkenli haritaların birbirleriyle oldukça uyumlu olduğu görülmüştür. Bu sonuç AGNES yöntemiyle üretilen çok değişkenli haritaların risk yönetimi açısından da oldukça önemli olduğunu göstermiştir. k-ortalama ve k-medoids kümeleme analizleri sonuçlarıyla üretilen çok değişkenli haritalarda farklı küme sayıları için kümeleme sonuçları gözlemlenmiştir. Her iki algoritmanın da kümeleme performansları benzerlik gösterse de k-medoids algoritmasında kümelerin birbirinden daha iyi ayrıldığı gözlemlenmiştir.
Thanks to technological developments, data are constantly collected everyday from work, society, science and engineering, health and daily life, and these data are stored in large-capacity databases. In order to make the data contained in these databases useful in the human life, it has to be transformed into "information" by means of various techniques. The discipline of Data Mining has enabled the use of various algorithms and techniques to obtain meaningful information from data stacks in large databases. In this study, "Data Mining" discipline, usage areas of data mining, data mining models and techniques were explained. In addition, the use of data mining techniques in the analysis of spatial data was examined. In this context, clustering analysis was carried out on the Traffic accident data sets for 2011, 2012 and 2013 in Turkey using k-means method, k-medoids method and Agglomerative and Divisive Hierarchical Clustering (AGNES) method and clustering analysis results were used to design multivariate maps. By comparing these maps, the usage possibilities in risk management and planning is discussed. The multivariate maps prepared with the results of the AGNES cluster analysis of the data for the years 2011, 2012 and 2013 were found to be very compatible with each other. This result was showed that the multivariate maps produced by AGNES method are also very important in terms of risk management. The clustering results for k-means and k-medoid clustering analyses were observed for different cluster numbers in the generated multivariate maps. Although the clustering performances of both algorithms are similar, it was observed that the k-Medoids algorithm has better separation of clusters.
Thanks to technological developments, data are constantly collected everyday from work, society, science and engineering, health and daily life, and these data are stored in large-capacity databases. In order to make the data contained in these databases useful in the human life, it has to be transformed into "information" by means of various techniques. The discipline of Data Mining has enabled the use of various algorithms and techniques to obtain meaningful information from data stacks in large databases. In this study, "Data Mining" discipline, usage areas of data mining, data mining models and techniques were explained. In addition, the use of data mining techniques in the analysis of spatial data was examined. In this context, clustering analysis was carried out on the Traffic accident data sets for 2011, 2012 and 2013 in Turkey using k-means method, k-medoids method and Agglomerative and Divisive Hierarchical Clustering (AGNES) method and clustering analysis results were used to design multivariate maps. By comparing these maps, the usage possibilities in risk management and planning is discussed. The multivariate maps prepared with the results of the AGNES cluster analysis of the data for the years 2011, 2012 and 2013 were found to be very compatible with each other. This result was showed that the multivariate maps produced by AGNES method are also very important in terms of risk management. The clustering results for k-means and k-medoid clustering analyses were observed for different cluster numbers in the generated multivariate maps. Although the clustering performances of both algorithms are similar, it was observed that the k-Medoids algorithm has better separation of clusters.
Açıklama
Yüksek Lisans Tezi
Anahtar Kelimeler
Veri, Bilgi, Veritabanı, Veri Madenciliği, Kümeleme Analizi, Çok Değişkenli Harita, Data, Information, Database, Data Mining, Clustering Analysis, Multivariate Map
Kaynak
WoS Q Değeri
Scopus Q Değeri
Cilt
Sayı
Künye
Çağlar, B. (2018). Mekansal verilerin kümeleme analizi ile değerlendirilmesi. (Yayınlanmamış Yüksek Lisans Tezi). Necmettin Erbakan Üniversitesi, Fen Bilimleri Enstitüsü Harita Mühendisliği Anabilim Dalı, Konya.