Gri Kurt Optimizasyon Algoritmasının Veri Madenciliği Problemlerine Uygulanması
Dosyalar
Tarih
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
Erişim Hakkı
Özet
Gelişen teknolojiyle beraber artan veri yoğunluğu, yüksek işleme gücü ve farklı hesaplama olanakları ile birlikte, karmaşık modellemelerin geliştirilmesi ve gelişmiş veri madenciliği uygulamaları kullanılarak temel kriterlere dayalı ileriye dönük daha başarılı tahmin modellemelerinin oluşturulması daha fazla mümkün hale gelmiştir. Veri kümeleri üzerinde uygulanan modelin tahmin başarısı, kuşkusuz hazırlanan modelin başarısına bağlı olarak değişmektedir. Bu yüzden veri madenciliği problemlerinin çözümünde kullanılan algoritma ve algoritmada oluşturulan modelin belirlenmesi uygulamanın başarısı açısından son derece önemlidir. Veri modellerinin karmaşık olması, veriye ait niteliklerin fazlalığı ve veri kümesindeki elemanların fazla olması, doğru analizlerin yapılmasını zorlaştırmaktadır. Bu nedenle özellik seçimi, ayrıklaştırma, kümeleme ve sınıflandırma gibi konular veri madenciliğinde büyük önem arz etmektedir. Gri Kurt Optimizasyonu Algoritması, veri madenciliği problemlerinde kullanılmaya elverişli olması ve yakın zamanda geliştirilen bir optimizasyon algoritması olması nedeniyle veri madenciliği uygulamalarında kümeleme ve sınıflandırma problemlerinin etkin çözümü için kullanılmıştır. Bu çalışmada, gri kurtların toplumsal davranışlarına dayanan gri kurt optimizasyonu (GWO) algoritması ile en iyi küme merkezlerini aramak suretiyle veri nesnelerini bölümlemek ve kümelemenin akabinde yeni bir yaklaşımla sınıflandırmayı sağlamak amacıyla kullanılmıştır. GWO algoritmasının kümeleme performansı, K-means, K-medoids ve Fuzzy C-means algoritmalarının performanslarıyla karşılaştırılmıştır. Deneyler, GWO algoritmasının diğer kümeleme algoritmalarından daha iyi sonuçlar verdiğini ve alternatif olarak kümeleme problemlerinde kullanılabileceğini göstermektedir. Ayrıca seçilen 6 adet veri seti üzerinde GWO ile kümeleme tabanlı sınıflandırma modelini geliştirerek veri madenciliği uygulamalarının performansını arttırmaya yönelik deneysel çalışma yapılmıştır. GWO algoritması tabanlı geliştirdiğimiz yeni bir sınıflandırma modelinden elde edilen sonuçlar ile literatür taramasında elde edilen sonuçlar karşılaştırılmıştır. Sonuç olarak GWO algoritması tabanlı geliştirilen sınıflandırma modelinin daha başarılı sonuçlar verdiği tespit edilmiştir.
With the developing technology, increasing data density, high processing power and different computational possibilities, it has become more possible to develop complex models and to create more successful predictive models based on basic criteria by using advanced data mining applications. The estimation success of the model applied on the datasets undoubtedly varies depending on the success of the prepared model. Therefore, the algorithm used in solving data mining problems and the determination of the model created in the algorithm are extremely important for the success of the application. The complexity of data models, the excess of data attributes, and the excess of elements in the data set make it difficult to conduct accurate analysis. For this reason, issues such as feature selection, discretization, clustering and classification are of great importance in data mining. The Gray Wolf Optimization Algorithm was chosen because it is suitable for use in data mining problems and is a recently developed optimization algorithm. In this study, the gray wolf optimization (GWO) algorithm based on the social behavior of gray wolves was used to search for the best cluster centers, to partition data objects and to provide classification with a new approach after clustering. The clustering performance of the GWO algorithm was compared with the performances of the K-means, K-medoids and Fuzzy C-means algorithms. Experiments show that the GWO algorithm gives better results than other clustering algorithms and can be used in clustering problems as an alternative. In addition, an experimental study was conducted to improve the performance of data mining applications by developing the clustering-based classification model with GWO on 6 selected data sets. The results obtained from a new classification model that we developed based on the GWO algorithm were compared with the results obtained in the literature review. As a result, it has been determined that the classification model developed based on the GWO algorithm gives more successful results.