Veri Madenciliği Uygulamalarında Ağaç Tohum Algoritmasının Kullanımı
Dosyalar
Tarih
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
Erişim Hakkı
Özet
Gelişen teknoloji ile birlikte kayıt altına alınan veri miktarında yüksek oranda artış olmuştur. Kayıt altına alınan verilerin etkili yöntemler ile işlenerek çok miktardaki veriden anlamlı bilgi çıkarımı günümüzün en önemli işleri arasındadır. Veri madenciliği kayıt altına alınmış yığın halindeki verinin işlenerek sistematik ve kullanışlı bilgiler elde edilmesine olanak sağlayan yöntemleri içeren bir bilgisayar bilimi alanıdır. Optimizasyon ise bir problemin çözümleri arasında en uygun olanını bulma işleminin adıdır. Optimizasyon algoritmaları doğrusal olmayan problemlerin çözümünde kullanılmak üzere tasarlanmış etkili yöntemlerdir. Bu yöntemler bir problemin olası çözümlerini içeren çözüm uzayı içerisinde en uygun çözümü tespit etmek üzere geliştirilmiştir. Veri madenciliğinde kullanılan yöntemlerden birçoğu kapsamlı ve çok boyutlu çözüm uzayları ile doğrusal olmayan problemlerin özelliklerini taşır. Bu sebeple, optimizasyon için geliştirilen yöntemler veri madenciliği işlemlerinde kullanılabilir. Bu tez çalışmasında yakın zamanda geliştirilen bir optimizasyon yöntemi olan Ağaç-Tohum Algoritması kullanılarak sınıflandırma, kümeleme, eksik veri tamamlama gibi veri madenciliği işlemleri gerçekleştirilmiştir. Ayrıca, Ağaç Tohum Algoritmasının güncelleme aşamasına yeni bir yaklaşım önerilmiş ve bu yeni yaklaşımın Ağaç Tohum Algoritmasının başarısına etkisi incelenmiştir. Elde edilen sonuçlar, aynı işlemler için kullanılan geleneksel yöntemlerin performansları ile karşılaştırılmıştır. Ağaç Tohum Algoritmasının bahsedilen veri madenciliği işlemlerinde halihazırda kullanılmakta olan yöntemlerden genel olarak daha başarılı sonuçlar verdiği gözlemlenmiştir.
The amount of recorded data is highly increased wit develpoing technology. Retrieving meaningful information from excessive amount of recorded data with efficient methods is one of the most important processes of present era. Data mining is the computer science area that includes methodologies to retrieve sistematic and useful information by operating raw recorded data. Optimization, on the other hand, is the process of selecting best fitted solution among all possible solutions of a problem. Optimization algorithms are efficient methods developed for solving nonlinear problems. These methods are developed to state the most optimum solution among all possible solutions of a problem. Most of the data mining applications are similar to nonlinear problems with their characteristics of having comprehensive and multidimensional solution space. Therefore methods which are developed to solve optimization problems can be used to apply data mining techniques. In this thesis study, a recently developed optimization method, called Tree Seed Algorithm ised used to perform data mining applciations, which are classification, clustering and missing value imputation. In adition, a new approach is proposed to Tree Seed Algorithm’s update phase and the effect of this modification to algorithms performance is investigated. Gathered result were compared to merhods which are commonly used to apply same operations. It is seen that Tree Seed Algorithm has reached more successful results than existing method of mentioned data mining applications.












