Veri madenciliği kullanarak AChE enzimiyle etkileşen moleküllerin bağlanma eğiliminin tahmini

dc.authorid0000-0002-8430-1315
dc.contributor.advisorErdaş Çiçek, Özlem
dc.contributor.authorYenen, Merve
dc.date.accessioned2026-04-06T07:34:13Z
dc.date.available2026-04-06T07:34:13Z
dc.date.issued2024
dc.date.submitted2024
dc.departmentNEÜ, Fen Bilimleri Enstitüsü, Bilgisayar Mühendisliği Anabilim Dalı
dc.descriptionYüksek Lisans Tezi
dc.description.abstractİlaç keşfi için kullanılan veri setlerinin analizi, verilerin kalitesini ve uygunluğunu değerlendirmek için gereklidir. Veri setlerindeki eğilimlerin, dağılımların ve ilişkilerin analizi, doğru sonuçlar elde etmek için önemlidir. Ayrıca, potansiyel ilaç adaylarını belirlemek için kullanılan moleküler özelliklerin ve etkileşimlerin anlaşılmasına yardımcı olmaktadır. Bu çalışmada, AChE enzimini inhibe eden bileşiklerin IC50 değerlerini tahmin etmek amacıyla veri madenciliği ve makine öğrenme algoritmaları kullanılmıştır. Biyolojik aktivite verileri, kanonik SMILES dizileri ve Lipinski’nin 5 kuralına dayalı özelliklerle genişletilmiştir. Çalışmada, moleküllerin biyolojik aktivitelerini ve ilaç benzerliklerini tahmin etmek için moleküler parmak izi hesaplamaları yapılmıştır. Farklı uzunluklardaki bit vektörleriyle oluşturulan veri setleri üzerinde Rassal Orman, XGBOOST, Ridge, SVR ve PLS regresyon algoritmaları ile tahminlemeler gerçekleştirilmiştir. Performans değerlendirmesi için k-katlı çapraz geçerleme kullanılmıştır. Elde edilen sonuçlara göre söz konusu algoritmalardan bazıları seçilerek toplu öğrenim yönteminde tahminleyici olarak kullanılmıştır. Sonuç olarak XGBOOST, PLS ve Ridge tahminleyicilerinin kullanıldığı toplu öğrenim yöntemiyle 0.75 korelasyon ve 0.63 ortalama kare hata değeri ile literatürdeki örneklerine kıyasla daha iyi bir sonuç elde edilmiştir. Ayrıca, standart sapması 0.3’ten küçük olan bit sütunlarının elenmesi ile veri seti küçültülmüş ve modellerin çalışma hızları arttırılmıştır. Bu çalışmada, AChE enzimiyle etkileşen bileşiklerin etkinliğinin belirlenmesinde makine öğrenimi algoritmalarının performansını karşılaştırmalı analiz ederek en iyi IC50 değeri tahmin sonucuna ulaşmak hedeflenmiştir. En iyi IC50 değerini bulmak, bir ilacın hedef enzimi ne kadar etkili durdurduğunu gösterir ve bu sayede, hastalıkların tedavisinde kullanılabilecek en güçlü ilaç adaylarını seçmeye yardımcı olabilir.
dc.description.abstractAnalysis of datasets used for drug discovery is essential to assess the quality and relevance of the data. Analysis of trends, distributions, and relationships in data sets is important to obtain accurate results. It also helps understand molecular properties and interactions used to identify potential drug candidates. In this study, data mining and machine learning algorithms were used to estimate the IC50 values of compounds that inhibit the AChE enzyme. Biological activity data are augmented with features based on canonical SMILES sequences and Lipinski’s rule of 5. In the study, molecular fingerprint calculations were performed to estimate the biological activities and drug similarities of molecules. Predictions were performed using Random Forest, XGBOOST, Ridge, SVR and PLS regression algorithms on datasets created with bit vectors of different lengths. K-fold cross-validation was used for performance evaluation. According to the results obtained, some of the algorithms were selected and used as predictors in the ensemble learning method. As a result, a better result was obtained compared to the examples in the literature with 0.75 correlation and 0.63 mean square error value with the ensemble learning method using XGBOOST, PLS and Ridge estimators. In addition, the data set was reduced and the working speed of the models was increased by eliminating the bit columns with standard deviation less than 0.3. This study aims to reach the best IC50 value prediction result by comparatively analyzing the performance of machine learning algorithms in determining the effectiveness of compounds that interact with the AChE enzyme. Finding the best IC50 value indicates how effectively a drug inhibits a target enzyme and can help select the most potent drug candidates to treat diseases.
dc.identifier.citationYenen, M. (2024). Veri madenciliği kullanarak AChE enzimiyle etkileşen moleküllerin bağlanma eğiliminin tahmini. (Yayımlanmamış yüksek lisans tezi). Necmettin Erbakan Üniversitesi, Fen Bilimleri Enstitüsü Bilgisayar Mühendisliği Anabilim Dalı, Konya.
dc.identifier.urihttps://hdl.handle.net/20.500.12452/19958
dc.language.isotr
dc.publisherNecmettin Erbakan Üniversitesi, Fen Bilimleri Enstitüsü
dc.relation.publicationcategoryTez
dc.rightsinfo:eu-repo/semantics/openAccess
dc.subjectBağlanma Afinitesi
dc.subjectDestek Vektör Regresyonu
dc.subjectİlaç Keşfi
dc.subjectK-Katlı Çapraz Geçerleme
dc.subjectLipinski’nin 5 Kuralı
dc.subjectMakine Öğrenmesi
dc.subjectMoleküler Parmak İzi
dc.subjectPLS Regresyon
dc.subjectRassal Orman Regresyonu
dc.subjectRidge Regresyonu
dc.subjectTopluluk Öğrenimi
dc.subjectXGBOOST Regresyonu
dc.subjectAffinity Binding
dc.subjectSVR
dc.subjectDrug Discovery
dc.subjectK-Fold Cross Validation
dc.subjectLipinski's Rule Of Five
dc.subjectMachine Learning
dc.subjectMolecular Fingerprint
dc.subjectPLS Regression
dc.subjectRandom Forest Regression
dc.subjectRidge Regression
dc.subjectEnsemble Learning
dc.subjectXGBOOST Regression
dc.titleVeri madenciliği kullanarak AChE enzimiyle etkileşen moleküllerin bağlanma eğiliminin tahmini
dc.title.alternativePrediction of binding affinity of molecules interacting with AChE enzyme using data mining
dc.typeMaster Thesis

Dosyalar

Orijinal paket
Listeleniyor 1 - 1 / 1
Yükleniyor...
Küçük Resim
İsim:
MerveYenen_YL_2024.pdf
Boyut:
1.82 MB
Biçim:
Adobe Portable Document Format
Açıklama:
Yüksek Lisans Tezi
Lisans paketi
Listeleniyor 1 - 1 / 1
Küçük Resim Yok
İsim:
license.txt
Boyut:
1.17 KB
Biçim:
Item-specific license agreed upon to submission
Açıklama: