Depresif bozuklukta intihar davranışını öngörmede ses analizi incelenmesi
dc.contributor.advisor | Ak, Mehmet | |
dc.contributor.author | Yünden, Sena | |
dc.date.accessioned | 2024-08-23T08:13:11Z | |
dc.date.available | 2024-08-23T08:13:11Z | |
dc.date.issued | 2024 | |
dc.date.submitted | 2024 | |
dc.department | NEÜ, Meram Tıp Fakültesi, Dahili Tıp Bilimleri Bölümü, Ruh Sağlığı ve Hastalıkları Anabilim Dalı | |
dc.description.abstract | Amaç: İntihar dünya genelinde önlenebilir ölümlerin önde gelen nedenlerinden biridir. İntiharla en güçlü ilişkilendirilen psikiyatrik bozukluk depresyondur. Klinik ortamlarda intihar riskini değerlendirebilecek nesnel verilere ihtiyaç duyulmaktadır. Ses analizi nörofizyolojik değişiklikleri yansıtması, kolay ulaşılabilir ve uygulanabilir olması açısından önemlidir. Çalışmamızda ses analizine dayalı makine öğrenme algoritması ile geliştirilen sınıflandırıcı ile depresyonu olan hastalarda intihar davranışını öngörmede sesle ilişkili değişkenlerin etkisinin incelenmesi ve ses analizi sonuçlarının ileride yapay zekâ algoritmaları için başlangıç teşkil etmesi amaçlanmıştır. Gereç ve Yöntem: Çalışmamız üç gruptan oluşmaktadır: DSM-5’e göre Majör Depresif Bozukluk (MDB) tanı kriterlerini karşılayan son on gün içerisinde intihar girişimi olan (n=30) intihar grubu, MDB tanı kriterlerini karşılayan, aktif intihar düşüncesi bulunmayan (n=30) depresyon grubu ve bilinen psikiyatrik tanısı ve ilaç kullanımı olmayan (n=30) kontrol grubu. Katılımcılara Sosyodemografik Veri Formu, Hamilton Depresyon Ölçeği, Hamilton Anksiyete Ölçeği, Columbia İntihar Şiddetini Derecelendirme Ölçeği/İntihar Davranışı Alt Ölçeği, Young Mani Derecelendirme Ölçeği, Beck Umutsuzluk Ölçeği uygulanmıştır. Katılımcılara standart metin okutulmuştur. Tüm ses kayıtları 16-bit çözünürlüğe sahip 44100 Hz örnekleme hızında dijitalleştirilmiştir ve sinyal işleme teknikleri kullanılarak analiz edilmiştir. Analizler, “Depresyon veya değil”, “İntihar veya değil”, ve “Depresyon veya İntihar” olarak üç görev için özellik çıkarma ve model eğitimi içerir. Mel Frekans Cepstral Katsayıları (MFCC), derin (VGGish), formant ve prozodik özellikler çıkarılmıştır. Makine öğrenme algoritması olarak Destek Vektör Makinesi (SVM) kullanılmıştır. Değerlendirmelerimiz 10 kat çapraz doğrulama kullanılarak gerçekleştirilmiş ve doğruluk, kesinlik, duyarlılık, F1 ve özgüllük dahil olmak üzere metriklerle sunulmuştur. Bulgular: “İntihar veya değil” ve “Depresyon veya İntihar” görevleri için MFCC temsili; “Depresyon veya değil” görevi için derin (VGGish) temsili daha başarılı bulundu. MFCC temsili ile "İntihar veya değil" görevinde doğruluk, kesinlik, duyarlılık, F1 ve özgüllük metrikleri için sırasıyla 0.900, 0.883, 0.933, 0.904 ve 0.866; "Depresyon veya İntihar" görevinde sırasıyla 0.683, 0.662, 0.767, 0.700 ve 0.600 oranları elde edildi. "Depresyon veya değil" görevi için VGGish temsili ile doğruluk, kesinlik, duyarlılık, F1 ve özgüllük metrikleri için sırasıyla 0.733, 0.810, 0.700, 0.716 ve 0.767 oranları elde edildi. Sonuç: Bilgimiz dahilinde, çalışmamız intihar riskini belirleme derin (VGGish) ile diğer (MFCC, formant, prozodik) ses parametrelerini karşılaştıran ilk çalışmadır. Tasarlanan SVM sınıflandırıcısında MFCC ve derin (VGGish) temsilleriyle yüksek sınıflandırma performansına ulaşılmıştır. Makine öğrenme algoritmasının daha geniş örneklemli çalışmalarla desteklenmesi sınıflandırma gücünü arttırması açısından önemlidir. | |
dc.description.abstract | Aim: Suicide is one of the leading causes of preventable deaths worldwide. The psychiatric disorder that is most strongly associated with suicide is depression. It is crucial to develop clinical tools that can provide objective data to assess suicide risk in clinical settings. Voice analysis is important for reflecting neurophysiological changes and is easily accessible and applicable. In our study, the aim was to investigate the effect of variables related to speech in predicting suicidal behavior in patients with depression using a machine learning algorithm based on speech analysis, and to lay the groundwork for future artificial intelligence algorithms with voice analysis results. Materials and Methods: The study sample consisted of three groups: a suicide group (n=30) meeting the DSM-5 Major Depressive Disorder (MDD) diagnostic criteria and who have attempted suicide in the last ten days, a depression group (n=30) meeting the DSM-5 MDD diagnostic criteria but without active suicidal ideation, and a healthy control group (n=30). Participants were administered a Socio-demographic Data Form, Hamilton Depression Scale, Hamilton Anxiety Scale, Columbia Suicide Severity Rating Scale, Young Mania Rating Scale, Beck Hopelessness Scale. Participants were presented with a standart text to read. All audio recordings were digitized at a 44100 Hz sampling rate with 16-bit resolution and analyzed using signal processing techniques. Analyzes include feature extraction and model training for 3 tasks, namely depressed or not, suicide or not, and depression or suicide. Mel Frequency Cepstral Coefficient (MFCC), deep (VGGish), formant, and prosodic features were extracted to analyze the sound characteristics. The Support Vector Machine is used as the machine learning algorithm. Our evaluations were performed using the 10-fold cross-validation and presented by the metrics including accuracy, precision, sensitivity, F1, and specificity. Results: The MFCC feature representation was found to be more successful for the tasks "Suicide or not" and "Depression or Suicide"; the deep (VGGish) feature representation was found to be more successful for the task "Depression or not". With the MFCC feature representation, the accuracy, precision, sensitivity, F1, and specificity rates for the "Suicide or not" task were 0.900, 0.883, 0.933, 0.904, and 0.866, respectively; for the "Depression or Suicide" task, the corresponding rates were 0.683, 0.662, 0.767, 0.700, and 0.600, respectively. With the deep (VGGish) feature representation for the "Depression or not" task, the accuracy, precision, sensitivity, F1, and specificity rates were 0.733, 0.810, 0.700, 0.716, ve 0.767, respectively. Conclusion: To the best of our knowledge, our study is the first to compare deep (VGGish) with other features of speech (MFCC, formant, prosodic) in determining suicide risk. High classification performance was achieved with MFCC and deep (VGGish) representations in the designed SVM model. It is important for the machine learning algorithm to be supported by larger sample studies to increase its classification power in future studies. | |
dc.identifier.citation | Yünden, S. (2024). Depresif bozuklukta intihar davranışını öngörmede ses analizi incelenmesi. (Yayınlanmamış tıpta uzmanlık tezi) Necmettin Erbakan Üniversitesi, Tıp Fakültesi Dahili Tıp Bilimleri Bölümü Ruh Sağlığı ve Hastalıkları Anabilim Dalı, Konya. | |
dc.identifier.uri | https://hdl.handle.net/20.500.12452/18620 | |
dc.identifier.yoktezid | 873224 | |
dc.language.iso | tr | |
dc.publisher | Necmettin Erbakan Üniversitesi, Tıp Fakültesi | |
dc.relation.publicationcategory | Tez | |
dc.rights | info:eu-repo/semantics/openAccess | |
dc.subject | Depresyon | |
dc.subject | Depression | |
dc.subject | İntihar | |
dc.subject | Suicide | |
dc.subject | Konuşma | |
dc.subject | Speech | |
dc.subject | Makine Öğrenimi | |
dc.subject | Machine Learning | |
dc.subject | Derin Öğrenme | |
dc.subject | Deep Learning | |
dc.title | Depresif bozuklukta intihar davranışını öngörmede ses analizi incelenmesi | |
dc.title.alternative | Examination of speech analysis to predict suicidal behavior in depression | |
dc.type | Specialist Thesis |