Derin Öğrenme Yöntemi ile El Yazısı Tanıma
Yükleniyor...
Tarih
04.08.2021
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
Fen Bilimleri Enstitüsü
Erişim Hakkı
info:eu-repo/semantics/openAccess
Özet
Günümüzde teknolojinin ilerlemesi, formlar ve dilekçeler gibi belgelerin bilgisayar ve dijital ortamda doldurulmasına neden oldu. Ancak bazı durumlarda, belgeler hala baskıda geleneksel tarzda korunmaktadır. Bununla birlikte, belgelerin farklı büyüklükleri (kapladığı yer) nedeniyle, depolanması, paylaşılması ve dosyalanması gibi bazı zorluklar bulunmaktadır. Bu nedenle, yazılı belgelerin dijital ortama taşınması büyük önem taşımaktadır. Bu ve benzeri nedenlerden dolayı, bu çalışma el yazısıyla yazılmış belgelerin sayısallaştırılmasına ilişkin metodolojileri inceleyerek Konvolüsyon Sinir Ağ yöntemi ile el yazılarının sayısallaştırılması amaçlanmıştır. Bunun için, görüntü formatına dönüştürülen belgeler görüntü işleme yöntemleri kullanılarak önceden işlenmiştir. Bu işlemler, belgenin satırlarını görüntü formatına bölmeyi, daha sonra karakterlere bölünen kelimelere bölmeyi ve son olarak karakterler üzerinde bir sınıflandırma işlemini içerir. Sınıflandırma aşamasında, derin öğrenme yöntemlerinden biri olan ve görüntü tanımada kullanılan Konvolüsyon Sinir Ağı yöntemi kullanılmıştır. Model, EMNIST veri kümesi kullanılarak ve eldeki belgelerden oluşturulan karakter veri kümesinde eğitilmiştir. Oluşturulan veri kümesi %88.72'lik bir başarı oranını yakalamıştır.
The advancement of technology nowadays resulted into documents, such as forms and petitions, being filled out in computer and digital environment. Yet in some cases, documents are still preserved in traditional style, on print. Due to its distinct proportions, however, its storage, sharing and filing has become a complication. The relocation of these written documents to digital environment is therefore of great significance. In this view, this study aims to explore methodologies of digitizing handwritten documents. In this study, the documents converted to image format were pre-processed using image processing methods. These operations includes dividing lines of the document into image format, dividing into words which then divided into characters, and finally, a classification operation on the characters. As classification phase, one of the deep learning methods is the Convolution Neural Network method is used in image recognition. The model was trained using the EMNIST dataset, and in the character dataset created from the documents at hand. The dataset created had a success rate of 88.72.
The advancement of technology nowadays resulted into documents, such as forms and petitions, being filled out in computer and digital environment. Yet in some cases, documents are still preserved in traditional style, on print. Due to its distinct proportions, however, its storage, sharing and filing has become a complication. The relocation of these written documents to digital environment is therefore of great significance. In this view, this study aims to explore methodologies of digitizing handwritten documents. In this study, the documents converted to image format were pre-processed using image processing methods. These operations includes dividing lines of the document into image format, dividing into words which then divided into characters, and finally, a classification operation on the characters. As classification phase, one of the deep learning methods is the Convolution Neural Network method is used in image recognition. The model was trained using the EMNIST dataset, and in the character dataset created from the documents at hand. The dataset created had a success rate of 88.72.
Açıklama
Yüksek Lisans Tezi
Anahtar Kelimeler
Derin öğrenme, El yazısı tanıma, EMNIST, Görüntü işleme, Karakter tanıma, Konvolüsyon sinir ağı, Character recognition, Convolutional neural network, Deep learning, Handwriting recognition, Image processing
Kaynak
WoS Q Değeri
Scopus Q Değeri
Cilt
Sayı
Künye
Ayvacı Erdoğan, A. (2021). Derin öğrenme yöntemi ile el yazısı tanıma. (Yayınlanmamış Yüksek Lisans Tezi). Necmettin Erbakan Üniversitesi, Fen Bilimleri Enstitüsü Bilgisayar Mühendisliği Anabilim Dalı, Konya.