Please use this identifier to cite or link to this item: http://hdl.handle.net/11607/3048
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorGünel, Korhan-
dc.contributor.authorDincel, Onur-
dc.date.accessioned2017-07-19T13:05:59Z-
dc.date.available2017-07-19T13:05:59Z-
dc.date.issued2016-
dc.date.submitted2016-
dc.identifier.urihttp://hdl.handle.net/11607/3048-
dc.description.abstractBu çalışmada, belirteç seçiminin istatistiksel veri sıkıştırma yöntemlerinden biri olan Huffman sıkıştırma algoritması üzerine etkisi ve verimliliği araştırılmıştır. Bu amaçla Huffman ağacı üretebilmek için düzgün deyimler kullanılarak tanımlanan farklı türdeki belirteçlerin sıkıştırmada sağladığı kazanç hesaplanmış ve sıkıştırma performansları karşılaştırılmıştır. Çalışma beş ana bölümden oluşmaktadır. Giriş bölümünde, veri sıkıştırma tanımından ve veri sıkıştırma yöntemlerinin sınıflandırılmasından bahsedilmiştir. İkinci bölümde veri sıkıştırma yöntemlerinden olan istatistiksel veri sıkıştırma incelenmiş ve bilgi teorisi kavramları açıklanmıştır. Çalışmanın üçüncü bölümünde, kullanılan belirteç türlerini açıklama adına n-gram, Türkçe heceleme algoritması ve düzgün deyim kavramlarından söz edilmiştir. Dördüncü bölümde ise n-gram, hece ve düzgün deyimlerin yanı sıra bunların birlikte kullanımları ile yaratılan belirteçler ile Huffman ağaçları oluşturulmuş ve sıkıştırma işlemleri gerçekleştirilmiştir. Sıkıştırma işlemi yedi farklı doküman üzerinde test edilmiştir ve her bir dokümanın kullanılan tüm belirteç türlerine ait sonuçları elde edilmiştir. Çalışmanın son bölümünde elde edilen sonuçlar tartışılmıştır.tr_TR
dc.description.abstractIn this study, the effect and efficiency of token selection is investigated on the Huffman compression algorithm, one of the statistical data compression methods. To this end, compression gains for different types of tokens identified using regular expressions to produce Huffman tree is calculated and compression performance is compared. The study consists of five main chapters. In the introductory chapter, it is mentioned that the definition of data compression and classification of the data compression methods. In the second chapter, statistical data compression, one of the data compression methods is examined and basic concepts in information theory are explained. In the third chapter of the study, to describe used token type, it is introduced n-gram, Turkish syllabification algorithm and regular expression concept. Also in the fourth chapter, as well as n-gram, syllable and regular expression, Huffman trees with tokens created with collocation of their is generated and compression processing is performed. Compression processing is tested on seven different documents and the results of each document that is used for all tokens type is obtained. In the last chapter of the study, the results obtained is discussed.tr_TR
dc.language.isoturtr_TR
dc.publisherAdnan Menderes Üniversitesi, Fen Bilimleri Enstitüsütr_TR
dc.rightsinfo:eu-repo/semantics/embargoedAccesstr_TR
dc.subjectVeri sıkıştırmatr_TR
dc.subjectHuffman kodlamasıtr_TR
dc.subjectn-gramtr_TR
dc.subjectDüzgün deyimlertr_TR
dc.titleBelirteç seçiminin Huffman kodlaması üzerine etkisitr_TR
dc.title.alternativeEffect of token selection on Huffman codingtr_TR
dc.typemasterThesistr_TR
dc.contributor.departmentAdnan Menderes Üniversitesi, Fen Bilimleri Enstitüsü, Matematik Anabilim Dalıtr_TR
Appears in Collections:Yüksek Lisans

Files in This Item:
File Description SizeFormat 
Onur DİNCEL.pdfYüksek Lisans Tezi1.2 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.