Please use this identifier to cite or link to this item: https://hdl.handle.net/11147/4857
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorErgenç Bostanoğlu, Belginen_US
dc.contributor.authorDarrab, Sadeq Hussein Saleh-
dc.date.accessioned2017-02-17T12:19:52Z-
dc.date.available2017-02-17T12:19:52Z-
dc.date.issued2016-07-
dc.identifier.citationDarrab, S. H. S. (2016). Develepment of framework for frequent itemset mining under multiple support thresholds. npublished master's thesis, İzmir Institute of Technology, İzmir, Turkeyen_US
dc.identifier.urihttp://hdl.handle.net/11147/4857-
dc.descriptionThesis (Master)--Izmir Institute of Technology, Computer Engineering, Izmir, 2016en_US
dc.descriptionFull text release delayed at author's request until 2018.07.27en_US
dc.descriptionIncludes bibliographical references (leaves: 59-63)en_US
dc.descriptionText in English; Abstract: Turkish and Englishen_US
dc.descriptionxi, 63 leavesen_US
dc.description.abstractFrequent pattern mining is an essential method of data mining that is used to extract interesting patterns from massive databases. Traditional methods use single minimum support threshold to find out the complete set of frequent patterns. However, in real word applications, using single minimum support threshold is not adequate since it does not reflect the nature of each item and causes a problem called rare item problem. Recently, several methods have been studied to tackle this problem by avoiding using single minimum item support threshold. The nature of each item is considered where different items are specified with different minimum support thresholds. By this, the complete set of frequent patters are generated without creating uninteresting patterns and losing substantial patterns. In this thesis, we propose an efficient method, Multiple Item Support Frequent Pattern growth algorithm, MISFP-growth, to mine the complete set of frequent patterns with multiple item support thresholds. In this method, Multiple Item Support Frequent Pattern tree, MISFP-Tree, is constructed to store all crucial information to mine frequent patterns. Since in the construction of the MISFP-Tree is done with respect to minimum of Multiple Itemset Support values; pruning and reconstruction phases are not required. To show the efficiency of the proposed method, it is compared with a recent tree-based algorithm, CFP-growth++. To evaluate the performance of the proposed algorithm, various experiments are conducted on both real and synthetic datasets. Experimental results reveal that MISFP-growth outperforms the previous algorithm in terms of execution time, memory space as well as scalability.en_US
dc.description.abstractSık kümeler madenciliği yöntemleri yoğun veri tabanlarındaki özellikli örüntülerin bulunmasını sağlarlar. Bu yöntemler, sık kümeler setlerini bulurken tek bir destek eşik değerini esas alırlar. Oysa gerçek dünya uygulamalarında tek bir destek eşik değeri örüntülerin tek başlarına özelliğini yansıtmakta yetersiz kalmakta ve seyrek örüntü (rare item) problemi ortaya çıkarmaktadır. Son zamanlarda, bu seyrek örüntü probleminin çözümüne odaklanan çalışmalar bulunmaktadır. Bu çalışmalar kümelere ve küme elemanlarına farklı destek eşik değerleri atanmasına izin vermektedir. Böylece gereksiz örüntüler oluşturulmadan seyrek örüntüler ele geçirilebilmektedir. Bu tez kapsamında, etkin bir Çoklu Destek Eşiklerinde Sık Kümeler (Multiple Item Support Frequent Pattern growth algorithm, MISFP-growth) yöntemi önerilmektedir. Bu yöntem veri tabanından sık örüntülerin bulunmasını sağlayacak veriyi bir ağaçta saklamaktadır (MISFP-Tree). Bu ağaç tüm veriyi değil de çoklu eşiklerin minimumunu dikkate alarak oluşturulduğu için, oluşturulma sonrası budama ve yeniden oluşturulmaya gereksinim duymamaktadır. Bu yöntemin etkinliği yeni bir ağaç tabanlı yöntemle (CFP-growth++) karşılaştırılarak gösterilmiştir. Karşılaştırma çalışmaları gerçek ve sentetik veri tabanları üzerinde gerçekleştirilmiştir. Başarım değerlendirme sonuçları MISFP-growth yönteminin diğer yönteme göre, çalışma zamanı, bellek kullanımı ve ölçeklenebilirlik açısından daha başarılı olduğunu göstermiştir.en_US
dc.language.isoenen_US
dc.publisherIzmir Institute of Technology-
dc.publisherIzmir Institute of Technologyen_US
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.subjectMultiple support thresholdsen_US
dc.subjectData miningen_US
dc.subjectMining algorithmsen_US
dc.titleDevelepment of framework for frequent itemset mining under multiple support thresholdsen_US
dc.title.alternativeÇoklu destek eşiklerinde sık kümeler madenciliği için uygulama iskeleti geliştirilmesien_US
dc.typeMaster Thesisen_US
dc.institutionauthorDarrab, Sadeq Hussein Saleh-
dc.departmentThesis (Master)--İzmir Institute of Technology, Computer Engineeringen_US
dc.request.emailsadeqaldrab@gmail.com-
dc.request.fullnameSadeq Hussein Saleh Darrab-
dc.relation.publicationcategoryTezen_US
item.grantfulltextopen-
item.openairecristypehttp://purl.org/coar/resource_type/c_18cf-
item.cerifentitytypePublications-
item.openairetypeMaster Thesis-
item.languageiso639-1en-
item.fulltextWith Fulltext-
Appears in Collections:Master Degree / Yüksek Lisans Tezleri
Files in This Item:
File Description SizeFormat 
T001514.pdfMasterThesis1.6 MBAdobe PDFThumbnail
View/Open
Show simple item record



CORE Recommender

Page view(s)

120
checked on Apr 22, 2024

Download(s)

44
checked on Apr 22, 2024

Google ScholarTM

Check





Items in GCRIS Repository are protected by copyright, with all rights reserved, unless otherwise indicated.