Please use this identifier to cite or link to this item: https://hdl.handle.net/11147/6855
Title: Localization of certain animal species in images via training neural networks with image patches
Other Titles: İmge parçaları kullanılarak eğitilen yapay sinir ağları ile imgelerde belirli hayvan türlerinin konumlandırılması
Authors: Orhan, Semih
Advisors: Baştanlar, Yalın
Keywords: Convolutional neural networks
Object detection
Patch-based Model
Publisher: Izmir Institute of Technology
Source: Orhan, S. (2017). Localization of certain animal species in images via training neural networks with image patches. Unpublished master's thesis, İzmir Institute of Technology, İzmir, Turkey
Abstract: Object detection is one of the most important tasks for computer vision systems. Varying object size, varying view angle, illumination conditions, occlusion etc. effect the success rate. In recent years, convolutional neural networks (CNNs) have shown great performance in different problems of computer vision including object detection and localization. In this work, we propose a novel training approach for CNNs to localize some animal species whose bodies have distinctive pattern, such as speckles of leopards, black-white lines of zebras, etc. To learn characteristic patterns, small patches are taken from different body parts of animals and they are used to train models. To find object location, in a test image, all locations are visited in a sliding window fashion. Crops are fed to CNN, then classification scores of all patches are recorded. To illustrate object location, heat map is generated by the classification scores of the patches. Afterwards, heat maps are converted to binary images and end up with bounding box estimates of objects. The localization performance of our Patch-based training is compared with Faster R-CNN – a state-of-the-art CNN-based object detection and localization algorithm. While evaluating the performances, in addition to the standard precision-recall metric, we use area-precision and area-recall which represent the potential of Patch-based Model better. Experiment results show that the proposed training method has better performance than Faster R-CNN for most of the evaluated classes. We also showed that Patch-based Model can be used with Faster R-CNN to increase its localization performance.
Nesne bulma bilgisayarla görü sistemlerinin en önemli görevlerinden biridir. Değişen nesne boyutu, değişen bakış açısı, ortam aydınlatması, örtüşen nesneler ve benzeri etkenler başarım üzerinde etkilidir. Son yıllarda, Evrişimli Yapay Sinir Ağları (EYSA) birçok bilgisayarla görü problemlerinde (nesne konumlandırma ve nesne tespiti) çok iyi bir performans göstermiştir. Bu çalışmada, bedeni üzerinde ayırt edici bir desene sahip hayvanların, örneğin: benekli leoparlar, siyah beyaz çizgili zebralar gibi, konumunu bulmak için EYSA kullanan yeni bir yaklaşım öneriyoruz. Desen özelliklerini öğrenmek için, vücudun çeşitli bölgelerinden küçük parçalar alınır ve modelleri eğitmek için kullanılır. Test imgelerinde nesne konumunu bulmak için bütün konumlara kayan pencere yaklaşımı ile uğranır. Parçalar EYSA’na verilir ve tüm parçaların sınıflandırma skorları kaydedilir. Nesne konumlarını görselleştirmek için tüm parçaların sınıflandırma skorları kullanılarak sıcaklık haritası üretilir. Daha sonra sıcaklık haritaları ikili imgelere çevrilir ve nesneyi kapsayan kutu tahmini yapılarak süreç sonuçlanır. Önerdiğimiz Parçatabanlı eğitim yönteminin nesne konumlandırma performansını EYSA kullanan güncel algoritmalardan biri olan Faster R-CNN ile karşılaştırdık. Performans değerlendirmesi yaparken standart kesinlik-anma metriğine ek olarak, Parça-tabanlı yöntemi daha iyi ifade ettiği için alan-kesinlik ve alan-anma metriğini de kullandık. Deney sonuçlarına göre önerilen eğitim yöntemi Faster R-CNN’e göre neredeyse değerlendirilen tüm sınıflar için daha iyi bir performans göstermektedir. Aynı zamanda, Parça-tabanlı yöntem Faster R-CNN ile kullanılarak Faster R-CNN’in konumlandırma başarısının artırılabileceği deştir.
Description: Thesis (Master)--Izmir Institute of Technology, Computer Engineering, Izmir, 2017
Includes bibliographical references (leaves: 38-42)
Text in English; Abstract: Turkish and English
URI: http://hdl.handle.net/11147/6855
Appears in Collections:Master Degree / Yüksek Lisans Tezleri

Files in This Item:
File Description SizeFormat 
T001695.pdfMasterThesis5.01 MBAdobe PDFThumbnail
View/Open
Show full item record



CORE Recommender

Page view(s)

152
checked on Apr 15, 2024

Download(s)

52
checked on Apr 15, 2024

Google ScholarTM

Check





Items in GCRIS Repository are protected by copyright, with all rights reserved, unless otherwise indicated.