Please use this identifier to cite or link to this item:
https://hdl.handle.net/11147/4431
Title: | A lattice-based approach for news chain construction | Other Titles: | Haber zinciri oluşturulması için kafes tabanlı bir yaklaşım | Authors: | Toprak, Mustafa | Advisors: | Tekir, Selma Allmer, Jens |
Keywords: | Lattice theory News story Lattice structure Coherence |
Publisher: | Izmir Institute of Technology | Source: | Toprak. M. (2015). A lattice-based approach for news chain construction. Unpublished master's thesis, İzmir Institute of Technology, İzmir, Turkey | Abstract: | Each news article and column can be part of a manually created news story or
chain by journalists and columnists. However, increasing amounts of data published by
news companies each year makes manual analysis thus creation of news stories and chains
almost impossible. When the amount of data is considered, it is obvious that automated
systems’ support is vital to journalists, columnists and intelligence analysts.
A news chain is a set of news articles that form a connected and coherent whole.
In the traditional “connecting the dots” approach, news chains are constructed based on
given two articles as start and end news of the chain. In this study, a method is proposed
to create coherent news chains without the predetermination of start and end articles of
the chain. Intuition of the method comes from the partial order relation among news
articles. We try to show that lattice structure can represent relation or hierarchy among
news articles that have a partial order in nature. Creating concept lattice is prepared out
of the inverted index structure of news articles which is one of the main contributions of
the study.
In the experimental work, an artificial dataset is processed to show the steps of the
method. After that, we also provide the evaluation using real dataset results. Haber kaynaklarından okunan her bir haber veya köşe yazısı aslında yazarlar ya da gazeteciler tarafından elle oluşturulmuş bir haber hikayesi veya zincirinin bir halkası olarak kabul edilebilir. Ancak, her yıl haber kaynakları tarafından yayınlanan ve gittikçe artan haber sayısı göz önüne alındığında, haberlerin elle analizi gittikçe zorlaşmakta ve hatta imkansız hale gelmektedir. Yayınlanan haber sayılarındaki artış ve oluşan haber arşivlerinin büyüklüğü değerlendirildiğinde, haber analizindeki otomasyon sistemleri, özellikle araştırmacı gazetecilik ve istihbarat analizi alanlarında vazgeçilmez bir ihtiyaç haline gelmektedir. Haber zinciri, kendi aralarında anlamlı ve bağlı bir bütün oluşturan haber dizisidir. Geleneksel “noktaları birleştirelim” yaklaşımında haber zincirleri iki uç noktasının arası doldurularak oluşturulmaktadır. Bu çalışma kapsamında, başlangıç ve bitiş haberleri önceden belirlenmemiş, tutarlı bir haber zinciri oluşturan bir metod önerilmektedir. Bu metodun dayandığı fikir, haberler arasındaki kısmi sıralama (partial order) bağıntısıdır. Kafes yapısının (lattice) haberler arasındaki ilişkiyi ve hiyerarşiyi modelleyebileceği ve temsil edebileceği üzerinde durulmaktadır. Kafes yapısının oluşturulmasında girdi olarak ters dizin (inverted index) yapısının kullanılması çalışmanın bir başka özgün noktasıdır. Deneysel çalışmalar bölümünde yapay bir veri seti üzerinde önerilen metodun aşamaları gösterilmektedir. Ardından gerçek veri setleri üzerinde elde edilen sonuçlar yorumlanarak sunulmaktadır. |
Description: | Thesis (Master)--Izmir Institute of Technology, Computer Engineering, Izmir, 2015 Full text release delayed at author's request until 2016.08.05 Includes bibliographical references (leaves: 37-39) Text in English; Abstract: Turkish and English. xi, 43 leaves |
URI: | http://hdl.handle.net/11147/4431 |
Appears in Collections: | Master Degree / Yüksek Lisans Tezleri |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
T001362.pdf | MasterThesis | 388.58 kB | Adobe PDF | View/Open |
CORE Recommender
Page view(s)
162
checked on Dec 2, 2024
Download(s)
110
checked on Dec 2, 2024
Google ScholarTM
Check
Items in GCRIS Repository are protected by copyright, with all rights reserved, unless otherwise indicated.