Doğruluk Problemi için Veri Kümesi Hazırlanması
Loading...
Files
Date
2018
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
CEUR Workshop Proceedings
Open Access Color
OpenAIRE Downloads
OpenAIRE Views
Abstract
Internet has become one of the most important information sources. With the advent of Internet, the ease of access and sharing of information have caused the emergence of conflicting information. The increase in conflicting information makes it a challenge to find the truth out of it. This problem is named as the veracity problem. The algorithms that were developed in response to this problem accept structured data as in¬ put. Thus, to be able to use these algorithms on Internet, there is a need to transform the unstructured data on the Internet into a structured form. This need is hard to fulfill in a domain-independent and automatic way considering the variety on Internet. In this work; structured data preparation to test the effectiveness of the truth-finder algorithms is experienced. The process of transforming the unstructured data on the Internet into a structured form is described in steps to contribute its generalization in a domain-independent way. As a result of this process, a new quotes data set is constructed and a truth-finder algorithm is tested on this dataset by giving some comments on it.
İnternet günümüzde en önemli bilgi kaynaklarından biri haline gelmiştir.İnternet ile birlikte, bilgiye ulaşımın ve paylaşın kolaylaşması, çelişkili bilgilerin açığa çıkmasına sebep olmuştur. Çelişkili bilgilerin artmasıyla, bunlar arasında doğru olanı bulmak da her geçen gün zorlaşmaktadır. Bu sorun literatürde doğruluk (veracity) problemi olarak tanımlanmıştır. Bu alanda geliştirilen algoritmalar girdi olarak yapısal veriyi kabul etmektedir. Bu algoritmaların internet üzerinde kullanılabilmesi için internetteki yapısal olmayan verinin yapısal forma dönüştürülmesi gerekmektedir. İnternet'teki verinin çeşitliliği düşünüldüğünde bu işin konudan bağımsız, otomatik olarak gerçekleştirilmesi zordur. Bu çalışmada doğruluk problemi üzerine geliştirilen algoritmaların sınanabilmesi için internetteki yapısal olmayan verilerin yapısal bir veri kümesine dönüştürülmesinde gerekli aşamalar belirlenip otomatize edilmesine katkı sağlanmıştır. Bu aşamalar kullanılarak örnek bir özdeyiş veri kümesi oluşturulmuş ve belirlenen bir doğruluk sınama algoritması bu veri kümesinde uygulanarak elde edilen sonuçclar yorumlanmıştır.
İnternet günümüzde en önemli bilgi kaynaklarından biri haline gelmiştir.İnternet ile birlikte, bilgiye ulaşımın ve paylaşın kolaylaşması, çelişkili bilgilerin açığa çıkmasına sebep olmuştur. Çelişkili bilgilerin artmasıyla, bunlar arasında doğru olanı bulmak da her geçen gün zorlaşmaktadır. Bu sorun literatürde doğruluk (veracity) problemi olarak tanımlanmıştır. Bu alanda geliştirilen algoritmalar girdi olarak yapısal veriyi kabul etmektedir. Bu algoritmaların internet üzerinde kullanılabilmesi için internetteki yapısal olmayan verinin yapısal forma dönüştürülmesi gerekmektedir. İnternet'teki verinin çeşitliliği düşünüldüğünde bu işin konudan bağımsız, otomatik olarak gerçekleştirilmesi zordur. Bu çalışmada doğruluk problemi üzerine geliştirilen algoritmaların sınanabilmesi için internetteki yapısal olmayan verilerin yapısal bir veri kümesine dönüştürülmesinde gerekli aşamalar belirlenip otomatize edilmesine katkı sağlanmıştır. Bu aşamalar kullanılarak örnek bir özdeyiş veri kümesi oluşturulmuş ve belirlenen bir doğruluk sınama algoritması bu veri kümesinde uygulanarak elde edilen sonuçclar yorumlanmıştır.
Description
12th Turkish National Software Engineering Symposium, UYMS 2018; Istanbul; Turkey; 10 September 2018 through 12 September 2018
ORCID
Keywords
Dataset, Veracity problem, WEB
Turkish CoHE Thesis Center URL
Fields of Science
Citation
Karabayır, A. K., Tek, O. O., Çınar, Ö. F. and Tekir, S. (2018, September 10-12). Doğruluk problemi için veri kümesi hazırlanması. In A. Tarhan and Murat E. (Eds.), Paper presented at 12th Turkish National Software Engineering Symposium, UYMS 2018; Istanbul; Turkey.
WoS Q
N/A
Scopus Q
Q4
Source
12th Turkish National Software Engineering Symposium, UYMS 2018
Volume
2201
