Developing metrics to estimate the information quality of Wikipedia articles is an interesting and important research area. In this article, we propose, and analyze the feasibility, of a new quality metric based on the "external factual support" of an article. The rationale behind this metric is identified, a formal definition of the metric is presented and some implementation aspects are introduced. Preliminary results show the feasibility of our proposal and its potential to discriminate high quality versus low quality Wikipedia's articles.
"On the Feasibility of External Factual Support as Wikipedia’s Quality Metric". Carlos Velázquez, Leticia Cagnina, Marcelo Errecalde. Published in the digital magazine SEPLN, volume 58, year 2017, pages from 97 to 100. Year: 2017.
On the Feasibility of External Factual Support as Wikipedia’s Quality Metric
Publication at SEPLN
"On the Use of Wikipedia's Quality Metrics". Carlos G. Velázquez, Leticia C. Cagnina, Marcelo L. Errecalde. WOPATEC (Workshop of Automated Processing of Texts and Corpus). Conducted at the Universidad Católica de Valparaíso, Viña del Mar, Chile. Year: 2016.
On the Use of Wikipedia's Quality Metrics
Este artículo describe, brevemente, las tareas de investigación y desarrollo que se están llevando a cabo en la línea de investigación "Minería de Textos y de la Web" en el marco del proyecto "Aprendizaje automático y toma de decisiones en sistemas inteligentes para la Web". La línea aborda diversas áreas vinculadas a la ingeniería del lenguaje natural, como por ejemplo el Procesamiento del Lenguaje Natural (PLN), la Lingüística Computacional, la Minería de Textos, la Minería de la Web y la recuperación de información de la Web. En el contexto de este proyecto por lo tanto, esta línea se centra en todos los problemas vinculados con el desarrollo de herramientas inteligentes para la extracción, análisis y validación de contenido Web, que incluyen: representación de documentos y usuarios de la Web, medidas de calidad de información para el contenido Web, técnicas abiertas de extracción de información para la Web, algoritmos de categorización supervisados, semi-supervisados y no supervisados y caracterización de usuarios, entre otros.
"Minería de Textos y de la Web". Leticia Cagnina, Edgardo Ferretti, M. Paula Villegas, M. José, Garciarena Sergio Burdisso, Darío Funez, Carlos Velázquez, Marcelo Errecalde. WICC (Workshop of Researchers in Computer Science). Conducted at the Universidad Nacional de Entre Ríos, Entre Ríos, Argentina. Year: 2013.
Minería de Textos y de la Web
Clustering of short texts is an important research area because of its applicability in information retrieval and text mining. To this end was proposed CLUDIPSO, a discrete Particle Swarm Optimization algorithm to cluster short texts. Initial results showed that CLUDIPSO has performed well in small collections of short texts. However, later works showed some drawbacks when dealing with larger collections. In this paper we present a hybridization of CLUDIPSO to overcome these drawbacks, by providing information in the initial cycles of the algorithm to avoid a random search and thus speed up the convergence process. This is achieved by using a pre-clustering obtained with the Expectation-Maximization method which is included in the initial population of the algorithm. The results obtained with the hybrid version show a significant improvement over those obtained with the original version.
"A PSO-based Clustering Approach Assisted by Initial Clustering Information". Carlos Velázquez, Leticia Cagnina, Marcelo Errecalde. CACIC (Argentine Congress of Computer Science). Conducted at the UNS (Universidad Nacional del Sur), Bahía Blanca, Buenos Aires, Argentina. Exhibitor. Award-winning exhibition. Year: 2012. Presented also by Marcelo Errecalde in Graz, Austria, 2014.
A PSO-based Clustering Approach Assisted by Initial Clustering Information
En este artículo se describen, en forma resumida, los trabajos de investigación y desarrollo que se están llevando a cabo en la línea de investigación "Sistemas Inteligentes" en las áreas de Text Mining, Web Mining y Web Intelligence, y que abordan principalmente tareas como: clustering de textos cortos multiligües, categorización semántica de textos, medidas de calidad de la información en la Web, detección de plagio y atribución de autoría, minería de opinión y sentimientos, integración de agentes y técnicas de minería de textos, y uso de arquitecturas cognitivas para agentes web; en especial aquellas basadas en lógica, razonamiento argumentativo y teoría de decisión cualitativa. En particular, pondremos especial énfasis en aquellas problemáticas que se están comenzando a investigar en forma conjunta con investigadores de Alemania, Austria, Españna y Grecia en el contexto de un proyecto FP7, recientemente aprobado en la Unión Europea.
"Sistemas Inteligentes para la Evaluación de la Calidad de la Información en la Web". Marcelo Errecalde, Edgardo Ferretti, Diego Ingaramo, María Rosas, Leticia Cagnina, Dario Funez, Patricia Roggero, Carlos Velázquez. WICC (Workshop of Researchers in Computer Science). Conducted at the UNM (Universidad Nacional de Misiones), Misiones, Argentina. Year: 2012.
Sistemas Inteligentes para la Evaluación de la Calidad de la Información en la Web
