PUBLICACIONES
Developing metrics to estimate the information quality of Wikipedia articles is an interesting and important research area. In this article, we propose, and analyze the feasibility, of a new quality metric based on the "external factual support" of an article. The rationale behind this metric is identified, a formal definition of the metric is presented and some implementation aspects are introduced. Preliminary results show the feasibility of our proposal and its potential to discriminate high quality versus low quality Wikipedia's articles.
"On the Feasibility of External Factual Support as Wikipedia’s Quality Metric". Carlos Velázquez, Leticia Cagnina, Marcelo Errecalde. Publicado en la revista digital SEPLN, volúmen 58, año 2017, páginas desde la 97 a la 100. Año: 2017.
On the Feasibility of External Factual Support as Wikipedia’s Quality Metric
BibTex
Publicación en SEPLN
Developing metrics to estimate the information quality of Wikipedia articles is an interesting and important research area. In this article, we review some of the main aspects to be considered when using quality metrics for Wikipedia and propose a new quality metric based on the "external support" of an article. The rationale behind this metric is identied, a denition of the metric is presented and some implementation aspects are described. Preliminary results show the feasibility of our proposal and its potential to discriminate high quality versus low quality Wikipedia's articles.
"On the Use of Wikipedia's Quality Metrics". Carlos G. Velázquez, Leticia C. Cagnina, Marcelo L. Errecalde. WOPATEC (Workshop de Procesamiento Automatizado de Textos y Corpus). Llevado a cabo en la Universidad Católica de Valparaíso, Viña del Mar, Chile. Año: 2016.
On the Use of Wikipedia's Quality Metrics
BibTex
WOPATEC - Sitio Web
WOPATEC - Afiche
WOPATEC - Presentación Power Point
WOPATEC - Foto Presentación 1
WOPATEC - Foto Presentación 2
WOPATEC - Foto Presentación 3
WOPATEC - Foto Presentación 4
WOPATEC - Foto Presentación 5
WOPATEC - Foto Presentación 6
WOPATEC - Foto Presentación 7
WOPATEC - Foto Presentación 8
WOPATEC - Foto Presentación 9
WOPATEC - Foto Presentación 10
WOPATEC - Foto Presentación 11
WOPATEC - Todas las Fotos del Workshop
Este artículo describe, brevemente, las tareas de investigación y desarrollo que se están llevando a cabo en la línea de investigación "Minería de Textos y de la Web" en el marco del proyecto "Aprendizaje automático y toma de decisiones en sistemas inteligentes para la Web". La línea aborda diversas áreas vinculadas a la ingeniería del lenguaje natural, como por ejemplo el Procesamiento del Lenguaje Natural (PLN), la Lingüística Computacional, la Minería de Textos, la Minería de la Web y la recuperación de información de la Web. En el contexto de este proyecto por lo tanto, esta línea se centra en todos los problemas vinculados con el desarrollo de herramientas inteligentes para la extracción, análisis y validación de contenido Web, que incluyen: representación de documentos y usuarios de la Web, medidas de calidad de información para el contenido Web, técnicas abiertas de extracción de información para la Web, algoritmos de categorización supervisados, semi-supervisados y no supervisados y caracterización de usuarios, entre otros.
"Minería de Textos y de la Web". Leticia Cagnina, Edgardo Ferretti, M. Paula Villegas, M. José, Garciarena Sergio Burdisso, Darío Funez, Carlos Velázquez, Marcelo Errecalde. WICC (Workshop de Investigadores en Ciencias de la Computación). Llevado a cabo en la Universidad Nacional de Entre Ríos, Entre Ríos, Argentina. Año: 2013.
Minería de Textos y de la Web
BibTex
WICC - Sitio Web
WICC - Afiche
Clustering of short texts is an important research area because of its applicability in information retrieval and text mining. To this end was proposed CLUDIPSO, a discrete Particle Swarm Optimization algorithm to cluster short texts. Initial results showed that CLUDIPSO has performed well in small collections of short texts. However, later works showed some drawbacks when dealing with larger collections. In this paper we present a hybridization of CLUDIPSO to overcome these drawbacks, by providing information in the initial cycles of the algorithm to avoid a random search and thus speed up the convergence process. This is achieved by using a pre-clustering obtained with the Expectation-Maximization method which is included in the initial population of the algorithm. The results obtained with the hybrid version show a significant improvement over those obtained with the original version.
"A PSO-based Clustering Approach Assisted by Initial Clustering Information". Carlos Velázquez, Leticia Cagnina, Marcelo Errecalde. CACIC (Congreso Argentino de Ciencias de la Computación). Llevado a cabo en la UNS (Universidad Nacional del Sur), Bahía Blanca, Buenos Aires, Argentina. Expositor. Exposición premiada. Año: 2012.
Presentado también por Marcelo Errecalde en Graz, Austria, 2014.
A PSO-based Clustering Approach Assisted by Initial Clustering Information
BibTex
CACIC - Sitio Web
CACIC - Afiche
CACIC - Presentación Power Point
CACIC - Foto Presentación 1
CACIC - Foto Presentación 2
CACIC - Foto Presentación 3
En este artículo se describen, en forma resumida, los trabajos de investigación y desarrollo que se están llevando a cabo en la línea de investigación "Sistemas Inteligentes" en las áreas de Text Mining, Web Mining y Web Intelligence, y que abordan principalmente tareas como: clustering de textos cortos multiligües, categorización semántica de textos, medidas de calidad de la información en la Web, detección de plagio y atribución de autoría, minería de opinión y sentimientos, integración de agentes y técnicas de minería de textos, y uso de arquitecturas cognitivas para agentes web; en especial aquellas basadas en lógica, razonamiento argumentativo y teoría de decisión cualitativa. En particular, pondremos especial énfasis en aquellas problemáticas que se están comenzando a investigar en forma conjunta con investigadores de Alemania, Austria, Españna y Grecia en el contexto de un proyecto FP7, recientemente aprobado en la Unión Europea.
"Sistemas Inteligentes para la Evaluación de la Calidad de la Información en la Web". Marcelo Errecalde, Edgardo Ferretti, Diego Ingaramo, María Rosas, Leticia Cagnina, Dario Funez, Patricia Roggero, Carlos Velázquez. WICC (Workshop de Investigadores en Ciencias de la Computación). Llevado a cabo en la UNM (Universidad Nacional de Misiones), Misiones, Argentina. Año: 2012.
Sistemas Inteligentes para la Evaluación de la Calidad de la Información en la Web
BibTex
WICC - Sitio Web