Integración de métodos de descubrimiento de conocimiento embebido en fuentes de información desestructuradas

Rodríguez, J. M.

Integración de métodos de descubrimiento de conocimiento embebido en fuentes de información desestructuradas - 2023 - 1 archivo (1,1 MB) : il. col.

Tesis (Doctorado en Ciencias Informáticas) - Universidad Nacional de La Plata. Facultad de Informática, 2023.

1 Objetivos -- 1.1 Objetivo primario -- 1.2 Objetivos secundarios -- 2 Introducción -- 2.1 Extracción de conocimiento -- 2.1.1 Surgimiento de la extracción de conocimiento -- 2.1.2 Extracción de relaciones semánticas -- 2.1.2.1 Métodos basados en conocimiento -- 2.1.2.2 Métodos supervisados -- 2.1.2.3 Métodos auto-supervisados -- 2.1.3 Métodos de extracción de conocimiento para la Web (OIE) -- 3. Revisión sistemática de literatura -- 3.1 Revisión de la evolución de los métodos de extracción de conocimiento para la Web (2015) -- 3.2 Estudio de mapeo sistemático sobre métodos extracción de conocimiento para la Web (2018) -- 3.2.1 Revisión de los métodos de Open IE relevados por Glauber y Barreiro Claro -- 3.3 Revisión sistemática de literatura: nuevos métodos de Open IE (2021) -- 3.3.1 Revisión de los métodos de Open IE publicados a partir de 2018 -- 3.4 Revisión de los métodos de Open IE, en idioma español -- 4. Conjunto de pruebas -- 4.1 Extracción manual de relaciones semánticas -- 4.2 Evaluación de las extracciones automáticas -- 4.2.1 Consideraciones sobre ClausIE -- 4.2.2 Consideraciones sobre MinIE -- 4.3 Resultados obtenidos -- 4.3.1 Consideraciones sobre los conjuntos de datos de entrada -- 4.4 ClausIE mejorado: identificador de oraciones -- 4.4.1 Nuevos resultados para ClausIE -- 5. Problemas abiertos -- 5.1 Precisión y exhaustividad -- 5.2 Relaciones semánticas poco informativas -- 5.3 Manejo de información subjetiva -- 5.4 Autonomía de los métodos -- 5.5 Métodos en lenguaje español -- 6. Soluciones propuestas -- 6.1 TP-OIE (Tree Pattern Open Information Extraction) -- 6.1.1 Proceso de aprendizaje -- 6.1.2 Conjunto de entrenamiento -- 6.1.3 Proceso de extracción -- 6.1.4 Problemas encontrados con este enfoque -- 6.2 ATP-OIE (Autonomous Tree Pattern Open Information Extraction) -- 6.2.1 Precisión y exhaustividad -- 6.2.1.1 Puntaje de las extracciones realizadas -- 6.2.1.2 Utilización de métodos auxiliares -- 6.2.1.3 Aprendizaje en línea -- 6.2.2 Extracciones poco informativas -- 6.2.3 Manejo de información subjetiva -- 6.2.4 Resultados de ATP-OIE -- 6.3 TP-OIE-ES (Tree Pattern Open Information Extraction Español) -- 6.3.1 Precisión y exhaustividad -- 6.3.2 Relaciones semánticas poco informativas -- 6.3.3 Manejo de información subjetiva -- 6.3.4 Resultados de TP-OIE-ES -- 6.4 ECMes (Extractor de Conocimiento Mejorado en Español) -- 6.4.1 Puntos de mejora sobre TP-OIE-ES -- 6.4.1.1 Mejorar la precisión -- 6.4.1.2 Mejorar la evidencia disponible -- 6.4.1.3 Mejorar las relaciones poco informativas -- 6.4.2 Evaluación y resultados de ECMes -- 7. Aportes y Conclusiones -- 7.1 Objetivo principal: creación de métodos de Open IE para idioma español -- 7.2 Objetivo secundario: creación de un marco de referencia para la evaluación de los métodos de Open IE -- 7.3 Objetivo secundario: creación de un método de Open IE novedoso -- 7.4 Aporte adicional: Mejoras en métodos existentes -- 8. Futuras líneas de investigación -- Referencias

DIF-M8676


ALGORITMOS

extracción de conocimiento