Mejora de las búsquedas en CMS donde predomina el contenido no estructurado
Material type:
Item type | Home library | Collection | Call number | URL | Status | Date due | Barcode | |
---|---|---|---|---|---|---|---|---|
![]() |
Biblioteca de la Facultad de Informática | TES 17/13 (Browse shelf(Opens below)) | Available | DIF-04611 | ||||
![]() |
Biblioteca de la Facultad de Informática | Biblioteca digital | Link to resource | No corresponde | ||||
![]() |
Biblioteca de la Facultad de Informática | Biblioteca digital | Link to resource | No corresponde |
Tesina (Licenciatura en Sistemas, Licenciatura en Informática) - Universidad Nacional de La Plata. Facultad de Informática, 2017.
-- ABSTRACT -- 1. INTRODUCCIÓN -- 1.1. El inicio de la "web" -- 1.2. Web 1.0 -- 1.2.1. Estadísticas sobre la cantidad de sitios -- 1.2.2. Evolución de los buscadores en internet -- 1.3. Web 2.0 -- 1.3.1. La web como contenedor de conocimiento -- 1.3.2. Motivaciones de la web semántica y la web 3.0 -- 2. ARQUITECTURA DE INFORMACIÓN -- 2.1. Arquitectura de información -- 2.2. Lenguaje -- 2.3. Pensando los sistemas -- 2.4. Definiendo una arquitectura de información -- 2.5 Diseñando para encontrar -- 3. BÚSQUEDAS -- 3.1 Búsquedas en la web -- 3.2. Funcionamiento y etapas de un motor de búsqueda .. -- 3.2.1 Breve introducción -- 3.3 Descomponiendo un motor de búsqueda -- 3.3.1 Obtener el texto -- 3.3.2 Transformación del texto -- 3.3.3 Extracción de información -- 3.3.4. Creación del índice -- 3.3.5. Interacción de usuarios -- 3.3.6. Ranking -- 3.4. Anatomía de las búsquedas -- 3.4.1. Análisis de documentos y conectividad semántica -- 4. DEFINIENDO LA INFORMACIÓN SOBRE LA INFORMACIÓN -- 4.1. Metadatos -- 4.2. Dublin Core -- 4.2.1 Elementos del Dublin Core -- 4.3. Schema.org -- 4.3.1. Esquemas y herencia de atributos -- 4.3.2. Contenido explícitamente vinculado -- 4.3.3. Visión de Google con el esquema de datos estructurados de Schema.org -- 4.4 Vocabulario controlado -- 4.4.1 Lista -- 4.4.2 Anillo de sinónimos -- 4.4.3 Taxonomía -- 4.5 Tesauro -- 4.5.1 Funciones del tesauro -- 4.5.2. Objetivos del tesauro -- 4.5.3 Tipos de tesauros -- 4.5.4. Estándares y normas -- 4.6 Ontologías -- 4.7 SKOS -- 4.8. Tesauros al ataque -- 4.8.1 Tesauros en línea -- 4.8.2 Generales, multidisciplinarios -- 4.8.3. Agrociencias -- 5. ENRIQUECIMIENTO SEMÁNTICO Y CONTENIDO INTELIGENTE -- 5.1 ¿Quién (o qué) hace el "semantic tagging"? -- 5.1.1 Etiquetado manual y etiquetado automático -- 5.1.2. Sistemas de organización de conocimiento -- 5.1.3. Ventajas del enriquecimiento semántico -- 6. HACIA LA GESTIÓN DEL CONOCIMIENTO -- 6.1 Introducción -- 6.2. El contexto INTA -- 6.3. Propuesta -- 6.3.1 Descripción del proceso -- 6.3.2. Búsqueda interna y externa -- 6.4. Búsquedas Internas -- 6.4.1 Extracción de tópicos del documento en el INTA -- 6.4.2 KEA -- 6.4.3. NER Reconocimiento de entidades nombradas -- 6.4.4. Motor de indexación distribuido: SOLR -- 6.5. Búsqueda externa -- 6.5.1 Introducción -- 6.5.2. Aplicación en Drupal -- 6.5.3. Aplicación Dublin Core -- 6.6 Módulo de conexión con los web services de KEA, NER y OpenNLP y etiquetado -- automático -- 6.6.1. Introducción -- 6.6.2. Módulos KEA Client, NER Client y OpenNLP Client -- 6.6.3. Módulo Entity AutoTagger -- 6.6.4. Evaluación de los resultados obtenidos por el servicio de KEA -- 6.6.5. Evaluación y comparación de los resultados obtenidos para Stanford NER y -- OpenNLP -- 6.6.6 Tarea de reconocimiento de palabras claves y entidades en adjuntos -- 7. CONCLUSIONES -- Bibliografía