Estudio comparativo entre Apache Spark y Apache Flink en el procesamiento de streaming en entornos Big Data (Record no. 57726)
[ view plain ]
000 -CABECERA | |
---|---|
campo de control de longitud fija | 04496nam a2200241 a 4500 |
003 - IDENTIFICADOR DEL NÚMERO DE CONTROL | |
campo de control | AR-LpUFIB |
005 - FECHA Y HORA DE LA ÚLTIMA TRANSACCIÓN | |
campo de control | 20250311170524.0 |
008 - DATOS DE LONGITUD FIJA--INFORMACIÓN GENERAL | |
campo de control de longitud fija | 230201s2022 ag a om 000 0 spa d |
024 8# - Otro identificador estandar | |
Número estándar o código | DIF-M8681 |
-- | 8907 |
-- | DIF007953 |
040 ## - FUENTE DE LA CATALOGACIÓN | |
Centro catalogador/agencia de origen | AR-LpUFIB |
Lengua de catalogación | spa |
Centro/agencia transcriptor | AR-LpUFIB |
100 1# - ENTRADA PRINCIPAL--NOMBRE DE PERSONA | |
Nombre de persona | Fajardo, Hugo Manuel |
245 10 - MENCIÓN DE TÍTULO | |
Título | Estudio comparativo entre Apache Spark y Apache Flink en el procesamiento de streaming en entornos Big Data |
260 ## - PUBLICACIÓN, DISTRIBUCIÓN, ETC. | |
Fecha de publicación, distribución, etc. | 2022 |
300 ## - DESCRIPCIÓN FÍSICA | |
Extensión | 1 archivo (2,6 MB) : |
Otras características físicas | il. col. |
502 ## - NOTA DE TESIS | |
Nota de tesis | Trabajo Final Integrador (Especialización en Inteligencia de Datos Orientada a Big Data) - Universidad Nacional de La Plata. Facultad de Informática, 2022. |
505 0# - NOTA DE CONTENIDO CON FORMATO | |
Nota de contenido con formato | 1. Introducción -- 1.1. Motivación -- 1.1.1. Ventajas del procesamiento de streaming -- 1.1.2. Herramientas de Procesamiento de Streaming -- 1.2. Objetivos y Metodología -- 2. Fundamentos del Procesamiento de Streaming -- 2.1. Datos de streaming -- 2.2. Procesamiento por lotes y procesamiento de streaming -- 2.3. Procesamiento distribuido de streaming -- 2.4. Modelo de Procesamiento de Streaming -- 2.5. Procesamiento continuo vs. procesamiento en microlotes -- 2.6. Tiempo de evento y tiempo de procesamiento -- 2.7. Procesamiento de eventos con marcas de agua -- 2.8. Manipulación de Datos -- 2.8.1. Transformaciones -- 2.8.2. Agregaciones -- 2.9. Streaming sin estado y streaming con estado -- 3. Apache Spark -- 3.1. Introducción -- 3.2. Arquitectura de Spark -- 3.3. Despliegue de Spark -- 3.4. Api de Lenguajes de Spark -- 3.5. Abstracciones de Datos -- 3.5.1. DataFrames -- 3.5.2. SQL -- 3.5.3. Datasets -- 3.5.4. RDDs -- 3.6. Operaciones sobre los Datos -- 3.6.1. Transformaciones -- 3.6.2. Acciones -- 3.7. Spark en Funcionamiento -- 3.7.1. El DAGScheduler en detalle -- 3.8. Procesamiento de Streaming en Spark -- 3.8.1. Gestión de datos en Memoria -- 3.8.2. Transformaciones y Agregaciones -- 3.8.3. Semántica de Entrega de Datos -- 3.8.4. Fuentes de Datos -- 3.8.5. Sumideros de datos -- 3.8.6. Procesamiento sin estado y con estado -- 4. Apache Flink -- 4.1. Introducción -- 4.1.1. Escalabilidad -- 4.1.2. Procesamiento en memoria -- 4.2. Arquitectura de Flink -- 4.3. Despliegue de Flink -- 4.4. Api de Lenguajes de Flink -- 4.5. Niveles de Abstracción en Flink -- 4.5.1. SQL -- 4.5.2. Table Api -- 4.5.3. DataStream / DataSet Api -- 4.5.4. Stateful Stream Processing -- 4.6. Funcionamiento de Flink -- 4.7. Procesamiento de Streaming en Flink -- 4.7.1. Esencia del procesamiento de streaming -- 4.7.2. Procesamiento paralelo -- 4.7.3. Procesamiento con estado -- 4.7.4. Tolerancia a Fallas -- 4.7.5. Semántica de procesamiento -- 4.7.6. Ventanas en Flink -- 4.7.7. Funciones de Ventana -- 4.7.8. Fuentes de datos y sumideros -- 5. Trabajo Experimental -- 5.1. Descripción del Trabajo Experimental -- 5.2. Hardware Utilizado -- 5.3. Software Utilizado -- 5.4. Origen de Datos -- 5.4.1. Análisis del Origen de Datos -- 5.5. Pipelines de Procesamiento -- 5.5.1. Pipeline de Ingesta de Datos -- 5.5.2. Pipelines de Procesamiento -- 5.6. Código Fuente de Pipelines de Procesamiento -- 5.7. Herramientas de Monitorio y Medición -- 6. Evaluación Comparativa -- 6.1. Facilidad de Instalación y Despliegue -- 6.2. Fuentes de Datos Admitidas -- 6.3. Lenguajes de Programación soportados -- 6.4. Documentación Disponible -- 6.5. Evaluación de Rendimiento -- 6.5.1. Consideraciones Generales de la Evaluación de Rendimiento -- 6.5.2. Uso de CPU -- 6.5.3. Uso de Memoria -- 6.5.4. Cantidad de Hilos de Ejecución -- 6.5.5. Cantidad de Clases Cargada -- 6.5.6. Latencia -- 6.5.7. Duración Total del Ciclo de Procesamiento -- 6.6. Resumen de la Evaluación -- 7. Conclusiones y Trabajos Futuros -- 7.1. Facilidad de Instalación y Despliegue -- 7.2. Fuentes de Datos Admitidas para el Intercambio de Datos -- 7.3. Lenguajes de Programación Soportados -- 7.4. Documentación Disponible -- 7.5. Evaluación de Rendimiento -- 7.5.1. Uso de CPU -- 7.5.2. Uso de Memoria -- 7.5.3. Cantidad de Hilos de Ejecución Utilizados -- 7.5.4. Cantidad de Clases Cargadas -- 7.5.5. Latencia -- 7.5.6. Duración Total del Ciclo de Procesamiento -- 7.6. Consideraciones Finales -- 7.7. Trabajos Futuros -- 8. Bibliografía |
650 #4 - PUNTO DE ACCESO ADICIONAL DE MATERIA--TÉRMINO DE MATERIA | |
Término de materia o nombre geográfico como elemento de entrada | FLUJO DE DATOS |
650 #4 - PUNTO DE ACCESO ADICIONAL DE MATERIA--TÉRMINO DE MATERIA | |
Término de materia o nombre geográfico como elemento de entrada | PROCESAMIENTO DISTRIBUIDO |
653 ## - TÉRMINO DE INDIZACIÓN--NO CONTROLADO | |
Término no controlado | streaming de datos |
700 1# - PUNTO DE ACCESO ADICIONAL--NOMBRE DE PERSONA | |
Nombre de persona | Hasperué, Waldo , |
-- | Director/a |
856 40 - LOCALIZACIÓN Y ACCESO ELECTRÓNICOS | |
Identificador Uniforme del Recurso | <a href=" http://catalogo.info.unlp.edu.ar/meran/getDocument.pl?id=2591"> http://catalogo.info.unlp.edu.ar/meran/getDocument.pl?id=2591</a> |
942 ## - ELEMENTOS DE PUNTO DE ACCESO ADICIONAL (KOHA) | |
Tipo de ítem Koha | Tesis de posgrado |
Estado de retiro | Estado de pérdida | Estado dañado | Disponibilidad | Biblioteca permanente | Biblioteca actual | Fecha de adquisición | Número de inventario | Total de préstamos | Signatura topográfica completa | Código de barras | Fecha visto por última vez | Precio válido a partir de | Tipo de ítem Koha | Colección | Identificador Uniforme del Recurso |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Préstamo a domicilio | Biblioteca de la Facultad de Informática | Biblioteca de la Facultad de Informática | 11/03/2025 | DIF-05248 | TES 22/47 | DIF-05248 | 11/03/2025 | 11/03/2025 | Tesis de posgrado | ||||||
Recurso en Línea | Biblioteca de la Facultad de Informática | Biblioteca de la Facultad de Informática | 11/03/2025 | 11/03/2025 | 11/03/2025 | Tesis de posgrado | Biblioteca digital | http://sedici.unlp.edu.ar/handle/10915/155135 | |||||||
Recurso en Línea | Biblioteca de la Facultad de Informática | Biblioteca de la Facultad de Informática | 11/03/2025 | 11/03/2025 | 11/03/2025 | Tesis de posgrado | Biblioteca digital | http://catalogo.info.unlp.edu.ar/meran/getDocument.pl?id=2591 |