Normal view MARC view ISBD view

D3CAS: un algoritmo de clustering para el procesamiento de flujos de datos en spark

By:

Molina, Roberto Pedro

Contributor(s):

Hasperué, Waldo

Material type: Article

ArticleDescription: 1 archivo (669,9 kB)Subject(s):

Summary: En este trabajo se presenta una prueba de concepto de un algoritmo de clustering basado en densidad, denominado D3CAS, el cual fue implementado para ser ejecutado bajo el framework Spark Streaming y que permite el procesamiento de flujos de datos. La principal característica del algoritmo presentado es que es dinámico, es decir selecciona automáticamente el número de clusters del flujo de datos. El algoritmo fue probado datasets de CLUTO, midiendo la calidad de los clusters obtenidos. Los resultados, obtenidos en un ambiente virtualizado, fueron comparados con otro algoritmo de clustering (CluStream), demostrando que D3CAS arroja mejores resultados.

Average rating: 0.0 (0 votes)

Holdings ( 1 )
Title notes ( 3 )

Holdings
Item type	Home library	Collection	Call number	URL	Status	Date due	Barcode
Capítulo de libro	Biblioteca de la Facultad de Informática	Biblioteca digital	A1089 (Browse shelf(Opens below))	Link to resource	Recurso en Línea

Browsing Biblioteca de la Facultad de Informática shelves, Collection: Biblioteca digital Close shelf browser (Hides shelf browser)

Previous								Next
Previous	A1086 Desarrollo de personajes virtuales : estrategias y desafíos para la construcción del aula virtual	A1087 Comparison of services for the recognition of flora images : uses in augmented reality and tourism	A1088 Desarrollo multiplataforma de aplicaciones móviles combinadas con el uso de beacons	A1089 D3CAS: un algoritmo de clustering para el procesamiento de flujos de datos en spark	A1090 Diseño, desarrollo, publicación y evaluación de objetos de aprendizaje : un estudio de casos	A1091 Análisis de rendimiento de protocolos de publicación/suscripción en comunicación con una red de sensores inalámbricos Zigbee	A1092 Gestor de contenidos orientado a portales de organismos gubernamentales	Next

Formato de archivo PDF. -- Este documento es producción intelectual de la Facultad de Informática - UNLP (Colección BIPA/Biblioteca)

En este trabajo se presenta una prueba de concepto de un algoritmo de clustering basado en densidad, denominado D3CAS, el cual fue implementado para ser ejecutado bajo el framework Spark Streaming y que permite el procesamiento de flujos de datos. La principal característica del algoritmo presentado es que es dinámico, es decir selecciona automáticamente el número de clusters del flujo de datos. El algoritmo fue probado datasets de CLUTO, midiendo la calidad de los clusters obtenidos. Los resultados, obtenidos en un ambiente virtualizado, fueron comparados con otro algoritmo de clustering (CluStream), demostrando que D3CAS arroja mejores resultados.

Congreso Argentino de Ciencias de la Computación (24to : 2018 : Tandil, Argentina)