CLUSTER PARA APRENDIZAJE Y PRÁCTICA DE BIGDATA Y SERVICIOS DE LEARNING ANALYTICS Analia N. Herrera Cognetta, Nilda M. Pérez Otero, Francisco N. Colarich, Gustavo D. Castillo, Dalila J. Mamani, Mauro R. Patagua, Natalia E. Rodriguez, Roque E. Talavera y Diego M. Verrastro Facultad de Ingeniería – Universidad Nacional de Jujuy – Argentina {aniherrera012, nilperez, fcolarich, castilloguty, daly.jaquelin, mpatagua, nataliarod314, ema.tala015} @gmail.com, diegoxtr@hotmail.com RESUMEN Big Data es la nueva generación de almacenamiento, análisis de datos y de negocios. En el fenómeno del Big Data se considera, como fuentes de generación de datos a personas, smartphones, equipos que generan data de proyectos y experimentos, y, principalmente, a Internet. La tecnología Big Data permite recolectar, almacenar y preparar grandes volúmenes de datos, para analizar o visualizar la relación entre ellos, inclusive a partir de datos que se generan en tiempo real y provienen de redes sociales, sensores, dispositivos de diversa índole o fuentes de audio y video. En esta temática, el presente proyecto pretende, en una primera etapa, investigar tecnologías y arquitecturas para implementar un clúster en una plataforma web, donde estudiantes de la Facultad de Ingeniería de la UNJu, puedan aprender y practicar Big Data; en una segunda etapa se comenzará con una investigación en Analítica de Datos para evolucionar a Learning Analytics, utilizando algoritmos para medición, recopilación, análisis e informe de datos, sobre estudiantes universitarios y sus contextos, a fin de comprender y optimizar el aprendizaje y entornos en que se produce. Palabras clave: Arquitectura escalable, Big Data, Plataforma web, Análisis predictivo de datos, Analítica de aprendizaje, Learning Analytics. CONTEXTO La línea de investigación aquí presentada se encuentra inserta en el proyecto Cluster para aprendizaje y práctica de Big Data y servicios de Learning Analytics, ejecutado a partir de enero del corriente año por el grupo de la Facultad de Ingeniería de la Universidad Nacional de Jujuy. El proyecto, acreditado y financiado por la Secretaria de Ciencia y Técnica y Estudios Regionales de la Universidad Nacional de Jujuy, se encuentra bajo el Programa de Incentivos. 1. INTRODUCCIÓN El Big Data es un concepto que hace referencia al tratamiento y análisis de enormes repositorios de datos, tan grandes, que resulta muy difícil y hasta imposible manejarlos con las herramientas de bases de datos y analíticas convencionales [1]. Esta tecnología se ocupa de las actividades relacionadas con los sistemas que manipulan grandes conjuntos de datos. Las dificultades vinculadas a la gestión de datos se centran en la recolección, almacenamiento, búsqueda, compartición, análisis y visualización de la información. El principal objetivo de manipular enormes cantidades de datos es, poder emplear dicha información en la creación de informes estadísticos y modelos predictivos, que pueden ser utilizados en muchas áreas del quehacer humano [2]. En el ámbito educativo, esta tecnología ha comenzado a brindar grandes beneficios. Por ejemplo, en la mejora de la gestión educativa, al desarrollo de nuevos métodos para la enseñanza y el aprendizaje, la creación de nuevas carreras y opciones profesionales, así como en la generación y almacenamiento de acervos digitales, que constituyen el producto de años de actividad académica, docente y de investigación. 252 brought to you by CORE View metadata, citation and similar papers at core.ac.uk provided by Servicio de Difusión de la Creación Intelectual