1.5. Desafos Del Big Data

  • Published on
    10-Jul-2016

  • View
    3

  • Download
    0

Transcript

  • ndice Qu es el Big Data?

    Datificacin

    El valor de los datos

    Ejemplos de Big Data y Casos de xito

    Desafos del Big Data

  • Claves del Big Data

    1. Integracin Una nica plataforma para manejar los datos

    2. Anlisis Preprocesamiento de datos + anlisis estadstico

    3. Visualizacin Cmo mostrar los datos a todo tipo de usuarios

    4. Desarrollo Necesidad de herramientas sofisticadas

    5. Seguridad y gobernacin Polticas de privacidad de datos

  • Inteligencia?

    Qu hace inteligente a un sistema de Big Data?

    Anlisis Manejar grandes cantidades de datos, no slo los

    directamente relacionados con el problema, sino tambin cualquier

    otra dato que pueda influir en la decisin

    Instrumentacin Para recoger los datos debe existir un conjunto

    de instrumentos capaces de medir la informacin deseada

    Interconexin Debe existir una infraestructura preparada para

    recibir y almacenar cualquier tipo de datos recogido y procesarlos

    de manera eficiente

  • Data governance

    Podemos confiar en la(s) fuente(s) proveedora(s) de datos?

    Las empresas deben asegurar la confianza de sus fuentes de

    datos y protegerlas

    Debe existir una gobernacin de los datos durante el ciclo de

    vida de la informacin

    El data governance debe estar integrado en la plataforma de

    manejo de los datos

  • Beneficios y riesgos Big Data no es la solucin a todos los problemas.

    Las predicciones realizadas no son siempre correctas. Riesgo de caer en la dictadura de los datos

    No mirar nada ms all de la informacin que nos den los datos

    Perdemos privacidad?

    Sabemos los usos secundarios que le pueden dar a nuestro datos que los damos para otro fin primario distinto de su futuro uso?

    Puede una compaa de seguros mirar nuestros datos para saber si somos asegurables?

    Minority Report?

    Ser necesaria una legislacin sobre el uso de los datos y el derecho al olvido

  • Herramientas Big Data

    Plataformas Big Data:

    Hadoop

    HortonWorks

    Cloudera

    Data Warehouse:

    InfiniDB

    Oracle

    Minera de Datos:

    Weka

    Rapidminer

  • Herramientas Big Data (II) Bases de datos NoSQL:

    MongoDB,

    Cassandra,

    Redis, etc.

    Lenguajes de programacin

    CUDA

    OpenGL

    Generadores de anlisis estadsticos:

    SPSS,

    R,

    Talend Open Studio,

    Skytree server, etc.

  • Herramientas Big Data (III)

    Preprocesamiento de datos

    Expresso

    Curl

    Spark MLP