El big data y la ingeniería de datos

¿Que qué es la ingeniería de datos?
Bueno, pues para resumirlo diría que es una ciencia que descubre, estudia y analiza datos generados por personas, máquinas o “cosas” para sacar un resultado o una información final. Este resultado puede ser un perfil completo de una persona, o sea conocer TODO sobre una persona.

Conocer incluso más de lo que la misma persona sabe de si misma. Ya, queda un poco raro, no? Déjame que te ponga un ejemplo.

Con nuestros móviles generamos muchos datos. Información sobre dónde estamos, webs que visitamos, cuando abrimos el móvil, alarma, fotos, música, noticias que nos interesan.

Pero, por si esto no es suficiente ahora nos venden los “wearables” o pequeños chismes como relojes, gps, music-band, no-se-que-ring, que si la nevera lleva internet, que si la televisión te dice que ver.

A toda esta información se le puede añadir nuestras acciones con otras empresas. Ya sea planos de la casa, que compramos en el súper, que pagamos con visa, que tal y que cual.

Bien pues a todo esto se le llama BIG DATA. Datos y datos sobre todo lo que hacemos. Dicen que se generan tantos datos en un mes que en toda la historia de la humanidad hasta la actualidad.

text_data_mining

Vamos a poner un ejemplo:

Imaginamos que alguien quiere hacer un perfil sobre ti. Quiere saber que haces, que piensas, que compras y hasta cuando meas!

Recogen tus datos y se ponen a analizar.

A la XX:XX hora suena la alarma de tu móvil (¿quién tiene despertador ya?) lo apagas y te vas al baño. Contrastando tu GPS (es igual si no lo tienes activado, por la triangulación de la señal saben donde estas en cada momento) detectan tu ubicación y la comparan con los datos del catastro sobre tu piso, saben que estas al baño.

Saben que noticias lees, cuales pasas rápido y cuales te guardas. Saben que los anuncios que aparecen junto a esas noticias que te interesan valdrán más que los otros.

Vas a la cocina, mirando a los planos lo saben. Y resulta que hace poco te han conectado el contador de luz electrónico. Datos y más datos. Saben por el consumo de los electrodomésticos contrastando con lo que has comprado anteriormente al súper que acabas de encender la tostadora y ahora la Nespresso para hacerte un café.

Saben que desayunas con la tele, por el consumo eléctrico y gracias a la TDT saben que canales miras. O sea que próximamente solo para ti harán publicidad que a ti te interese.

Saben que coges el coche, y cual es tu coche y donde te diriges. No saben que radio escuchas o si por el contrario te pones tu música. Pero tu les ayudas ya que en tu Facebook pone me gusta al programa de radio mañanero. O mirando Spotify y YouTube ven que música te gusta. También ven si eres un piratilla o por el contrario compras la música por iTunes, por ejemplo.

Y así podríamos seguir si miramos lo que compras al súper, que no se te olvide la tarjeta sino no recibo descuentos. La tarjeta es para saber que eres tú quien compra, por si no pagas con VISA. Los libros que lees si te los pones en tu eBook. Aplicaciones o juegos que usas y ya por no hablar de todo lo que pones en Facebook o por otras redes sociales. Y todo lo que empezamos a subir en el Cloud.

Ah! Y que no se te olvide ubicar la foto que cuelgas en Instagram de la cena que te has zampado en el Restaurante nuevo X. Un restaurante que curiosamente se anunciaba en tu Facebook y que pensaste —mmm… tiene buena pinta— que raro que no se anunciara un Lestaulante Chino?

En definitiva, decir que generamos muchos datos y que lo vamos a seguir haciendo, pero solo ten en cuenta que si puedes evitar cada día tan solo un dato de los millones que generas puede que algún día pienses que haciendo eso, eras y serás la única persona al mundo que lo sabe.

Dueño de lo que callas y prisionero lo que dices.