Carlos Castillo: "Ciertas decisiones sobre nosotros son tomadas por un algoritmo"

El año 2018 la mitad de grandes corporaciones utilizarán el Big Data; un fenómeno creciente que estos días expertos como Carlos Castillo analizan en un congreso en Barcelona

El Big Data es hoy más grande que nunca. Se utiliza a la Administración pública, para gestionar millones de datos de los ciudadanos; a las grandes multinacionales, para analizar el impacto de su marca; o a pequeños negocios, que quieren comprender el comportamiento de sus clientes. Según Eurecat, Centro Tecnológico de Cataluña, la mitad de las grandes corporaciones utilizarán el Big Data en dos años.

El uso de esta tecnología, pero, también implica ciertos riesgos. La privacitat de los datos o la discriminación son algunos de los aspectos que preocupan más a los expertos. El Big Data Congress reúne estos días en Barcelona además de 40 profesionales de diferentes ámbitos y disciplinas para analizarlo y examinar el gran potencial de este fenómeno. Uno de los expertos que intervienen es Carlos Castillo, director del grupo de Fecha Science de Eurecat, y autor del libro Big Crisis Data. Castillo es especialista en minería de datos y en el uso de esta tecnología en situaciones de emergencia, así como en el tratamiento ético de los datos.

Por qué hay que hacer minería de datos en situaciones de emergencia?
El primero que observamos en una situación de crisis es que la gente no está indefensa ante un desastre. Estamos acostumbrados a la idea de Hollywood que cuando hay una catástrofe todo el mundo corre en círculos... Pero no es así. Normalmente las personas son las primeras que reaccionan y tratan de ayudarse a sí mismas y a los otros. Y, muchas veces, lo hacen en las redes. También vemos que la gente el que busca es información. El problema es que los volúmenes de información involucrada en situaciones de emergencia son muy grandes; y con este volumen se requieren herramientas específicas.

Y aquí entra el análisis de datos...
Exacto. La aplicación más desarrollada es la de crear mapas durante una crisis de acuerdo con mensajes en las redes sociales. Por ejemplo, tuits que indiquen que hay una persona herida o atrapada. Si consideramos individualmente este tipo de mensajes, es difícil extraer una conclusión. Por eso nos hay que agregar todos estos acontecimientos individuales en un solo análisis.

Qué otras aplicaciones tiene el fecha mining en casos de emergencia?
La minería de datos tiene que implantarse al ciclo completo de un desastre. Desde la preparación previa (si la emergencia es anunciada, como con una inundación), hasta el momento del desastre y la posterior etapa de recuperación. En este sentido, creo que un trabajo importante de los medios sociales es coordinar la reconstrucción y los donativos. Muchas veces los desastres ocasionan otro; que es que se reciben un montón de cosas que la gente no necesita. Y entonces hace falta lidiar con un alud de zapatos que nadie ha pedido; cuando el que hacía falta era el agua o víveres.

Y como pueden ayudar las redes en este sentido?
Pues encontrando estas necesidades de la población. También puede ayudar a expandir el horizonte de quien puede hacer una acción. Nadie habría pensado hace cuarenta años que sería tan fácil enviar dinero en el Nepal después de un terremoto y ahora se puede hacer con un solo clic. En desastres más largos, como un desastre económico o climático, también se puede ayudar con la difusión.

Hasta qué punto entran aquí dilemas éticos sobre el trato a estos datos?
Yo creo que la tecnología crea problemas, pero también crea muchas soluciones. En el caso de la privacitat, hay metodologías poder utilizar los datos sin necesidad de saberlo todo. Hay algoritmos que permiten anonimitzar los datos de manera inteligente, entregando una garantía matemática que asegure que nadie es identificable individualmente en los datos.

Y quien toma la decisión de hacer este proceso?
Quién tiene el dato completo tiene la responsabilidad de custodiarla y protegerla contra ciberatacs. Pero también tiene que transformar los datos a la hora de entregarlas a un tercero, de forma que se respete la privacitat. Puede, por ejemplo, eliminar los años concretos de nacimiento e intercambiarlos por décadas; o cambiar los códigos postals por los nombres de las ciudades. Este proceso de distorsionar ligeramente los datos garantiza el anonimato, y permite igualmente que, por ejemplo, un investigador médico haga su trabajo.

Hay algún tipo de regulación en este ámbito?
Por ahora el que prevalece en la industria es el blanco o negro. O te entrego todos los datos, o no te entrego nada. Y esto bloquea mucho. Cuando hablas con investigadores biomédicos, te dirán que es extremadamente difícil acceder a datos, y esto es un impedimento porque ellos puedan avanzar en tratamientos de medicina.

Qué otros problemas supone el tratamiento de los datos?
Pues que pueden dar lugar a una cierta discriminación. Cada vez más, ciertas decisiones sobre nosotros son tomadas parcialmente por un algoritmo. Por ejemplo, cuando se decide con Big Data sobre si un cliente de un banco tiene que recibir o no un crédito. O la publicidad a Google. Se ha demostrado que si una usuaria busca trabajo, Google le ofrecerá trabajos más mal pagados que en un hombre. Esto no pasa porque Google esté usando el sexo como elemento distintivo, sino que lo está aproximando usando otros factores. Los algoritmos pueden discriminar, independientemente de que uno no los entregue datos discriminatorios.

Cómo podemos combatir esta discriminación?
El más importante es que los usuarios finales no se rindan. Hay gente que ya ha capitulado y ha renunciado a su derecho universal a la privacitat. Además, es importante que los algoritmos no tomen decisiones. Sólo tienen que ser sistemas que apoyen. No puede ser que decisiones de políticas públicas, por ejemplo, se tomen sin tener en cuenta los datos; pero tampoco puede ser que los datos decidan.

Cruz que estamos avanzando hacia un modelo más ético y esperanzador, o más bien hacia un mundo donde nuestras vidas estarán decididas por algoritmos?
Depende de nosotros. Estas son tecnologías que pueden ayudar en muchos aspectos, pero también tienen sus propios problemas. La industrialización trajo un montón de problemas, y también mucho bienestar. El que hay que hacer es ver como minimizar aquello que hay de malo y aprovechar el que hay de bono. Yo veo señales positivas. En Europa se está discutiendo y desarrollando el derecho a la explicación; que es el derecho a que, si un algoritmo me evalúa como un criminal con probabilidades de reincidir, yo pueda recibir una explicación sobre el porque de esta categorización.

Todavía hay mucho trabajo para hacer?
Sí. Pero por suerte, hay una gran riqueza de aproximaciones al Big Data. Las administraciones públicas están interesadas, las empresas están interesadas, los académicos, la gente que hace leyes... Este congreso es un ejemplo que hay un gran interés que va mucho más allá del ámbito tecnológico. Es importante que las decisiones en este terreno no las tomemos sólo la gente de informática; nos implican a todos y tenemos que tomarlas entre todos.
Hoy Destacamos
Lo más leido