La crisis del agua y la democratización del dato

crisis del agua estrés hídrico y accesibilidad a los datos

Los datos son un recurso vital para el desarrollo científico y la evolución tecnológica. La accesibilidad a los datos es tan importante para la ciencia como el acceso al agua para la vida y la humanidad.

El agua es esencial para la vida tal y como la conocemos. Los animales, las plantas y el resto de seres vivos, todos, necesitamos agua para vivir. Se suele decir que donde hay agua, hay vida. Pero… ¿realmente es cierto? Esta expresión ha sido repetida tantas veces que ha llegado a confundir a más de uno. Y es que el agua no es más que una sustancia por sí sola y, aunque es fundamental, su mera existencia no conlleva al origen de vida. Crear vida es algo más complejo. Algo muy parecido ocurre con los datos y la ciencia. Los datos son esenciales para el conocimiento, pero, al igual que ocurre con el agua y la vida, el mero hecho de tener datos no implica conocimiento. En este artículo no vamos a hablar de cómo convertir los datos en conocimiento, sino de la importancia del dato y su accesibilidad como recurso para generar conocimiento.

Todo conocimiento se fundamenta en datos ― es la base del método científico ―, pero para alcanzar conocimiento no basta con tener datos. Como es de esperar, la localización, el formato, el estado y la calidad de la materia prima (los datos) son aspectos fundamentales en el proceso de generación de conocimiento. Los datos deben ser ciertos, comprensibles y accesibles, que se puedan manipular y confiar en ellos. En ocasiones será necesario alterarlos, pero deberemos asegurar que la información que contienen no se vea afectada. Una vez  los tengamos, y aplicando los métodos e instrumentos oportunos, podremos obtener información para posteriormente generar el conocimiento.

¿Por qué tanto interés en los datos de repente?

Los ordenadores nos permiten trabajar con una cantidad de datos que jamás habríamos imaginado. Y los avances tecnológicos de las últimas décadas han hecho que cada vez sea más rápido, más sencillo y más económico el almacenamiento y procesamiento de la información. A consecuencia de este boom tecnológico, han germinado los gurús que profetizan con los datos como si fueran el nuevo mesías. Han surgido tantos roles y tantas tecnologías alrededor del dato, que solo los elegidos pueden diferenciarlos. Pero lo cierto es que los datos siempre han estado ahí, y gracias a ellos nosotros estamos aquí. Los datos son la base de todo nuestro conocimiento.

El agua y los datos: vidas paralelas

Cómo ya te habrás dado cuenta, son varias las analogías que hemos hecho entre los datos y el agua. Pero esto no acaba aquí, y es que los datos y el agua parecen llevar vidas paralelas. Al igual que ocurre con la sobreexplotación del agua, los datos están en plena crisis y necesitan de un uso más responsable.

Mucha agua, y poca potable

A pesar de que el 71% de la superficie de la corteza terrestre está cubierta por agua, la cantidad de agua accesible y apta para el consumo humano es muy pequeña. Se estima que el 97,5% es agua salada, y que tan sólo el 2,5% del agua que existe en la Tierra se considera dulce. Además, se calcula que más del 99% de los recursos disponibles de agua dulce del planeta se encuentran en forma de glaciares, nieves perpétuas, permafrost, hielo o acuíferos. Por lo que tan sólo el 0,025% del agua de la Tierra es dulce, está en estado líquido y se encuentra en la superficie. A esto debemos sumarle que solo una pequeña parte de ese agua es potable, porcentaje que se reduce cada día por efecto de la contaminación.

El 71% de la superfice terrestre está cubierta por agua. El 97,5% es agua salada y el 2,5% es agua dulce.
Proporción de agua dulce y agua salada que hay en el planeta Tierra.

Al igual que ocurre con el agua, la cantidad de datos “potables” es realmente pequeña si la comparamos con el total. Podemos encontrar fácilmente lagos y mares de datos, pero la mayor parte de estos datos no son aptos para un consumo directo. Ya sea porque son erróneos, requieren tratamiento, son de difícil acceso o directamente no son accesibles. En ocasiones tenemos que utilizar métodos complejos para obtenerlos, e incluso rechazar unos datos en beneficio de otros (aquí ya nos metemos en la mecánica cuántica…).

La gran mayoría de los datos que generamos no se pueden consumir directamente, ya que carecen de una estructura que un ordenador pueda entender. Por lo que para poder utilizarlos necesitamos hacer un tratamiento que adapte esa información a una estructura de datos comprensible y manipulable por una máquina. Estos datos que nos obligan a hacer un tratamiento previo antes de consumirlos, se conocen como datos no estructurados. En el lado opuesto encontramos los datos estructurados, los cuales siguen un modelo de datos predefinido.

Un lujo para unos pocos

Un sistema de canalización de agua eficiente y seguro es un privilegio mucho mayor de lo que parece a simple vista. Aproximadamente, tres de cada diez personas no disponen de acceso a agua potable en sus hogares. Mientras que se estima que más de la mitad de la población no tiene acceso a un sistema de saneamiento seguro con el que gestionar sus excrementos.

Para cualquier proyecto basado en datos, asegurarse de que todos los datos que se están recibiendo y enviando son correctos y seguros, es algo vital. Es por esto que todas las organizaciones quieren una fuente de datos de garantías, eficiente y segura. Pero lo cierto es que no todas se lo pueden permitir. Disponer de una fuente de datos de garantías es más complejo de lo que puede parecer en un primer momento. Tanto la creación del sistema como su mantenimiento, suponen un gran esfuerzo económico, tecnológico y de mano de obra que muy pocas empresas pueden financiar.

De hecho, en los últimos años han surgido varios modelos de negocio de la necesidad de disponer de datos de calidad. Afortunadamente, también existen muchos proyectos, tanto privados como públicos, dedicados a la creación de fuentes de datos fiables y disponibles a todos los públicos (datos abiertos). La democratización del dato ayuda a mejorar la toma de decisiones de nuestra sociedad.

Un recurso sobreexplotado

El uso intensivo de agua en la agricultura, la ganadería y la industria, sumado al constante aumento de la población mundial, ha sumergido a nuestro planeta en una crisis hídrica que se está agravando cada día. A nivel global, se está usando más agua que la que la naturaleza nos ofrece. Por si fuera poco, los efectos del cambio climático y los niveles de contaminación siguen en aumento.

Cada vez son más las empresas, organizaciones y gobiernos que basan su toma de decisiones en datos. Es por ello que los datos se han convertido en una pieza estratégica por la que luchar. Son recientes los conflictos diplomáticos y empresariales por el control y el uso de los datos. Y este uso abusivo y descontrolado de la información, ha llegado a poner en riesgo derechos fundamentales de las personas. Como consecuencia, ante estas luchas de poder, han surgido movimientos sociales y políticos para defender la privacidad de las personas y el uso responsable de los datos.

La falta de agua mata

Sin agua, se secan los cultivos, muere el ganado y la población sufre hambrunas. Además, la escasez de agua y la contaminación de los escasos recursos hídricos, desembocan en una falta de salubridad y la proliferación de enfermedades.

Los datos son la materia prima con la que construimos el conocimiento empírico y racional. Sin datos, la ciencia se seca y muere el desarrollo, la sociedad se enfrentaría al desconocimiento y la incertidumbre. Sin ciencia no hay futuro, la humanidad se estancaría y no evolucionaría hacia nuevas oportunidades.

Contaminación creciente

Actualmente el 80% de las aguas residuales del planeta se vierten al medio ambiente contaminadas. El interés por reciclar y reutilizar el agua o, al menos, por eliminar los residuos más tóxicos antes de verterla al medio ambiente son muy recientes. Y estos esfuerzos aún resultan insuficientes.

Confirmar la veracidad y completitud de los datos es más costoso que el almacenamiento, por lo que resulta frecuente anteponer la cantidad a la calidad. Como consecuencia, se almacenan cada vez más datos menos relevantes, e incluso erróneos.

Un porcentaje considerable de datos irrelevantes hace que aumenten los requisitos de almacenamiento y procesamiento de los sistemas informáticos inútilmente. Lo que puede llegar a causar impactos en el medio ambiente por un mayor consumo de energía y una mayor generación de residuos tóxicos. Por su parte, los datos falsos o erróneos contaminan la información que obtenemos de ellos al agregarlos. Por lo que además de tener registrados datos contaminados, la información que se extrae de ellos y las conclusiones que obtenemos de ellos también lo estarán. Pero aunque todos los datos sean ciertos, también pueden surgir estas contaminaciones en los resultados debido a sesgos y tratamientos erróneos de los datos. La manipulación malintencionada de los datos y la información es una de las mayores amenazas para el conocimiento y la evolución de la sociedad.

El agua y economía laboral

Se estima que el 78% de los puestos de trabajo a nivel mundial dependen en mayor o menor medida del agua. De estos puestos de trabajo, en torno al 42% lo hace de forma intensa, mientras que el 36% de la población activa mundial depende moderadamente del agua.

La revolución tecnológica de las últimas décadas, junto a las nuevas generaciones que han crecido en la era de la digitalización, van a transformar el panorama laboral del futuro. Aunque actualmente un gran porcentaje de los empleos dependen en mayor o menor medida de los datos, la cantidad de empleos relacionados directamente con los datos será abrumadora. Ante estas previsiones, todas las universidades y gobiernos de las naciones más desarrolladas están planteando programas tecnológicos que adapten a sus instituciones y sus ciudadanos a las demandas del futuro.

Los datos son el caldo de cultivo de la revolución del conocimiento. Actualmente, el uso y control de los datos ya son el motor de algunas de las mayores economías del mundo. Y aunque hoy en día las profesiones relacionadas con los datos son de las más demandadas, se estima que gran parte de los empleos más importantes del futuro estarán basados o relacionados con los datos. El proyecto efecto pez es una web ideal para aprender y llegar a dominar los datos y todo lo que les rodea. El objetivo de esta web es que te sientas en la ciencia como pez en el agua.