Mir Rodriguez Lombardo

Explicando agua virtual con infografías


En resumen: Comparto algunas técnicas y lecciones aprendidas para hacer infografías sobre agua. Los diagramas de Sankey son una buena manera de mostrar los flujos de cosas, en este caso de agua virtual. Para incorporarlos en una infografía, hará falta aprender a usar el lenguaje de programación R y también hacer bastante diseño a mano.

La Revista de la Universidad de México me pidió que produjera un mapa o una infografía sobre flujos de agua virtual para el número de junio de 2020 sobre agua. El concepto de agua virtual es súper interesante y muy útil para educar a la gente sobre el impacto que tiene producir lo que nos comemos y los objetos industriales que nos rodean. Es decir: para producir un limón hay que regar el limonero, y si dividimos toda esa agua que le pusieron al árbol entre los limones que se cosechan, resulta que para producir cada limón se necesitaron casi 2 litros de agua. Ese mismo cálculo lo podemos hacer para muchas otras cosas, tomando en cuenta no solo el agua usada para producir algo sino el agua necesaria para disolver los desechos de la producción. En el caso del algodón, se producen desechos al sembrar el algodón (cuando se escurren los fertilizantes a los ríos) al blanquearlo y luego al teñirlo. Según un cálculo, producir una camiseta de algodón requiere aproximadamente 3,900 litros de agua. La camiseta, entonces, contiene 3,900 litros de agua virtual.

Los flujos de ese agua virtual entre países que comercian con esos productos agrícolas o industriales es lo que se conoce como la huella hídrica, un concepto creado por el científico holandés Arjen HoekstraHoekstra, que publicaba sus artículos bajo una licencia Creative Commons, produjo una lista exhaustiva de la huella hídrica de los productos agrícolas que es una referencia fundamental y promovido a través de su Water Footprint Network. Hoekstra murió de manera inesperada en 2019, pero su trabajo sigue siendo esencial. El concepto de agua virtual, su validez y su utilidad son sujeto de debate. Los foros internacionales y muchos de los que piensan en estos asuntos lo incorporaron a sus análisis, pero algunos cuestionan las metodologías usadas y por consiguiente la validez de los datos. También se critica la capacidad de estas ideas para realmente producir algún cambio.

Pero creo que la conclusión general es válida. También hay que mejorar la capacidad de recaudar y procesar los datos sobre gestión de agua y aprender a comunicar estos conceptos tan complejos. Acumular y ordenar esta información es una labor titánica, que involucra reunir fuentes muy diversas, muchas de ellas enterradas en informes en PDF o en papel, en artículos, entrevistas, conferencias y presentaciones de powerpoint. Otros tantos datos son aproximaciones o se tienen que extrapolar de datos antiguos. Una de las ideas de los conceptos de huella hídrica y de agua virtual es que las naciones y comunidades puedan manejar mejor su agua, pero el requisito es monitoreo y buenos datos.

Un día de operaciones del Canal de Panamá utiliza suficiente agua para llenar más o menos 1,755,274 “piscinas marginales” Jonathan Harker y yo ideamos una vez una comparación de la capacidad de las esclusas del Canal de Panamá (o sea, el agua que gasta el Canal) con las piscinas plegables populares en los barrios. En ese entonces la elite política del país, principal beneficiaria del Canal y sus negocios anexos, estaba criticando las piscinas por desperdiciar agua.

El primer reto al hacer gráficos sobre este tema es intentar transmitir el órden de magnitud de los datos. Estas cifras hablan de cantidades enormes de agua, muy difíciles de imaginar, expresadas en kilómetros cúbicos (km3).

¿Cuánto es 1 kilómetro cúbico de agua?

La primera infografía (el diseño editorial es de Krystal Mejía) intenta crear una imagen mental del órden de magnitud de nuestras cifras. ¿Cuánto es 1 km3 de agua? muestra un diagrama (hecho con Inkscape) que utiliza a modo de comparación un edificio grande e icónico de la ciudad de México, la Torre Latinoamericana, de 166 m de altura (182 m hasta la punta de la antena). Un cubo imaginario con 1 km3 de agua mediría 1 km de alto. Usando una simple regla de 3 dibujé una línea proporcional a mi diagrama de la torre y con ella el resto del cubo y lo llené de agua azul. Sigue siendo imposible imaginarlo, así que busqué algunos datos de Wikipedia y de un artículo de 2011Nuria Merce Ortega Font, “El agua en números”, Casa del tiempo, UAM, marzo de 2011, Vol. IV época IV número 41. con cifras sobre México. Igual no creo que ayudó tanto, pero al menos tenemos una idea. ¿Qué otras comparaciones útiles y didácticas se podrían hacer?

El siguiente tema es la comparación entre uso de agua sostenible y uso insostenible. El principal usuario de agua en el mundo es la agricultura (seguido de la industria y el uso doméstico), así que decidí graficar una comparación de la sostenibilidad de los sistemas de riego. Además, había datos recientesRosa, Lorenzo, et al. “Global unsustainable virtual water flows in agricultural trade”. Environmental Research Letters 14.11 (2019): 114001.. Resulta que más de la mitad de los sistemas de riego agrícola en el mundo son insostenibles,

Riego insostenible es decir que se extraen más rápido de lo que se recargan las reservas de agua disponible y acaban con los flujos necesarios para los ecosistemas. Los peores en este sentido son la India, China, Pakistán y los Estados Unidos. El el caso de México, se estima que el 63% de los 28 km3 de agua de riego agrícola de México provienen de fuentes insostenibles, sin embargo apenas el 4% de los pozos se monitorea y no lo sabemos con certeza. Además, muchos pozos agrícolas son usados irregularmente para minería, industrias, turismo y uso doméstico.

El gráfico de arriba es la versión que envié a los editores. Quería que el grosor de las barras reflejara el total de agua de riego agrícola, agregando una dimensión adicional que permitiera comprar la importancia relativa de cada región. No hallé manera sencilla de hacerlo. Simplemente no es posible usando una hoja de cálculo. Así que finalmente, después de años de verlo mencionado y no usarlo, tuve que meter la mano en R, un lenguaje de programación para estadísticas y gráficos. Si estás interesadx en hacer infografías basadas en datos, tarde o temprano tendrás que aprender R. Si nunca has programado, creo que R es una buena opción para comenzar y hay innumerables tutoriales y cursos disponibles.

Lo primero fue reunir los datos del artículo de Rosa et al, convenientemente disponibles en formato Excel, y agrupar las cifras por país en continentes. Al final, quedé con esta tabla, lista para importar a R en formato csv. La columna valor está en porcentajes, el ancho es el volumen total de riego:


region variable valor ancho
Asia del Sur insostenible 0.534190397198415 434.04
Asia del Sur sostenible 0.465809602801585 434.04
Asia del Este y Pacífico insostenible 0.539271075661903 180.54
Asia del Este y Pacífico sostenible 0.460728924338097 180.54
Norteamérica insostenible 0.619229699666296 143.84
Norteamérica sostenible 0.380770300333704 143.84
Medio Oriente y África del Norte insostenible 0.559066666666667 150
Medio Oriente y África del Norte sostenible 0.440933333333333 150
Europa y Asia Central insostenible 0.390086900547152 124.28
Europa y Asia Central sostenible 0.609913099452848 124.28
África Subsahariana insostenible 0.430569105691057 30.75
África Subsahariana sostenible 0.569430894308943 30.75
Latinoamérica y el Caribe insostenible 0.178110944527736 33.35
Latinoamérica y el Caribe sostenible 0.821889055472264 33.35
Escala insostenible 0.5 100
Escala sostenible 0.5 100


El código R para hacer el gráfico es súper corto:

# Dibuja un gráfico de barras horizontales con el grosor determinado por una variable

library(ggplot2)
library(readr)

irr<-read_csv("riego_sost_insost.csv"))

ggplot(irr, aes(y = region, x = valor, fill = variable, width=ancho/400, orientation="x")) +  geom_bar(stat = "identity")

y produce esto,

Riego insostenible de R lo exportas a PDF y lo abres en Inkscape para arreglarlo. El diseño final de Krystal Mejía con las correcciones de los editores quedó así:

Riego insostenible

Mapa global del balance de agua virtual y flujos entre países Balance de agua virtual por país y dirección de los flujos brutos de agua virtual relacionados con productos agrícolas e industriales en el periodo 1996–2005. Tomado de Hoekstra y Mekonnen, “The water footprint of humanity”. Proceedings of the national academy of sciences 109.9 (2012): 3232-3237.

Los flujos comerciales de agua virtual nos pueden dar una métrica de la sostenibilidad de las economías de los países y las regiones. Hoekstra y Mekonen publicaron en 2011 un mapa clásico que muestra que los principales exportadores (brutos) de agua virtual están en Norteamérica. El grosor de la flecha indica la cantidad. La flecha gorda de Estados Unidos a México refleja las importaciones masivas de productos a México luego de la firma del tradado de libre comercio de América del Norte. El color indica el balance nacional neto de agua virtual, los países en verde son exportadores netos y los países en rojo, importadores de agua virtual. Hay muchos detalles que no aparecen aquí, por ejemplo si los flujos son de agua azul (riego) o verde (lluvia y agua subterránea).

Los datos del estudio de Hoekstra son de hace más de 15 años, pero no conozco de otro trabajo más reciente con niveles comparables de alcance y detalle. Así que me tuve que conformar con los datos del trabajo de Rosa et al. de 2019, con las cifras de comercio de agua agrícola insostenible entre países. ¿Podríamos intentar hacer un mapa comparable y aspirar a una mayor densidad de datos?

El mapa de Hoekstra es un ejemplo de diagrama de SankeyDiagramas de sankey sobre flujos de materiales en el País Vasco y en la Unión Europea Estos diagramas de Sankey comparan el flujo de materiales en el País Vasco y en la Unión Europea, en un informe sobre indicadores de economía circular. Se puede ver la diferencia en importaciones y exportaciones, por ejemplo, y cuánto del flujo de materiales (minerales, combustible, biomasa) es circular., un tipo de gráfico apto para indicar flujos. El grosor de una línea determina la magnitud del flujo entre nodos, que pueden ser energía entre secciones de una máquina, dinero entre participantes de un mercado o agua virtual entre países. Para hacer estos diagramas, una vez más echamos mano de R.

El paquete de R riverplot permite hacer diagramas de Sankey que incorporan las coordenadas de los nodos. El autor de ese paquete lo usó para replicar el famoso gráfico de Minard, citado por Edward Tufte como la mejor infografía jamás dibujada. Usando R y riverplot intenté mapear los flujos entre todos los países:

Mapa Sankey de flujos de agua virtual entre países Imagina el mapamundi de fondo. Un poquito apiñado. Luego traté de resumirlo a regiones:

Mapa Sankey de flujos de agua virtual entre regiones

Y finalmente hice solo las exportaciones de México:

Mapa Sankey de flujos de agua virtual entre países

Está bien feo y no cuenta bien ninguna historia. A pesar de que me tomó 4 días llegar a ese punto (estas cosas toman tiempo, ¡recuerda siempre cobrar bien!) decidí tirarlo a la basura. Bajé un poco las expectativas y me puse a hacer uno más sencillo.

Con ese fin usé el paquete networkD3 de R, que incorpora la fantástica biblioteca Javascript D3 para hacer diagramas de red, incluyendo Sankey. La ventaja del networkD3 es que el producto final es un archivo HTML que incluye el código SVG del diagrama, es decir que recortando esa sección del HTML podemos producir un archivo para abrir y modificar en Inkscape y pasarlo a la diseñadora editorial.

Diagrama Sankey sobre el comercio global de agua virtual de riego insostenible

Para llegar a ese punto pasé por varias versiones intentando poner cada región una sola vez, en lugar de a cada lado del diagrama:

Versión anterior del diagrama Sankey sobre el comercio global de agua virtual de riego insostenible que no funciona muy bien, aunque es visualmente interesante ver los flujos dentro de cada región.

Enlace a diagrama Sankey interactivo Haz clic en la imagen para ver el diagrama Sankey interactivo producido por D3.

La biblioteca D3 está diseñada para producir gráficos interactivos en la web, lo cual es un producto totalmente diferente que un diagrama para una revista impresa. Haz clic aquí para ver una versión interactiva. En este gráfico puedes visualizar con un color cada región por separado al mover el puntero encima del nodo y las cantidades aparecen al poner el puntero sobre las coneziones. También puedes cambiar el órden de los nodos.

A continuación el código R que produce este diagrama. Los datos están en dos archivos csv, uno con la lista de regiones y otro con los flujos entre cada región (recuerda citar la fuente, Rosa, Lorenzo, et al. (2019) si usas estos datos):

# Dibuja un diagrama de Sankey de los movimientos de agua entre regiones del mundo
# Con datos de Hoekstra et al.

library(networkD3)
library(readr)
library(htmlwidgets)

regiones<-read_csv("/home/mir/Dropbox/proyectos/revista_u/agua/regiones_d3.csv",
                    col_types = cols(
                    ID = col_skip(),
                    region = col_character(),
                    grupo = col_character(),
                    total=col_character()
                    )
)

class(regiones)<-"data.frame"

bordes<-read_csv("/home/mir/Dropbox/proyectos/revista_u/agua/exportacion_importacion_d3.csv",  
                    col_types = cols(
                    ID1=col_integer(), 
                    ID2=col_integer(), 
                    volumen=col_double(),
                    color=col_character()
                 )
)
class(bordes)<-"data.frame"
names(regiones) <- c("name", "grupo","total")
names(bordes) <- c( "source", "target", "volumen","color")
class(bordes)<-"data.frame"

red <- sankeyNetwork(
      Links = bordes, 
      Nodes = regiones, 
      Source = 'source', 
      Target = 'target', 
      Value = 'volumen', 
      NodeID = 'name',
      NodeGroup = 'grupo',
      nodeWidth = 10,
      nodePadding = 10,
      LinkGroup = 'color',
      sinksRight = TRUE,
      units = "km3",
      fontSize = "10",
      fontFamily = "sans",
      width = "100vw",
      height = "100vh",
      iterations = 100)

saveWidget(widget = red, file = "sankey_agua.html", 
           selfcontained = TRUE)

La huella hídrica de los productos agrícolas e industriales nos da una medida rápida del agua necesaria para producirlos. Esto incluye el agua de riego, la de los procesos industriales y la necesaria para diluir los desechos de los procesos. Una vez más, usé datos de HoekstraMekonnen, M.M. & Hoekstra, A.Y. (2011) The green, blue and grey water footprint of crops and derived crop products, Hydrology and Earth System Sciences, 15(5): 1577-1600., pero también de Amigos de la TierraBurley, Helen. “Mind your step: Land and water footprint of every day products”. Friends of the earth (2015). y un artículoWu, May, and Hui Xu. Consumptive water use in the production of ethanol and petroleum gasoline—2018 update. No. ANL/ESD/09-1 Rev. 2. Argonne National Lab.(ANL), Argonne, IL (Estados Unidos), 2018. sobre el uso de agua para la producción de gasolina.

Riego insostenible

Esta infografía es una adaptación del diseño original del alemán Timm Kekeritz y se puede ver de una forma u otra en otros lugares. Se podría decir que es demasiado genérico, pero creo que hay que darle crédito a Kekeritz. Una vez elegidos los productos e investigado las cifras, lo produje 100% a mano con Inkscape, usando el caracter Unicode de gota de agua (💧) y repitiéndolo cuantas veces fuera necesario. ¿Existe alguna herramienta que ayude con esto?

Y eso es todo. Puedes ver las infografías en el sitio web de la Revista de la Universidad de México.

Hay una lección muy importante que aprendí de esta chamba. Si quieres que tu mapa o diagrama Sankey sea visualmente atractivo, no existe software (todavía) que lo haga automáticamente. Siempre será necesario diseñarlo a mano. Quizá hubiera sido posible hacer el mapa de flujos de agua de riego, pero hubiera tomado mucho más tiempo que el necesario para entregar la infografía a tiempo. Vale la pena, los mapas y diagramas de Sankey con flechas o barras de grosor variable son una excelente herramienta de comunicaciones y para la educación.

Comentarios

Los comentarios son moderados antes de publicarse.


Debes poner tu nombre

Necesito tu dirección de email

Por favor escribe un comentario

También puedes comentar vía Twitter