lunes, 23 de septiembre de 2013

Volumen actual de datasets abiertos en España

Actualización 30/10/2013: Complemento este post añadiendo el nuevo portal de Datos Abiertos de la Diputación de Málaga. El resto de datos son de finales de septiembre (no están actualizados a finales de octubre).
Este miércoles estaré participando en el Sexto Encuentro Internacional de Investigación en Información y Comunicación (6eiiic) que se celebrará en la Facultad de Ciencias de la Información de la Universidad Complutense, en Madrid.

En concreto, me interesa "sumergirme" de lleno en una cuestión que me preocupa desde hace mucho tiempo: la poca reutilización de los datos que algunas administraciones han puesto a disposición de los ciudadanos de forma totalmente abierta.

Si me centro solo en la oferta de datos abiertos proporcionada por adminitraciones públicas de España (aunque creo que el problema se puede transponer a cualquier país) vemos que actualmente - según el mapa de la Fundación CTIC - en España hay 23 administraciones públicas que ofrecen portales Open Data de como mínimo 2 estrellas (según la clasificación de Tim Berners-Lee):


  

Clasificación y nombre del portal

Administración

#Datasets


 5*  Catálogo de Datos de Asturias Asturias 5
 5*  Datos Abiertos de Zaragoza Zaragoza 112
 4*  Abert@s (Portal Open Data da Xunta de Galicia) Galicia
277

 4*  Aragón Open Data Aragón
449

 4*  Dades Obertes CAIB Islas Baleares
42

 4*  Dades Obertes Gencat Catalunya 1.457
 4*  RISP en Gijón Gijón
424

 4*  Open Data Euskadi País Vasco
2.146

 4*  Open Data Junta de Castilla y León Castilla y León 121
 4*  Open Data Terrassa Terrassa
96

 4*  Open Data BCN Barcelona
268

 4*  Portal de Datos Abiertos de JCCM Castilla La Mancha
42

 3*  Datos Abiertos de la Junta de Andalucía Andalucía
70

 3*  Badalona Open Data Badalona 15
 3*  Datos Abiertos de la Ciudad de Málaga Málaga
55

 3*  Datos Abiertos de la Diputación de Málaga Diputación de Málaga
13

 3*  Lleida Open Data Lleida
95

 3*  Observatori de la Ciutat Open Data Sant Boi Sant Boi de Llobregat (a)
 3*  Open Data Canarias Islas Canarias
19

 3*  Open Data España (datos.gob.es) España 1.156
 3*  Open Data Navarra Navarra 121
 3*  Open Data UPO Sevilla 33
 3*  OpenData SBD Sabadell 248
 3*  Pamplona Open Data Pamplona (b)

Notas:
  • (a): Este es un observatario donde se ofrece, en un mismo lugar, datos y noticias relacionadas con la ciudad. Es francamente dificil extraer el número de datasets que se ofrecen en abierto.
  • (b): Cuando se buscaron el número de datasets disponibles de este portal (22/09/2013), el buscador no funcionaba correctamente y, por lo tanto, fue imposible obtener dicho número.
Cabe tener en cuenta que el número de datasets disponibles no es (en realidad) un indicador fiable. De hecho, algunos portales agrupan los datos según criterios lógicos (por ejemplo, agrupar en un mismo dataset los mismos datos de diferentes años). En cambio en otros portales optan por diferenciar esta información en diferentes datasets.

Claramente el número de datasets no es un indicador fiable, de hecho, recientemente Antonio Ibáñez (de la Junta de Castilla y León, responsable del portal Open Data de esta administración) me comentó "El número de conjuntos de datos de un portal Open Data es engañoso. Un ejemplo sería el conjunto de datos “Superficies de cultivos municipales” donde, de forma anualizada, separada por municipio e indicando el tipo de cultivo se dan una serie de datos. Bien podríamos sacar un fichero por cada año, por cada provincia, o por cada tipo de cereal. Así, mostrando la misma información multiplicaríamos nuestros conjuntos de datos. Entiendo que es complicado tomar un parámetro, pero también es cierto que tiene importantes deficiencias.".

A pesar de que comparto al 100% la afirmación que el número de datasets abiertos es un indicador poco fiable, lo cierto es que creo que puedo afirmar que los más de 7.260 conjuntos de datos abiertos son una cantidad suficientemente importante como para generar una apreciable reutilización.

Sin embargo, la realidad dista mucho de ser esta. La reutilización es muy baja por no decir casi nula. La mayoría de portales, especialmente los que han abierto más datos, promocionan los servicios creados a partir de la reutilización de los datos abiertos, y esta promoción denota la baja reutilización.

No es mi objetivo entrar en exactitudes y detalles, sino sentenciar que aunque ya hay disponible en España un volumen importante de datos abiertos, la reutilización de éstos sigue siendo testimonial.

Os recomiendo leer el siguiente post, ¿Por qué no se reutilizan los datos abiertos? 

3 comentarios:

Oscar Corcho dijo...

Marc,

Mañana os enseñaré un ejemplo de reutilización real, con el objetivo de obtener rendimiento económico. ¿Será que es difícil hacer "tracking" de cuánto se reutiliza cada dataset?

Oscar

MarcG dijo...

Oscar,

Encantado de conocer más ejemplos de reutilizaciones de datos abiertos.

Efectivamente es muy difícil realizar un tracking para saber cuánto se reutiliza un dataset.

Sin embargo, y aún a pesar de no poder "contar" con exactitud el volumen de reutilizaciones, sigo pensando que es evidente que la reutilización del Open Data es muy baja.

Seguimos el debate hoy en la Complutense :)

Alberto Abella dijo...

Aquí se puede ver una clasificación más ajustada a la realidad
http://www.meloda.org/