SlideShare una empresa de Scribd logo
1 de 30
Descargar para leer sin conexión
Oscar Corcho
Ontology Engineering Group, Universidad Politécnica de Madrid

Basado en materiales realizados con la colaboración de 

Paola Espinoza, Idafen Santana-Pérez, 

Hugo Lafuente, Juan Carlos Ballesteros, Esther Minguela, 

David Portolés, César Cano y Alfredo Peris

Jornadas IECA: Difusión, accesibilidad y reutilizaciónde la
estadística y cartografía oficial
Adiós a los ficheros
Hola a los grafos de
conocimientos estadísticos 
ocorcho@fi.upm.es
@ocorcho
25/11/2019
Jornadas IECA
Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos – Jornadas IECA
License
•  This work is licensed under the license 

CC BY-NC-SA 4.0 International
•  http://purl.org/NET/rdflicense/cc-by-nc-sa4.0
•  You are free:
•  to Share — to copy, distribute and transmit the work
•  to Remix — to adapt the work
•  Under the following conditions
•  Attribution — You must attribute the work by inserting
•  “[source Oscar Corcho]” at the footer of each reused slide
•  a credits slide stating: “These slides are partially based on “Adiós a los
ficheros. Hola a los grafos de conocimientos estadísticos” by O. Corcho”
•  Non-commercial
•  Share-Alike
2
Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos – Jornadas IECA
El mensaje principal de esta charla
•  Si queremos facilitar la reutilización de los datos
estadísticos y geográficos, debemos evolucionar en la
forma de publicar estos datos:
•  De la publicación de ficheros (PC-Axis, CSV) a la publicación
adicional de APIs y grafos de conocimientos
•  Enlazando con grafos de conocimientos internos y externos:
•  Datos geográficos (por ejemplo, datos.ign.es)
•  Tesauros comunes (por ejemplo, INEBase, RAMON)
•  Wikidata
3
Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos – Jornadas IECA
Estructura de la charla
•  Un ejemplo de publicación de datos estadísticos más
allá de los ficheros (Aragón - IAEST)
•  Nuestro trabajo en la publicación de datos derivados
del padrón por parte de las ciudades
•  Algunas recomendaciones finales
4
Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos – Jornadas IECA
IAEST. De ficheros a APIs y Linked Data
5
§  IAEst: Instituto Aragonés de Estadística
o  http://www.aragon.es/iaest
o  Datos abiertos ofrecidos a través de:
•  Portal de datos abiertos de Aragón
-  http://opendata.aragon.es/
•  Su propio portal (nuestro interés se centra en la parte de
“estadística local”)
Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos – Jornadas IECA
Contexto: Infraestructura de datos del IAEst (2016)
7
§  Infraestructura existente
o  Data warehouse basado en Oracle BI
o  Exportaciones en diferentes formatos, incluyendo CSVs
Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos – Jornadas IECA
Contexto: Infraestructura de datos del IAEst (2016)
9
§  Infraestructura existente
o  Data warehouse basado en Oracle BI
o  Exportaciones en diferentes formatos, incluyendo CSVs
o  https://www.aragon.es/-/estadistica-local
§  Navegación y obtención de datos
o  Basada en una taxonomía
o  Filtros fijos, codificados en 

la aplicación
o  El usuario selecciona:
•  División administrativa
•  Municipio
•  Estructura de carpetas
o  Datos e HTML, PDF, CSV
Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos – Jornadas IECA
Informes prediseñados,
ofrecidos por Oracle BI
Aplicación Web de
Estadística Local
Contexto: Infraestructura de datos del IAEst (2016)
Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos – Jornadas IECA
Contexto: Infraestructura de datos del IAEst (2016)
§  En la Web del IAEst
o  http://www.aragon.es/DepartamentosOrganismosPublicos/
Institutos/InstitutoAragonesEstadistica/AreasGenericas/
ci.EstadisticaLocal.detalleDepartamento
§  En OpenDataAragón
o  http://opendata.aragon.es/catalogo/edificios-superficie-y-
vivienda-comarcas
Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos – Jornadas IECA
Objetivos del trabajo realizado
15
Extraer los informes estadísticos (ficheros),
transformarlos a RDF de acuerdo con estándares del
W3C, “refinarlos”, enlazarlos con datos enlazados de
Aragón (fundamentalmente URIs de municipios y
regiones) y proporcionar una API y un interfaz de
usuario nuevo para utilizarlos
Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos – Jornadas IECA
W3C Data Cube (basado en SDMX)
1616
http://www.w3.org/TR/vocab-data-cube/
Publicación de datos multi-dimensionales en la Web
Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos – Jornadas IECA
W3C Data Cube (basado en SDMX)
1717
Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos – Jornadas IECA
Resultados
19
§  Un proceso de transformación más fácil de mantener
o  Enriquece las APIs Linked Data de Aragón
o  Uso de GitHub para
•  Control de versiones y archivado
•  Actualizaciones continuas: detectando nuevos datos y
estructuras de datos cada día
•  https://github.com/aragonopendata/local-data-aragopedia/
§  API para desarrolladores
§  Interfaces de usuario adicionales
o  Mejorando las capacidades de acceso 

y recuperación de datos
§  Resultado adicional: mejora de los datos
o  Muchos errores y necesidades de mejora detectados en los
CSVs, que fueron corregidos en el proceso de transformación
Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos – Jornadas IECA
Proceso de transformación y publicación
22
Caracterízación
inicial
•  Identificar
fuentes
•  Identificar
dimensiones y
medidas
Transformación
•  Descarga diaria de
datos
•  Procesamiento (UTF8)
•  Subida a GitHub
•  Anotación de nuevas
dimensiones y
medidas
•  Transformación a RDF
Publicación y uso
•  APIs Linked
Data
https://github.com/aragonopendata/local-data-aragopedia/
Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos – Jornadas IECA
bi.aragon.es
Google
Drive
Descarga de
datasets y de su
configuración
¿Nuevo
dataset?
GitHub
Sí
Por cada
dataset
Generar nueva
configuración y
crear un issue
¿Nueva
estructura?
No
Crear
issue
Sí
¿Nuevos
datos?
Regenerar
los datos y
crear issue
No
Sí
SPARQL
Transformación de datos. Resumen…
Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos – Jornadas IECA
Publicación de datos y uso
32
§  Datos accesibles en
o  API (usando ELDA)
•  http://opendata.aragon.es/herramientas/apis?#aragodbpedia
o  GitHub (CSVs, RDF)
o  SPARQL endpoint
SPARQL
Elda
Linked Data
Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos – Jornadas IECA
Publicación de datos y uso
•  Pasar de una orientación basada en la publicación de
conjuntos de datos / informes a una publicación de
granularidad más fina (por observación)
•  Por ejemplo, un periodista puede hacer referencia directa, en
una noticia, a un dato concreto (fake news)
•  “En el año 1998 en Zaragoza había 42916 mujeres en el rango de edad de
0 a 15 años” (enlace:
http://opendata.aragon.es/recurso/iaest/observacion/03-030005TM/
50a0a5b9-cb76-37f4-961c-8abdf1c458e3)
•  “La tendencia de población de 0 a 15 años en mujeres en Zaragoza creció
hasta el 2013 y luego ha ido descendiendo levemente” (enlace:
https://github.com/aragonopendata/local-data-aragopedia/blob/master/
consultas.md)
•  ¿Podemos permitir consultas más complejas y sobre varios
conjuntos de datos a la vez sin obligar a descargar y procesar
datos en local?
Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos – Jornadas IECA
Estructura de la charla
•  Un ejemplo de publicación de datos estadísticos más
allá de los ficheros (Aragón - IAEST)
•  Nuestro trabajo en la publicación de datos derivados
del padrón por parte de las ciudades
•  Algunas recomendaciones finales
43
Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos – Jornadas IECA
Ciudades Abiertas (Open Cities) Project
INICIATIVA PLATAFORMA DE GOBIERNO ABIERTO,
COLABORATIVA E INTEROPERABLE (121/17-SP)
Julio 2018 – Junio 2020
Más detalles en http://www.ciudadesabiertas.es/
Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos – Jornadas IECA
Temporalmente disponible en:
https://github.com/opencitydata/demografia-padron-municipal/tree/master/ontology
http://vocab.ciudadesabiertas.es/def/demografia/padron-municipal (en breve)
Publicación de datos del padrón municipal
Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos – Jornadas IECA
Vocabularios a tener en cuenta
1.  SDMX (Statistical Data and Metadata eXchange):
a)  sdmx-dimension: área de referencia, período de referencia, y sexo
http://purl.org/linked-data/sdmx/2009/dimension
b)  sdmx-code: sexo de los habitantes
http://purl.org/linked-data/sdmx/2009/code
2.  Vocabularios IAEST:
a)  iaest-dimension: edad grupos quinquenales y nombre país de nacionalidad
https://opendata.aragon.es/def/iaest/dimension
b)  SKOS IAEST:
1)  Rangos de edad de grupos quinquenales:
https://opendata.aragon.es/kos/iaest/edad-grupos-quinquenales
2)  Nombre del país de nacionalidad:
https://opendata.aragon.es/kos/iaest/nacionalidad-pais-nombre
3.  Otras listas SKOS:
a)  Para la representación de los años de la dimensión del período de referencia
se reutilizará la lista de códigos definida por el gobierno británico y
disponible en http://reference.data.gov.uk/id/year
b)  Para los niveles de estudio se reutilizará la lista de códigos definida para el
vocabulario de padrón municipal y que se encuentra disponible en
http://vocab.linkeddata.es/datosabiertos/kos/demografia/padron-municipal/
tipo-nivel-estudio
Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos – Jornadas IECA
Publicación de cubos de datos derivados del padrón
§  Definición y ejemplos de los cubos de datos:
http://vocab.ciudadesabiertas.es/def/demografia/padron-municipal/cubos-datos
Temporalmente disponible en:
https://github.com/opencitydata/demografia-padron-municipal/tree/master/OnToology/census-cube-documentation
Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos – Jornadas IECA
Cubo de población según edad
qb:Dataset qb:structure qb:DataStructureDefinition qb:ComponentSpecification qb:ComponentPropertyqb:component qb:componentProperty
qb:DimensionProperty
qb:MeasureProperty
qb:Observation
qb:dataset
qb:dimension
qb:measure
ex:DS_PoblacionPorEdad qb:structure ex:DSD_PoblacionPorEdad qb:component sdmx-dimension:sex
espad-medida:numero-
personas
qb:dimension
qb:measure
rdf:type
rdf:type
rdf:type
rdf:type
rdf:type
sdmx-dimension:refPeriod
sdmx-dimension:refArea
iaest-dimension:edad-
grupos-quinquenales
Referenced	Ontologies:
					qb:	http://purl.org/linked-data/cube#
					ex:	http://vocab.ciudadesabiertas.es/recurso/demografia/padron-municipal/
					iaest-dimension:	http://opendata.aragon.es/def/iaest/dimension#
					espad-medida:		http://vocab.ciudadesabiertas.es/def/demografia/padron-municipal/medida#																																	
					sdmx-dimension:	http://purl.org/linked-data/sdmx/2009/dimension#
Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos – Jornadas IECA
Cubo de población según edad (por distrito y sexo)
<http://vocab.ciudadesabiertas.es/recurso/demografia/padron-municipal/DSD_PoblacionPorEdad> a qb:DataStructureDefinition ;
rdfs:label "Estructura de los cubos de datos que se corresponden con el conjunto de datos de padrón municipal de la ciudad Madrid,
en este archivo se detalla el número de habitantes según su sexo, rango de edad y el área donde reside"@es ;
skos:notation "DSD_PoblacionPorEdad" .
2) Definición de la estructura de datos
<http://vocab.ciudadesabiertas.es/recurso/demografia/padron-municipal/DS_PoblacionPorEdad> a qb:DataSet ;
qb:structure <http://vocab.ciudadesabiertas.es/recurso/demografia/padron-municipal/DSD_PoblacionPoblacionPorEdad> .
1) Definición del conjunto de datos
<http://vocab.ciudadesabiertas.es/recurso/demografia/padron-municipal/DSD_PoblacionPorEdad> qb:component _:node1egmfx1 .
_:node1egmfx1 qb:dimension sdmx-dimension:sex .
<http://vocab.ciudadesabiertas.es/recurso/demografia/padron-municipal/DSD_PoblacionPorEdad> qb:component _:node1egmfx2 .
_:node1egmfx2 qb:dimension sdmx-dimension:refArea .
<http://vocab.ciudadesabiertas.es/recurso/demografia/padron-municipal/DSD_PoblacionPorEdad> qb:component _:node1egmfx3 .
_:node1egmfx3 qb:dimension sdmx-dimension:refPeriod .
<http://vocab.ciudadesabiertas.es/recurso/demografia/padron-municipal/DSD_PoblacionPorEdad> qb:component _:node1egmfx4 .
_:node1egmfx4 qb:dimension iaest-dimension:edad-grupos-quinquenales.
2.1) Definición de las dimensiones de la estructura de datos
<http://vocab.ciudadesabiertas.es/recurso/demografia/padron-municipal/DSD_PoblacionPorEdad> qb:component _:node1egmfx5 .
_:node1egmfx5 qb:measure espad-measure:numero-personas.
2.2) Definición de las medidas de la estructura de datos
Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos – Jornadas IECA
Distrito
Total
Rango de
20 a 24
Centro 2731,00
Arganzuela 3294,00
Retiro 2478,00
Salasanca 3466,00
Chamartín 3217,00
Latina 5770,00
Cubo de población según edad (por distrito y sexo)
<http://vocab.ciudadesabiertas.es/recurso/demografia/padron-muinicipal/a209fd32c10cf5d06e4e6aedf8b81950b4e981f3> a
qb:Observation ;
qb:dataSet <http://vocab.ciudadesabiertas.es/recurso/demografia/padron-muinicipal/DS_PoblacionPorEdad> ;
sdmx-dimension:refArea <http://vocab.ciudadesabiertas.es/recurso/territorio/distrito/Centro> ;
sdmx-dimension:refPeriod <http://reference.data.gov.uk/id/year/2019> ;
espad-medida:numero-personas ”2731"^^xsd:int ;
sdmx-dimension:sexo <http://purl.org/linked-data/sdmx/2009/code#sex-M> ;
iaest-dimension:edad-grupos-quinquenales <https://opendata.aragon.es/kos/iaest/edad-grupos-quinquenales/20-a-24> .
3) Definición de una observación del Dataset
Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos – Jornadas IECA
Ejemplos de consultas
1.  Número de hombres del rango de edad de 20 a 24 años que habitan en el distrito
Centro en el año 2019
PREFIX kos-year: <http://reference.data.gov.uk/id/year/>
PREFIX espad-medida: <http://vocab.ciudadesabiertas.es/def/demografia/padron-municipal/medida#>
PREFIX sdmx-dimension: <http://purl.org/linked-data/sdmx/2009/dimension#>
PREFIX iaest-dimension: <http://opendata.aragon.es/def/iaest/dimension#>
PREFIX qb: <http://purl.org/linked-data/cube#>
PREFIX kos-iaest : <http://opendata.aragon.es/kos/iaest/>
PREFIX sdmx-code : <http://purl.org/linked-data/sdmx/2009/code#>
SELECT (?x AS ?numeroHombres) WHERE {
?obs a qb:Observation ;
sdmx-dimension:refArea <http://vocab.ciudadesabiertas.es/recurso/territorio/distrito/Centro> ;
sdmx-dimension:refPeriod kos-year:2019 ;
sdmx-dimension:sex sdmx-code:sex-M ;
iaest-dimension:edad-grupos-quinquenales kos-iaest:edad-grupos-quinquenales/20-a-24 ;
espad-medida:numero-personas ?x ;
qb:dataSet <http://vocab.ciudadesabiertas.es/recurso/demografia/padron-municipal/DS_PoblacionPorEdad> .
}
numeroHombres
2731,00
Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos – Jornadas IECA
Ejemplos de consultas
2.  Total de hombres del rango de edad de 20 a 24 años que habitan en Madrid en el
año 2019
PREFIX kos-year: <http://reference.data.gov.uk/id/year/>
PREFIX espad-medida: <http://vocab.ciudadesabiertas.es/def/demografia/padron-municipal/medida#>
PREFIX sdmx-dimension: <http://purl.org/linked-data/sdmx/2009/dimension#>
PREFIX iaest-dimension: <http://opendata.aragon.es/def/iaest/dimension#>
PREFIX qb: <http://purl.org/linked-data/cube#>
PREFIX kos-iaest : <http://opendata.aragon.es/kos/iaest/>
PREFIX sdmx-code : <http://purl.org/linked-data/sdmx/2009/code#>
SELECT (SUM(?x) AS ?totalHombres) WHERE {
?obs a qb:Observation ;
sdmx-dimension:refPeriod kos-year:2019 ;
sdmx-dimension:sex sdmx-code:sex-M ;
iaest-dimension:edad-grupos-quinquenales kos-iaest:edad-grupos-quinquenales/20-a-24 ;
espad-medida:numero-personas ?x ;
qb:dataSet <http://vocab.ciudadesabiertas.es/recurso/demografia/padron-municipal/DS_PoblacionPorEdad> .
}
totalHombres
2731,00
Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos – Jornadas IECA
Estructura de la charla
•  Un ejemplo de publicación de datos estadísticos más
allá de los ficheros (Aragón - IAEST)
•  Nuestro trabajo en la publicación de datos derivados
del padrón por parte de las ciudades
•  Algunas recomendaciones finales
53
Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos – Jornadas IECA
El mensaje principal de esta charla
•  Para facilitar la reutilización de los datos estadísticos y
geográficos, debemos evolucionar en la publicación:
•  De la publicación de ficheros (PC-Axis, CSV) a la publicación
adicional de APIs y grafos de conocimientos
•  Más flexibilidad a la hora de consultar los datos que me interesan
(ej: los de un municipio, o un distrito)
•  Facilidad para insertar visualizaciones en mi página Web
•  Enlazando con grafos de conocimientos internos y externos:
•  Datos geográficos (por ejemplo, datos.ign.es)
•  Consultas más ricas/complejas, sin islas de datos aisladas
•  Reutilización interna de los datos
•  Tesauros comunes (por ejemplo, INEBase, RAMON)
•  Deberían también estar publicados como Linked Data
•  Facilita comparaciones, creación de visualizaciones, etc.
•  Wikidata
•  Aquí es donde mucha gente mira
54
Oscar Corcho
Ontology Engineering Group, Universidad Politécnica de Madrid

Basado en materiales realizados con la colaboración de 

Paola Espinoza, Idafen Santana-Pérez, 

Hugo Lafuente, Juan Carlos Ballesteros, Esther Minguela, 

David Portolés, César Cano y Alfredo Peris

Jornadas IECA: Difusión, accesibilidad y reutilizaciónde la
estadística y cartografía oficial
Adiós a los ficheros
Hola a los grafos de
conocimientos estadísticos 
ocorcho@fi.upm.es
@ocorcho
25/11/2019
Jornadas IECA

Más contenido relacionado

Similar a Adiós a los ficheros, hola a los grafos de conocimientos estadísticos

IX Encuentros de Centros de Documentación de Arte Contemporáneo en Artium - O...
IX Encuentros de Centros de Documentación de Arte Contemporáneo en Artium - O...IX Encuentros de Centros de Documentación de Arte Contemporáneo en Artium - O...
IX Encuentros de Centros de Documentación de Arte Contemporáneo en Artium - O...Artium Vitoria
 
Presentación de la red de excelencia de Open Data y Smart Cities
Presentación de la red de excelencia de Open Data y Smart CitiesPresentación de la red de excelencia de Open Data y Smart Cities
Presentación de la red de excelencia de Open Data y Smart CitiesOscar Corcho
 
Curso Aragón Open Data Pool: usuarios técnicos
Curso Aragón Open Data Pool: usuarios técnicosCurso Aragón Open Data Pool: usuarios técnicos
Curso Aragón Open Data Pool: usuarios técnicosAragón Open Data
 
e-Infraestructuras y datos
e-Infraestructuras y datose-Infraestructuras y datos
e-Infraestructuras y datosVictor Castelo
 
Presentación Proyecto PLATICA.pdf
Presentación Proyecto PLATICA.pdfPresentación Proyecto PLATICA.pdf
Presentación Proyecto PLATICA.pdfAndres Prado
 
Jordi Serrano Indicadores En Up Commons Fesabid 09
Jordi Serrano  Indicadores En Up Commons Fesabid 09Jordi Serrano  Indicadores En Up Commons Fesabid 09
Jordi Serrano Indicadores En Up Commons Fesabid 09FESABID
 
Catalogo Colectivo de Filmotecas Iberoamericanas
Catalogo Colectivo de Filmotecas IberoamericanasCatalogo Colectivo de Filmotecas Iberoamericanas
Catalogo Colectivo de Filmotecas IberoamericanasAna Ordás
 
Repositorio Digital Agricola y Dspace
Repositorio Digital Agricola y DspaceRepositorio Digital Agricola y Dspace
Repositorio Digital Agricola y DspaceLiz Pagan
 
Nuevo glosario E-Science
Nuevo glosario E-ScienceNuevo glosario E-Science
Nuevo glosario E-Sciencerafavilwebsoc
 
Arquitectura de Data Fabric: Clave en proyectos de Big Data y Machine Learning
Arquitectura de Data Fabric: Clave en proyectos de Big Data y Machine LearningArquitectura de Data Fabric: Clave en proyectos de Big Data y Machine Learning
Arquitectura de Data Fabric: Clave en proyectos de Big Data y Machine LearningDenodo
 
Aleix peset hoja de ruta 5 oct
Aleix peset hoja de ruta 5 octAleix peset hoja de ruta 5 oct
Aleix peset hoja de ruta 5 octmaredata
 
OGC Testbed 11: ¿Es SPARQL la clave para la interoperabilidad?
OGC Testbed 11: ¿Es SPARQL la clave para la interoperabilidad?OGC Testbed 11: ¿Es SPARQL la clave para la interoperabilidad?
OGC Testbed 11: ¿Es SPARQL la clave para la interoperabilidad?Francisco J. Lopez-Pellicer
 
La plataforma Latttes en el Ecuador-Trávez
La plataforma Latttes en el Ecuador-TrávezLa plataforma Latttes en el Ecuador-Trávez
La plataforma Latttes en el Ecuador-TrávezLatindex
 

Similar a Adiós a los ficheros, hola a los grafos de conocimientos estadísticos (20)

IX Encuentros de Centros de Documentación de Arte Contemporáneo en Artium - O...
IX Encuentros de Centros de Documentación de Arte Contemporáneo en Artium - O...IX Encuentros de Centros de Documentación de Arte Contemporáneo en Artium - O...
IX Encuentros de Centros de Documentación de Arte Contemporáneo en Artium - O...
 
Presentación de la red de excelencia de Open Data y Smart Cities
Presentación de la red de excelencia de Open Data y Smart CitiesPresentación de la red de excelencia de Open Data y Smart Cities
Presentación de la red de excelencia de Open Data y Smart Cities
 
Curso Aragón Open Data Pool: usuarios técnicos
Curso Aragón Open Data Pool: usuarios técnicosCurso Aragón Open Data Pool: usuarios técnicos
Curso Aragón Open Data Pool: usuarios técnicos
 
e-Infraestructuras y datos
e-Infraestructuras y datose-Infraestructuras y datos
e-Infraestructuras y datos
 
Anatomía de un proyecto de Big Data
Anatomía de un proyecto de Big DataAnatomía de un proyecto de Big Data
Anatomía de un proyecto de Big Data
 
Presentación Proyecto PLATICA.pdf
Presentación Proyecto PLATICA.pdfPresentación Proyecto PLATICA.pdf
Presentación Proyecto PLATICA.pdf
 
Jordi Serrano Indicadores En Up Commons Fesabid 09
Jordi Serrano  Indicadores En Up Commons Fesabid 09Jordi Serrano  Indicadores En Up Commons Fesabid 09
Jordi Serrano Indicadores En Up Commons Fesabid 09
 
Catalogo Colectivo de Filmotecas Iberoamericanas
Catalogo Colectivo de Filmotecas IberoamericanasCatalogo Colectivo de Filmotecas Iberoamericanas
Catalogo Colectivo de Filmotecas Iberoamericanas
 
Repositorio Digital Agricola y Dspace
Repositorio Digital Agricola y DspaceRepositorio Digital Agricola y Dspace
Repositorio Digital Agricola y Dspace
 
DSpace Workshop
DSpace Workshop DSpace Workshop
DSpace Workshop
 
Presentación: manejo y almacenamiento de bases de datos
Presentación: manejo y almacenamiento de bases de datosPresentación: manejo y almacenamiento de bases de datos
Presentación: manejo y almacenamiento de bases de datos
 
LibLink (Library Linkages): Estrategias, proyectos y acciones 2013-2014
LibLink (Library Linkages): Estrategias, proyectos y acciones 2013-2014LibLink (Library Linkages): Estrategias, proyectos y acciones 2013-2014
LibLink (Library Linkages): Estrategias, proyectos y acciones 2013-2014
 
Portal de la Recerca de Catalunya
Portal de la Recerca de CatalunyaPortal de la Recerca de Catalunya
Portal de la Recerca de Catalunya
 
El área de Ciencia Abierta del CSUC
El área de Ciencia Abierta del CSUCEl área de Ciencia Abierta del CSUC
El área de Ciencia Abierta del CSUC
 
Nuevo glosario E-Science
Nuevo glosario E-ScienceNuevo glosario E-Science
Nuevo glosario E-Science
 
Arquitectura de Data Fabric: Clave en proyectos de Big Data y Machine Learning
Arquitectura de Data Fabric: Clave en proyectos de Big Data y Machine LearningArquitectura de Data Fabric: Clave en proyectos de Big Data y Machine Learning
Arquitectura de Data Fabric: Clave en proyectos de Big Data y Machine Learning
 
Aleix peset hoja de ruta 5 oct
Aleix peset hoja de ruta 5 octAleix peset hoja de ruta 5 oct
Aleix peset hoja de ruta 5 oct
 
OGC Testbed 11: ¿Es SPARQL la clave para la interoperabilidad?
OGC Testbed 11: ¿Es SPARQL la clave para la interoperabilidad?OGC Testbed 11: ¿Es SPARQL la clave para la interoperabilidad?
OGC Testbed 11: ¿Es SPARQL la clave para la interoperabilidad?
 
Aspectos técnicos de SeDiCI
Aspectos técnicos de SeDiCIAspectos técnicos de SeDiCI
Aspectos técnicos de SeDiCI
 
La plataforma Latttes en el Ecuador-Trávez
La plataforma Latttes en el Ecuador-TrávezLa plataforma Latttes en el Ecuador-Trávez
La plataforma Latttes en el Ecuador-Trávez
 

Más de Oscar Corcho

Organisational Interoperability in Practice at Universidad Politécnica de Madrid
Organisational Interoperability in Practice at Universidad Politécnica de MadridOrganisational Interoperability in Practice at Universidad Politécnica de Madrid
Organisational Interoperability in Practice at Universidad Politécnica de MadridOscar Corcho
 
Introducción a los Datos Abiertos - Open Data Day 2020
Introducción a los Datos Abiertos - Open Data Day 2020Introducción a los Datos Abiertos - Open Data Day 2020
Introducción a los Datos Abiertos - Open Data Day 2020Oscar Corcho
 
Open Data (and Software, and other Research Artefacts) - A proper management
Open Data (and Software, and other Research Artefacts) -A proper managementOpen Data (and Software, and other Research Artefacts) -A proper management
Open Data (and Software, and other Research Artefacts) - A proper management Oscar Corcho
 
Ontology Engineering at Scale for Open City Data Sharing
Ontology Engineering at Scale for Open City Data SharingOntology Engineering at Scale for Open City Data Sharing
Ontology Engineering at Scale for Open City Data SharingOscar Corcho
 
Situación de las iniciativas de Open Data internacionales (y algunas recomen...
Situación de las iniciativas de Open Data internacionales (y algunas recomen...Situación de las iniciativas de Open Data internacionales (y algunas recomen...
Situación de las iniciativas de Open Data internacionales (y algunas recomen...Oscar Corcho
 
STARS4ALL - Contaminación Lumínica
STARS4ALL - Contaminación LumínicaSTARS4ALL - Contaminación Lumínica
STARS4ALL - Contaminación LumínicaOscar Corcho
 
Towards Reproducible Science: a few building blocks from my personal experience
Towards Reproducible Science: a few building blocks from my personal experienceTowards Reproducible Science: a few building blocks from my personal experience
Towards Reproducible Science: a few building blocks from my personal experienceOscar Corcho
 
Publishing Linked Statistical Data: Aragón, a case study
Publishing Linked Statistical Data: Aragón, a case studyPublishing Linked Statistical Data: Aragón, a case study
Publishing Linked Statistical Data: Aragón, a case studyOscar Corcho
 
An initial analysis of topic-based similarity among scientific documents base...
An initial analysis of topic-based similarity among scientific documents base...An initial analysis of topic-based similarity among scientific documents base...
An initial analysis of topic-based similarity among scientific documents base...Oscar Corcho
 
Linked Statistical Data 101
Linked Statistical Data 101Linked Statistical Data 101
Linked Statistical Data 101Oscar Corcho
 
Aplicando los principios de Linked Data en AEMET
Aplicando los principios de Linked Data en AEMETAplicando los principios de Linked Data en AEMET
Aplicando los principios de Linked Data en AEMET Oscar Corcho
 
Ojo Al Data 100 - Call for sharing session at IODC 2016
Ojo Al Data 100 - Call for sharing session at IODC 2016Ojo Al Data 100 - Call for sharing session at IODC 2016
Ojo Al Data 100 - Call for sharing session at IODC 2016Oscar Corcho
 
Educando sobre datos abiertos: desde el colegio a la universidad
Educando sobre datos abiertos: desde el colegio a la universidadEducando sobre datos abiertos: desde el colegio a la universidad
Educando sobre datos abiertos: desde el colegio a la universidadOscar Corcho
 
STARS4ALL general presentation at ALAN2016
STARS4ALL general presentation at ALAN2016STARS4ALL general presentation at ALAN2016
STARS4ALL general presentation at ALAN2016Oscar Corcho
 
Why do they call it Linked Data when they want to say...?
Why do they call it Linked Data when they want to say...?Why do they call it Linked Data when they want to say...?
Why do they call it Linked Data when they want to say...?Oscar Corcho
 
Linked Statistical Data: does it actually pay off?
Linked Statistical Data: does it actually pay off?Linked Statistical Data: does it actually pay off?
Linked Statistical Data: does it actually pay off?Oscar Corcho
 
Slow-cooked data and APIs in the world of Big Data: the view from a city per...
Slow-cooked data and APIs in the world of Big Data: the view from a city per...Slow-cooked data and APIs in the world of Big Data: the view from a city per...
Slow-cooked data and APIs in the world of Big Data: the view from a city per...Oscar Corcho
 
Research Objects for improved sharing and reproducibility
Research Objects for improved sharing and reproducibilityResearch Objects for improved sharing and reproducibility
Research Objects for improved sharing and reproducibilityOscar Corcho
 
(Big) Data (Science) Skills
(Big) Data (Science) Skills(Big) Data (Science) Skills
(Big) Data (Science) SkillsOscar Corcho
 
Big Data - El Futuro a través de los Datos
Big Data - El Futuro a través de los DatosBig Data - El Futuro a través de los Datos
Big Data - El Futuro a través de los DatosOscar Corcho
 

Más de Oscar Corcho (20)

Organisational Interoperability in Practice at Universidad Politécnica de Madrid
Organisational Interoperability in Practice at Universidad Politécnica de MadridOrganisational Interoperability in Practice at Universidad Politécnica de Madrid
Organisational Interoperability in Practice at Universidad Politécnica de Madrid
 
Introducción a los Datos Abiertos - Open Data Day 2020
Introducción a los Datos Abiertos - Open Data Day 2020Introducción a los Datos Abiertos - Open Data Day 2020
Introducción a los Datos Abiertos - Open Data Day 2020
 
Open Data (and Software, and other Research Artefacts) - A proper management
Open Data (and Software, and other Research Artefacts) -A proper managementOpen Data (and Software, and other Research Artefacts) -A proper management
Open Data (and Software, and other Research Artefacts) - A proper management
 
Ontology Engineering at Scale for Open City Data Sharing
Ontology Engineering at Scale for Open City Data SharingOntology Engineering at Scale for Open City Data Sharing
Ontology Engineering at Scale for Open City Data Sharing
 
Situación de las iniciativas de Open Data internacionales (y algunas recomen...
Situación de las iniciativas de Open Data internacionales (y algunas recomen...Situación de las iniciativas de Open Data internacionales (y algunas recomen...
Situación de las iniciativas de Open Data internacionales (y algunas recomen...
 
STARS4ALL - Contaminación Lumínica
STARS4ALL - Contaminación LumínicaSTARS4ALL - Contaminación Lumínica
STARS4ALL - Contaminación Lumínica
 
Towards Reproducible Science: a few building blocks from my personal experience
Towards Reproducible Science: a few building blocks from my personal experienceTowards Reproducible Science: a few building blocks from my personal experience
Towards Reproducible Science: a few building blocks from my personal experience
 
Publishing Linked Statistical Data: Aragón, a case study
Publishing Linked Statistical Data: Aragón, a case studyPublishing Linked Statistical Data: Aragón, a case study
Publishing Linked Statistical Data: Aragón, a case study
 
An initial analysis of topic-based similarity among scientific documents base...
An initial analysis of topic-based similarity among scientific documents base...An initial analysis of topic-based similarity among scientific documents base...
An initial analysis of topic-based similarity among scientific documents base...
 
Linked Statistical Data 101
Linked Statistical Data 101Linked Statistical Data 101
Linked Statistical Data 101
 
Aplicando los principios de Linked Data en AEMET
Aplicando los principios de Linked Data en AEMETAplicando los principios de Linked Data en AEMET
Aplicando los principios de Linked Data en AEMET
 
Ojo Al Data 100 - Call for sharing session at IODC 2016
Ojo Al Data 100 - Call for sharing session at IODC 2016Ojo Al Data 100 - Call for sharing session at IODC 2016
Ojo Al Data 100 - Call for sharing session at IODC 2016
 
Educando sobre datos abiertos: desde el colegio a la universidad
Educando sobre datos abiertos: desde el colegio a la universidadEducando sobre datos abiertos: desde el colegio a la universidad
Educando sobre datos abiertos: desde el colegio a la universidad
 
STARS4ALL general presentation at ALAN2016
STARS4ALL general presentation at ALAN2016STARS4ALL general presentation at ALAN2016
STARS4ALL general presentation at ALAN2016
 
Why do they call it Linked Data when they want to say...?
Why do they call it Linked Data when they want to say...?Why do they call it Linked Data when they want to say...?
Why do they call it Linked Data when they want to say...?
 
Linked Statistical Data: does it actually pay off?
Linked Statistical Data: does it actually pay off?Linked Statistical Data: does it actually pay off?
Linked Statistical Data: does it actually pay off?
 
Slow-cooked data and APIs in the world of Big Data: the view from a city per...
Slow-cooked data and APIs in the world of Big Data: the view from a city per...Slow-cooked data and APIs in the world of Big Data: the view from a city per...
Slow-cooked data and APIs in the world of Big Data: the view from a city per...
 
Research Objects for improved sharing and reproducibility
Research Objects for improved sharing and reproducibilityResearch Objects for improved sharing and reproducibility
Research Objects for improved sharing and reproducibility
 
(Big) Data (Science) Skills
(Big) Data (Science) Skills(Big) Data (Science) Skills
(Big) Data (Science) Skills
 
Big Data - El Futuro a través de los Datos
Big Data - El Futuro a través de los DatosBig Data - El Futuro a través de los Datos
Big Data - El Futuro a través de los Datos
 

Último

Boletin 1077 - Tramitación - Ley Integral Contra La Violencia Hacia Las Mujeres
Boletin 1077 - Tramitación - Ley Integral Contra La Violencia Hacia Las MujeresBoletin 1077 - Tramitación - Ley Integral Contra La Violencia Hacia Las Mujeres
Boletin 1077 - Tramitación - Ley Integral Contra La Violencia Hacia Las MujeresBaker Publishing Company
 
Plan de Desarrollo y Ordenamiento Territorial de Imbabura.pptx
Plan de Desarrollo y Ordenamiento Territorial de Imbabura.pptxPlan de Desarrollo y Ordenamiento Territorial de Imbabura.pptx
Plan de Desarrollo y Ordenamiento Territorial de Imbabura.pptxAndresUrieta2
 
Descentralización Y Desarrollo Territorial.pdf
Descentralización Y Desarrollo Territorial.pdfDescentralización Y Desarrollo Territorial.pdf
Descentralización Y Desarrollo Territorial.pdfanibalcetrero
 
HACIEDA MUNICIPAL 1ER TRIMESTRE 2024.pdf
HACIEDA MUNICIPAL 1ER TRIMESTRE 2024.pdfHACIEDA MUNICIPAL 1ER TRIMESTRE 2024.pdf
HACIEDA MUNICIPAL 1ER TRIMESTRE 2024.pdfvany25ck
 
UNIDAD 3.1, 3.2 y 3.3 3.5 FUNCIÓN PÚBLICA 2.pptx
UNIDAD 3.1, 3.2 y 3.3 3.5 FUNCIÓN PÚBLICA 2.pptxUNIDAD 3.1, 3.2 y 3.3 3.5 FUNCIÓN PÚBLICA 2.pptx
UNIDAD 3.1, 3.2 y 3.3 3.5 FUNCIÓN PÚBLICA 2.pptxMERCEDESCHABLE
 
UNIDAD DIDÁCTICA MAYO TERCER GRADO (2).docx
UNIDAD DIDÁCTICA MAYO TERCER GRADO (2).docxUNIDAD DIDÁCTICA MAYO TERCER GRADO (2).docx
UNIDAD DIDÁCTICA MAYO TERCER GRADO (2).docxanaalmeyda1998
 
Revista Ejército nº 989 mar-abr 2024.pdf
Revista Ejército nº 989 mar-abr 2024.pdfRevista Ejército nº 989 mar-abr 2024.pdf
Revista Ejército nº 989 mar-abr 2024.pdfEjército de Tierra
 
UNIDAD II - CURSO DE DERECHO ADMINISTRATIVO (Parte I) (1).pdf
UNIDAD II - CURSO DE DERECHO ADMINISTRATIVO (Parte I) (1).pdfUNIDAD II - CURSO DE DERECHO ADMINISTRATIVO (Parte I) (1).pdf
UNIDAD II - CURSO DE DERECHO ADMINISTRATIVO (Parte I) (1).pdfELIAMARYTOVARFLOREZD
 
Pensamiento administrativo público en alemania
Pensamiento administrativo público en alemaniaPensamiento administrativo público en alemania
Pensamiento administrativo público en alemaniaReivajZelznog
 
PLAN DE MEJORA DE BIOSEGURIDAD EN HOSPITALES.pptx
PLAN DE MEJORA DE BIOSEGURIDAD EN  HOSPITALES.pptxPLAN DE MEJORA DE BIOSEGURIDAD EN  HOSPITALES.pptx
PLAN DE MEJORA DE BIOSEGURIDAD EN HOSPITALES.pptxLuzIreneBancesGuevar
 
Radar de algoritmos de IA y procesos de decisión automatizada para el acceso ...
Radar de algoritmos de IA y procesos de decisión automatizada para el acceso ...Radar de algoritmos de IA y procesos de decisión automatizada para el acceso ...
Radar de algoritmos de IA y procesos de decisión automatizada para el acceso ...m4Social
 
Programa electoral de Vox para las elecciones catalanas
Programa electoral de Vox para las elecciones catalanasPrograma electoral de Vox para las elecciones catalanas
Programa electoral de Vox para las elecciones catalanasluarodalegre97
 
Día Mundial de la Seguridad y Salud en el Trabajo 2024, 28 de abril - Cambio ...
Día Mundial de la Seguridad y Salud en el Trabajo 2024, 28 de abril - Cambio ...Día Mundial de la Seguridad y Salud en el Trabajo 2024, 28 de abril - Cambio ...
Día Mundial de la Seguridad y Salud en el Trabajo 2024, 28 de abril - Cambio ...Christina Parmionova
 
La tributación municipal en el Perú y sus pasos
La tributación municipal en el Perú y sus pasosLa tributación municipal en el Perú y sus pasos
La tributación municipal en el Perú y sus pasosChristianFernndez41
 
Decreto Ejecutivo 255 Reglamento de Seguridad y Salud en el Trabajo
Decreto Ejecutivo 255 Reglamento de Seguridad y Salud en el TrabajoDecreto Ejecutivo 255 Reglamento de Seguridad y Salud en el Trabajo
Decreto Ejecutivo 255 Reglamento de Seguridad y Salud en el TrabajoPrevencionar
 
manejo de encaste en ovinos pdti indap PLC
manejo de encaste en ovinos pdti indap PLCmanejo de encaste en ovinos pdti indap PLC
manejo de encaste en ovinos pdti indap PLCMarceloAlvarez76065
 

Último (16)

Boletin 1077 - Tramitación - Ley Integral Contra La Violencia Hacia Las Mujeres
Boletin 1077 - Tramitación - Ley Integral Contra La Violencia Hacia Las MujeresBoletin 1077 - Tramitación - Ley Integral Contra La Violencia Hacia Las Mujeres
Boletin 1077 - Tramitación - Ley Integral Contra La Violencia Hacia Las Mujeres
 
Plan de Desarrollo y Ordenamiento Territorial de Imbabura.pptx
Plan de Desarrollo y Ordenamiento Territorial de Imbabura.pptxPlan de Desarrollo y Ordenamiento Territorial de Imbabura.pptx
Plan de Desarrollo y Ordenamiento Territorial de Imbabura.pptx
 
Descentralización Y Desarrollo Territorial.pdf
Descentralización Y Desarrollo Territorial.pdfDescentralización Y Desarrollo Territorial.pdf
Descentralización Y Desarrollo Territorial.pdf
 
HACIEDA MUNICIPAL 1ER TRIMESTRE 2024.pdf
HACIEDA MUNICIPAL 1ER TRIMESTRE 2024.pdfHACIEDA MUNICIPAL 1ER TRIMESTRE 2024.pdf
HACIEDA MUNICIPAL 1ER TRIMESTRE 2024.pdf
 
UNIDAD 3.1, 3.2 y 3.3 3.5 FUNCIÓN PÚBLICA 2.pptx
UNIDAD 3.1, 3.2 y 3.3 3.5 FUNCIÓN PÚBLICA 2.pptxUNIDAD 3.1, 3.2 y 3.3 3.5 FUNCIÓN PÚBLICA 2.pptx
UNIDAD 3.1, 3.2 y 3.3 3.5 FUNCIÓN PÚBLICA 2.pptx
 
UNIDAD DIDÁCTICA MAYO TERCER GRADO (2).docx
UNIDAD DIDÁCTICA MAYO TERCER GRADO (2).docxUNIDAD DIDÁCTICA MAYO TERCER GRADO (2).docx
UNIDAD DIDÁCTICA MAYO TERCER GRADO (2).docx
 
Revista Ejército nº 989 mar-abr 2024.pdf
Revista Ejército nº 989 mar-abr 2024.pdfRevista Ejército nº 989 mar-abr 2024.pdf
Revista Ejército nº 989 mar-abr 2024.pdf
 
UNIDAD II - CURSO DE DERECHO ADMINISTRATIVO (Parte I) (1).pdf
UNIDAD II - CURSO DE DERECHO ADMINISTRATIVO (Parte I) (1).pdfUNIDAD II - CURSO DE DERECHO ADMINISTRATIVO (Parte I) (1).pdf
UNIDAD II - CURSO DE DERECHO ADMINISTRATIVO (Parte I) (1).pdf
 
Pensamiento administrativo público en alemania
Pensamiento administrativo público en alemaniaPensamiento administrativo público en alemania
Pensamiento administrativo público en alemania
 
PLAN DE MEJORA DE BIOSEGURIDAD EN HOSPITALES.pptx
PLAN DE MEJORA DE BIOSEGURIDAD EN  HOSPITALES.pptxPLAN DE MEJORA DE BIOSEGURIDAD EN  HOSPITALES.pptx
PLAN DE MEJORA DE BIOSEGURIDAD EN HOSPITALES.pptx
 
Radar de algoritmos de IA y procesos de decisión automatizada para el acceso ...
Radar de algoritmos de IA y procesos de decisión automatizada para el acceso ...Radar de algoritmos de IA y procesos de decisión automatizada para el acceso ...
Radar de algoritmos de IA y procesos de decisión automatizada para el acceso ...
 
Programa electoral de Vox para las elecciones catalanas
Programa electoral de Vox para las elecciones catalanasPrograma electoral de Vox para las elecciones catalanas
Programa electoral de Vox para las elecciones catalanas
 
Día Mundial de la Seguridad y Salud en el Trabajo 2024, 28 de abril - Cambio ...
Día Mundial de la Seguridad y Salud en el Trabajo 2024, 28 de abril - Cambio ...Día Mundial de la Seguridad y Salud en el Trabajo 2024, 28 de abril - Cambio ...
Día Mundial de la Seguridad y Salud en el Trabajo 2024, 28 de abril - Cambio ...
 
La tributación municipal en el Perú y sus pasos
La tributación municipal en el Perú y sus pasosLa tributación municipal en el Perú y sus pasos
La tributación municipal en el Perú y sus pasos
 
Decreto Ejecutivo 255 Reglamento de Seguridad y Salud en el Trabajo
Decreto Ejecutivo 255 Reglamento de Seguridad y Salud en el TrabajoDecreto Ejecutivo 255 Reglamento de Seguridad y Salud en el Trabajo
Decreto Ejecutivo 255 Reglamento de Seguridad y Salud en el Trabajo
 
manejo de encaste en ovinos pdti indap PLC
manejo de encaste en ovinos pdti indap PLCmanejo de encaste en ovinos pdti indap PLC
manejo de encaste en ovinos pdti indap PLC
 

Adiós a los ficheros, hola a los grafos de conocimientos estadísticos

  • 1. Oscar Corcho Ontology Engineering Group, Universidad Politécnica de Madrid Basado en materiales realizados con la colaboración de 
 Paola Espinoza, Idafen Santana-Pérez, 
 Hugo Lafuente, Juan Carlos Ballesteros, Esther Minguela, 
 David Portolés, César Cano y Alfredo Peris Jornadas IECA: Difusión, accesibilidad y reutilizaciónde la estadística y cartografía oficial Adiós a los ficheros Hola a los grafos de conocimientos estadísticos ocorcho@fi.upm.es @ocorcho 25/11/2019 Jornadas IECA
  • 2. Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos – Jornadas IECA License •  This work is licensed under the license 
 CC BY-NC-SA 4.0 International •  http://purl.org/NET/rdflicense/cc-by-nc-sa4.0 •  You are free: •  to Share — to copy, distribute and transmit the work •  to Remix — to adapt the work •  Under the following conditions •  Attribution — You must attribute the work by inserting •  “[source Oscar Corcho]” at the footer of each reused slide •  a credits slide stating: “These slides are partially based on “Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos” by O. Corcho” •  Non-commercial •  Share-Alike 2
  • 3. Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos – Jornadas IECA El mensaje principal de esta charla •  Si queremos facilitar la reutilización de los datos estadísticos y geográficos, debemos evolucionar en la forma de publicar estos datos: •  De la publicación de ficheros (PC-Axis, CSV) a la publicación adicional de APIs y grafos de conocimientos •  Enlazando con grafos de conocimientos internos y externos: •  Datos geográficos (por ejemplo, datos.ign.es) •  Tesauros comunes (por ejemplo, INEBase, RAMON) •  Wikidata 3
  • 4. Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos – Jornadas IECA Estructura de la charla •  Un ejemplo de publicación de datos estadísticos más allá de los ficheros (Aragón - IAEST) •  Nuestro trabajo en la publicación de datos derivados del padrón por parte de las ciudades •  Algunas recomendaciones finales 4
  • 5. Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos – Jornadas IECA IAEST. De ficheros a APIs y Linked Data 5 §  IAEst: Instituto Aragonés de Estadística o  http://www.aragon.es/iaest o  Datos abiertos ofrecidos a través de: •  Portal de datos abiertos de Aragón -  http://opendata.aragon.es/ •  Su propio portal (nuestro interés se centra en la parte de “estadística local”)
  • 6. Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos – Jornadas IECA Contexto: Infraestructura de datos del IAEst (2016) 7 §  Infraestructura existente o  Data warehouse basado en Oracle BI o  Exportaciones en diferentes formatos, incluyendo CSVs
  • 7. Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos – Jornadas IECA Contexto: Infraestructura de datos del IAEst (2016) 9 §  Infraestructura existente o  Data warehouse basado en Oracle BI o  Exportaciones en diferentes formatos, incluyendo CSVs o  https://www.aragon.es/-/estadistica-local §  Navegación y obtención de datos o  Basada en una taxonomía o  Filtros fijos, codificados en 
 la aplicación o  El usuario selecciona: •  División administrativa •  Municipio •  Estructura de carpetas o  Datos e HTML, PDF, CSV
  • 8. Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos – Jornadas IECA Informes prediseñados, ofrecidos por Oracle BI Aplicación Web de Estadística Local Contexto: Infraestructura de datos del IAEst (2016)
  • 9. Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos – Jornadas IECA Contexto: Infraestructura de datos del IAEst (2016) §  En la Web del IAEst o  http://www.aragon.es/DepartamentosOrganismosPublicos/ Institutos/InstitutoAragonesEstadistica/AreasGenericas/ ci.EstadisticaLocal.detalleDepartamento §  En OpenDataAragón o  http://opendata.aragon.es/catalogo/edificios-superficie-y- vivienda-comarcas
  • 10. Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos – Jornadas IECA Objetivos del trabajo realizado 15 Extraer los informes estadísticos (ficheros), transformarlos a RDF de acuerdo con estándares del W3C, “refinarlos”, enlazarlos con datos enlazados de Aragón (fundamentalmente URIs de municipios y regiones) y proporcionar una API y un interfaz de usuario nuevo para utilizarlos
  • 11. Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos – Jornadas IECA W3C Data Cube (basado en SDMX) 1616 http://www.w3.org/TR/vocab-data-cube/ Publicación de datos multi-dimensionales en la Web
  • 12. Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos – Jornadas IECA W3C Data Cube (basado en SDMX) 1717
  • 13. Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos – Jornadas IECA Resultados 19 §  Un proceso de transformación más fácil de mantener o  Enriquece las APIs Linked Data de Aragón o  Uso de GitHub para •  Control de versiones y archivado •  Actualizaciones continuas: detectando nuevos datos y estructuras de datos cada día •  https://github.com/aragonopendata/local-data-aragopedia/ §  API para desarrolladores §  Interfaces de usuario adicionales o  Mejorando las capacidades de acceso 
 y recuperación de datos §  Resultado adicional: mejora de los datos o  Muchos errores y necesidades de mejora detectados en los CSVs, que fueron corregidos en el proceso de transformación
  • 14. Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos – Jornadas IECA Proceso de transformación y publicación 22 Caracterízación inicial •  Identificar fuentes •  Identificar dimensiones y medidas Transformación •  Descarga diaria de datos •  Procesamiento (UTF8) •  Subida a GitHub •  Anotación de nuevas dimensiones y medidas •  Transformación a RDF Publicación y uso •  APIs Linked Data https://github.com/aragonopendata/local-data-aragopedia/
  • 15. Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos – Jornadas IECA bi.aragon.es Google Drive Descarga de datasets y de su configuración ¿Nuevo dataset? GitHub Sí Por cada dataset Generar nueva configuración y crear un issue ¿Nueva estructura? No Crear issue Sí ¿Nuevos datos? Regenerar los datos y crear issue No Sí SPARQL Transformación de datos. Resumen…
  • 16. Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos – Jornadas IECA Publicación de datos y uso 32 §  Datos accesibles en o  API (usando ELDA) •  http://opendata.aragon.es/herramientas/apis?#aragodbpedia o  GitHub (CSVs, RDF) o  SPARQL endpoint SPARQL Elda Linked Data
  • 17. Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos – Jornadas IECA Publicación de datos y uso •  Pasar de una orientación basada en la publicación de conjuntos de datos / informes a una publicación de granularidad más fina (por observación) •  Por ejemplo, un periodista puede hacer referencia directa, en una noticia, a un dato concreto (fake news) •  “En el año 1998 en Zaragoza había 42916 mujeres en el rango de edad de 0 a 15 años” (enlace: http://opendata.aragon.es/recurso/iaest/observacion/03-030005TM/ 50a0a5b9-cb76-37f4-961c-8abdf1c458e3) •  “La tendencia de población de 0 a 15 años en mujeres en Zaragoza creció hasta el 2013 y luego ha ido descendiendo levemente” (enlace: https://github.com/aragonopendata/local-data-aragopedia/blob/master/ consultas.md) •  ¿Podemos permitir consultas más complejas y sobre varios conjuntos de datos a la vez sin obligar a descargar y procesar datos en local?
  • 18. Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos – Jornadas IECA Estructura de la charla •  Un ejemplo de publicación de datos estadísticos más allá de los ficheros (Aragón - IAEST) •  Nuestro trabajo en la publicación de datos derivados del padrón por parte de las ciudades •  Algunas recomendaciones finales 43
  • 19. Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos – Jornadas IECA Ciudades Abiertas (Open Cities) Project INICIATIVA PLATAFORMA DE GOBIERNO ABIERTO, COLABORATIVA E INTEROPERABLE (121/17-SP) Julio 2018 – Junio 2020 Más detalles en http://www.ciudadesabiertas.es/
  • 20. Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos – Jornadas IECA Temporalmente disponible en: https://github.com/opencitydata/demografia-padron-municipal/tree/master/ontology http://vocab.ciudadesabiertas.es/def/demografia/padron-municipal (en breve) Publicación de datos del padrón municipal
  • 21. Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos – Jornadas IECA Vocabularios a tener en cuenta 1.  SDMX (Statistical Data and Metadata eXchange): a)  sdmx-dimension: área de referencia, período de referencia, y sexo http://purl.org/linked-data/sdmx/2009/dimension b)  sdmx-code: sexo de los habitantes http://purl.org/linked-data/sdmx/2009/code 2.  Vocabularios IAEST: a)  iaest-dimension: edad grupos quinquenales y nombre país de nacionalidad https://opendata.aragon.es/def/iaest/dimension b)  SKOS IAEST: 1)  Rangos de edad de grupos quinquenales: https://opendata.aragon.es/kos/iaest/edad-grupos-quinquenales 2)  Nombre del país de nacionalidad: https://opendata.aragon.es/kos/iaest/nacionalidad-pais-nombre 3.  Otras listas SKOS: a)  Para la representación de los años de la dimensión del período de referencia se reutilizará la lista de códigos definida por el gobierno británico y disponible en http://reference.data.gov.uk/id/year b)  Para los niveles de estudio se reutilizará la lista de códigos definida para el vocabulario de padrón municipal y que se encuentra disponible en http://vocab.linkeddata.es/datosabiertos/kos/demografia/padron-municipal/ tipo-nivel-estudio
  • 22. Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos – Jornadas IECA Publicación de cubos de datos derivados del padrón §  Definición y ejemplos de los cubos de datos: http://vocab.ciudadesabiertas.es/def/demografia/padron-municipal/cubos-datos Temporalmente disponible en: https://github.com/opencitydata/demografia-padron-municipal/tree/master/OnToology/census-cube-documentation
  • 23. Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos – Jornadas IECA Cubo de población según edad qb:Dataset qb:structure qb:DataStructureDefinition qb:ComponentSpecification qb:ComponentPropertyqb:component qb:componentProperty qb:DimensionProperty qb:MeasureProperty qb:Observation qb:dataset qb:dimension qb:measure ex:DS_PoblacionPorEdad qb:structure ex:DSD_PoblacionPorEdad qb:component sdmx-dimension:sex espad-medida:numero- personas qb:dimension qb:measure rdf:type rdf:type rdf:type rdf:type rdf:type sdmx-dimension:refPeriod sdmx-dimension:refArea iaest-dimension:edad- grupos-quinquenales Referenced Ontologies: qb: http://purl.org/linked-data/cube# ex: http://vocab.ciudadesabiertas.es/recurso/demografia/padron-municipal/ iaest-dimension: http://opendata.aragon.es/def/iaest/dimension# espad-medida: http://vocab.ciudadesabiertas.es/def/demografia/padron-municipal/medida# sdmx-dimension: http://purl.org/linked-data/sdmx/2009/dimension#
  • 24. Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos – Jornadas IECA Cubo de población según edad (por distrito y sexo) <http://vocab.ciudadesabiertas.es/recurso/demografia/padron-municipal/DSD_PoblacionPorEdad> a qb:DataStructureDefinition ; rdfs:label "Estructura de los cubos de datos que se corresponden con el conjunto de datos de padrón municipal de la ciudad Madrid, en este archivo se detalla el número de habitantes según su sexo, rango de edad y el área donde reside"@es ; skos:notation "DSD_PoblacionPorEdad" . 2) Definición de la estructura de datos <http://vocab.ciudadesabiertas.es/recurso/demografia/padron-municipal/DS_PoblacionPorEdad> a qb:DataSet ; qb:structure <http://vocab.ciudadesabiertas.es/recurso/demografia/padron-municipal/DSD_PoblacionPoblacionPorEdad> . 1) Definición del conjunto de datos <http://vocab.ciudadesabiertas.es/recurso/demografia/padron-municipal/DSD_PoblacionPorEdad> qb:component _:node1egmfx1 . _:node1egmfx1 qb:dimension sdmx-dimension:sex . <http://vocab.ciudadesabiertas.es/recurso/demografia/padron-municipal/DSD_PoblacionPorEdad> qb:component _:node1egmfx2 . _:node1egmfx2 qb:dimension sdmx-dimension:refArea . <http://vocab.ciudadesabiertas.es/recurso/demografia/padron-municipal/DSD_PoblacionPorEdad> qb:component _:node1egmfx3 . _:node1egmfx3 qb:dimension sdmx-dimension:refPeriod . <http://vocab.ciudadesabiertas.es/recurso/demografia/padron-municipal/DSD_PoblacionPorEdad> qb:component _:node1egmfx4 . _:node1egmfx4 qb:dimension iaest-dimension:edad-grupos-quinquenales. 2.1) Definición de las dimensiones de la estructura de datos <http://vocab.ciudadesabiertas.es/recurso/demografia/padron-municipal/DSD_PoblacionPorEdad> qb:component _:node1egmfx5 . _:node1egmfx5 qb:measure espad-measure:numero-personas. 2.2) Definición de las medidas de la estructura de datos
  • 25. Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos – Jornadas IECA Distrito Total Rango de 20 a 24 Centro 2731,00 Arganzuela 3294,00 Retiro 2478,00 Salasanca 3466,00 Chamartín 3217,00 Latina 5770,00 Cubo de población según edad (por distrito y sexo) <http://vocab.ciudadesabiertas.es/recurso/demografia/padron-muinicipal/a209fd32c10cf5d06e4e6aedf8b81950b4e981f3> a qb:Observation ; qb:dataSet <http://vocab.ciudadesabiertas.es/recurso/demografia/padron-muinicipal/DS_PoblacionPorEdad> ; sdmx-dimension:refArea <http://vocab.ciudadesabiertas.es/recurso/territorio/distrito/Centro> ; sdmx-dimension:refPeriod <http://reference.data.gov.uk/id/year/2019> ; espad-medida:numero-personas ”2731"^^xsd:int ; sdmx-dimension:sexo <http://purl.org/linked-data/sdmx/2009/code#sex-M> ; iaest-dimension:edad-grupos-quinquenales <https://opendata.aragon.es/kos/iaest/edad-grupos-quinquenales/20-a-24> . 3) Definición de una observación del Dataset
  • 26. Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos – Jornadas IECA Ejemplos de consultas 1.  Número de hombres del rango de edad de 20 a 24 años que habitan en el distrito Centro en el año 2019 PREFIX kos-year: <http://reference.data.gov.uk/id/year/> PREFIX espad-medida: <http://vocab.ciudadesabiertas.es/def/demografia/padron-municipal/medida#> PREFIX sdmx-dimension: <http://purl.org/linked-data/sdmx/2009/dimension#> PREFIX iaest-dimension: <http://opendata.aragon.es/def/iaest/dimension#> PREFIX qb: <http://purl.org/linked-data/cube#> PREFIX kos-iaest : <http://opendata.aragon.es/kos/iaest/> PREFIX sdmx-code : <http://purl.org/linked-data/sdmx/2009/code#> SELECT (?x AS ?numeroHombres) WHERE { ?obs a qb:Observation ; sdmx-dimension:refArea <http://vocab.ciudadesabiertas.es/recurso/territorio/distrito/Centro> ; sdmx-dimension:refPeriod kos-year:2019 ; sdmx-dimension:sex sdmx-code:sex-M ; iaest-dimension:edad-grupos-quinquenales kos-iaest:edad-grupos-quinquenales/20-a-24 ; espad-medida:numero-personas ?x ; qb:dataSet <http://vocab.ciudadesabiertas.es/recurso/demografia/padron-municipal/DS_PoblacionPorEdad> . } numeroHombres 2731,00
  • 27. Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos – Jornadas IECA Ejemplos de consultas 2.  Total de hombres del rango de edad de 20 a 24 años que habitan en Madrid en el año 2019 PREFIX kos-year: <http://reference.data.gov.uk/id/year/> PREFIX espad-medida: <http://vocab.ciudadesabiertas.es/def/demografia/padron-municipal/medida#> PREFIX sdmx-dimension: <http://purl.org/linked-data/sdmx/2009/dimension#> PREFIX iaest-dimension: <http://opendata.aragon.es/def/iaest/dimension#> PREFIX qb: <http://purl.org/linked-data/cube#> PREFIX kos-iaest : <http://opendata.aragon.es/kos/iaest/> PREFIX sdmx-code : <http://purl.org/linked-data/sdmx/2009/code#> SELECT (SUM(?x) AS ?totalHombres) WHERE { ?obs a qb:Observation ; sdmx-dimension:refPeriod kos-year:2019 ; sdmx-dimension:sex sdmx-code:sex-M ; iaest-dimension:edad-grupos-quinquenales kos-iaest:edad-grupos-quinquenales/20-a-24 ; espad-medida:numero-personas ?x ; qb:dataSet <http://vocab.ciudadesabiertas.es/recurso/demografia/padron-municipal/DS_PoblacionPorEdad> . } totalHombres 2731,00
  • 28. Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos – Jornadas IECA Estructura de la charla •  Un ejemplo de publicación de datos estadísticos más allá de los ficheros (Aragón - IAEST) •  Nuestro trabajo en la publicación de datos derivados del padrón por parte de las ciudades •  Algunas recomendaciones finales 53
  • 29. Adiós a los ficheros. Hola a los grafos de conocimientos estadísticos – Jornadas IECA El mensaje principal de esta charla •  Para facilitar la reutilización de los datos estadísticos y geográficos, debemos evolucionar en la publicación: •  De la publicación de ficheros (PC-Axis, CSV) a la publicación adicional de APIs y grafos de conocimientos •  Más flexibilidad a la hora de consultar los datos que me interesan (ej: los de un municipio, o un distrito) •  Facilidad para insertar visualizaciones en mi página Web •  Enlazando con grafos de conocimientos internos y externos: •  Datos geográficos (por ejemplo, datos.ign.es) •  Consultas más ricas/complejas, sin islas de datos aisladas •  Reutilización interna de los datos •  Tesauros comunes (por ejemplo, INEBase, RAMON) •  Deberían también estar publicados como Linked Data •  Facilita comparaciones, creación de visualizaciones, etc. •  Wikidata •  Aquí es donde mucha gente mira 54
  • 30. Oscar Corcho Ontology Engineering Group, Universidad Politécnica de Madrid Basado en materiales realizados con la colaboración de 
 Paola Espinoza, Idafen Santana-Pérez, 
 Hugo Lafuente, Juan Carlos Ballesteros, Esther Minguela, 
 David Portolés, César Cano y Alfredo Peris Jornadas IECA: Difusión, accesibilidad y reutilizaciónde la estadística y cartografía oficial Adiós a los ficheros Hola a los grafos de conocimientos estadísticos ocorcho@fi.upm.es @ocorcho 25/11/2019 Jornadas IECA