Usted está aquí

Glosario

A continuación se explican algunos términos de uso frecuente en la comunidad de datos abiertos.

Dato
El dato es un elemento descontextualizado que puede dar origen a la generación de información. Son símbolos que describen hechos, condiciones, valores o situaciones. Un dato puede ser una letra, un número o cualquier símbolo que representa una cantidad, una medida, una palabra o una descripción. Los datos son la verdadera materia prima para generar información con valor agregado.

Dato Personal
Información de cualquier tipo referida a personas físicas o de existencia ideal, determinadas o determinables.

Dato Sensible
Aquellos datos personales que revelan origen racial o étnico, opiniones políticas, convicciones religiosas o morales, afiliación sindical, información referente a la salud o a la vida sexual o cualquier otro dato que pueda producir por su naturaleza o su contexto, algún trato discriminatorio al titular de los datos.

Dato público
Es cualquier dato generado en el ámbito gubernamental, o que se encuentra bajo su guarda, y que no tiene su acceso restringido por ninguna legislación específica.

Dato abierto
Es un dato de origen público o no, al que cualquier persona puede acceder, usar y compartir libremente. Sólo deben atribuirse y compartirse con la misma licencia con la que fueron publicados. Son, a su vez, datos públicos disponibilizados en un medio digital, bajo una licencia abierta y usando para ello un formato estándar abierto.

Activo de datos
Es cualquier recurso de datos con valor para el desarrollo de las funciones de una organización, que puede ser comprendido y tratado como una única unidad a efectos de gestión, uso, protección e intercambio.

Información
Es un dato dotado de relevancia, utilidad e interpretación. Para obtener información es necesario aplicar algún tipo de transformación o procesamiento sobre los datos.

Metadatos
Ciertas características o atributos de los datos son definidos para facilitar su comprensión. Estas características se conocen como "metadatos". Suele decirse, por esa razón, que "los metadatos son datos sobre los datos". Los metadatos pueden describir cómo un dato es representado, cuáles son los rangos de valores aceptables, su relación con otros datos y cómo estos deben ser etiquetados. También pueden proporcionar otra información pertinente, como el administrador responsable, leyes y reglamentos asociados, y la política de gestión de acceso.

Licencia Abierta
Los datos abiertos necesitan estar abiertos tanto técnica, como legalmente. Para hacerlo, tenemos que aplicarles una licencia. Los datos en poder del sector público no deben estar sujetos a restricciones de patentes. Más importante aún es asegurarse de que estén en formatos legibles que permitan una mayor reutilización. Por ejemplo, documentos en PDF (Portable Document Format) limitan la extracción de los datos y su procesamiento.

Términos de un catálogo

Catálogo de datos
Es el sistema de información que recopila y organiza metadatos descriptivos sobre los distintos conjuntos de datos abiertos por una organización, dando un acceso único a los mismos. Un portal de datos es un catálogo.

Datasets o conjuntos de datos
También se los conoce como datasets. Son la pieza principal en todo el catálogo de datos. Éstos agrupan uno o más recursos de datos y son el eje sobre el que se documentan los metadatos de la información.

Recursos
Los recursos son la pieza de información más pequeña del catálogo y son los verdaderos activos de datos del portal.

Tipos de recursos
Hay una gran variedad de tecnologías disponibles para producir y almacenar datos. A continuación mencionamos los formatos más usados para la apertura de datos.

CSV: Los archivos CSV son archivos de texto plano donde las columnas se separan por comas (u otros caracteres de separación) y las filas por saltos de línea. Es un formato abierto.

ODS: Es un formato abierto basado en OASIS OpenDocument Format (ISO/IEC 26300). Es el formato por defecto del procesador de planillas de cálculo Open Office.

JSON: Es un formato para el intercambio de datos entre sistemas. Es un formato abierto no tabular basado en la especificación RFC 7159.

SHP: ESRI Shapefile (SHP) es un formato propietario de datos espaciales desarrollado por ESRI, quien crea y comercializa software para Sistemas de Información Geográfica (SIG). Actualmente se ha convertido en formato estándar de facto para el intercambio de información geográfica entre SIG.

KML: Es un formato abierto para datos geográficos basado en el estándar XML.

GEOJSON: Es un formato estándar abierto diseñado para representar elementos geográficos sencillos, junto con sus atributos no espaciales.

API: Application Programming Interface es el punto de entrada donde un sistema recibe peticiones para ejecutar una tarea previamente programada. Es un modo establecido que facilita la consulta y el acceso a datos a través de un método específico.