Indonesia514

Indonesia514: un repositorio de ciencia de datos para estudiar el desarrollo regional en los 514 distritos de Indonesia

¡Bienvenido/a a Indonesia514! Este proyecto centraliza datos geoespaciales e indicadores económicos regionales —incluidos el PIB, la inversión y el gasto público— de los 514 distritos de Indonesia. Todos los conjuntos de datos comparten un identificador común, districtID, de modo que pueden fusionarse en una única tabla analítica.

Este repositorio está organizado para personas dedicadas a la investigación y a la ciencia de datos interesadas en:

  • Economía regional: medir el crecimiento, la formación de capital y la política fiscal a nivel distrital.
  • Análisis espacial: vincular los indicadores económicos con las geometrías de los distritos para la cartografía y la econometría espacial.
  • Flujos de trabajo reproducibles: transmitir conjuntos de datos abiertos directamente a Python mediante una única clave de unión.

⚙️ En desarrollo activo. Este repositorio es un borrador en etapa inicial. Los límites de los distritos están completos en formato GeoJSON y el sitio web bilingüe (inglés / bahasa indonesio) está disponible, pero los conjuntos de datos económicos contienen actualmente datos de muestra de 16 distritos: las series completas de los 514 distritos están pendientes. Los paneles interactivos y los cuadernos analíticos están planificados y aún no se han publicado.


💾 Conjuntos de datos

Conjuntos de datos curados y organizados en módulos, todos vinculados por un identificador único (districtID).

Conjunto de datosRuta del archivoDescripciónClave de unión
PIB/gdp/gdp.csvProducto interno bruto a nivel distrital (2010-2022).districtID
GFCF/gfcf/gfcf.csvFormación bruta de capital fijo, una medida de la inversión (2010-2022).districtID
Gasto público/gs/gs.csvGasto público y distribución de la política fiscal (2010-2022).districtID
Vector espacial/maps/mapIdonesia514tp.geojsonLímites geométricos (polígonos) de los 514 distritos.districtID

⚠️ Nota importante sobre los identificadores: la clave principal para unir todos los conjuntos de datos de este repositorio es districtID. Los archivos de PIB, GFCF y gasto público contienen actualmente una muestra de 16 distritos; se están añadiendo los datos completos de los 514 distritos. Trate siempre districtID de forma coherente (como int o string) en ambos dataframes antes de fusionarlos.


🐍 Inicio rápido

Transmita los conjuntos de datos directamente desde GitHub y fusiónelos por districtID con pandas. Puede ejecutar el código siguiente en un borrador de Google Colab en blanco, sin necesidad de configuración ni instalación.

import pandas as pd

# -----------------------------------------------------------------------------
# 1. SETUP: Define the raw GitHub URL to stream data directly into Pandas.
# -----------------------------------------------------------------------------
REPO_URL = "https://raw.githubusercontent.com/quarcs-lab/indonesia514/main"

# -----------------------------------------------------------------------------
# 2. LOAD: Read the economic CSVs.
# -----------------------------------------------------------------------------
df_gdp  = pd.read_csv(f"{REPO_URL}/gdp/gdp.csv")
df_gfcf = pd.read_csv(f"{REPO_URL}/gfcf/gfcf.csv")
df_gs   = pd.read_csv(f"{REPO_URL}/gs/gs.csv")

# -----------------------------------------------------------------------------
# 3. MERGE: Combine the indicators on the common district identifier.
# -----------------------------------------------------------------------------
df = pd.merge(df_gdp,  df_gfcf[['districtID', 'gfcf_2022']], on='districtID')
df = pd.merge(df,      df_gs[['districtID', 'gs_2022']],     on='districtID')

📜 Cómo citar

Si utiliza este repositorio en su investigación, cítelo con los siguientes metadatos.

Formato APA

Mendez, C., Abdulah, R., Arvianto, B., & Leiva, F. (2026). Indonesia514: A data science repository to study regional development in Indonesia. GitHub. https://github.com/quarcs-lab/indonesia514

Formato BibTeX

@misc{indonesia5142026,
  author = {Mendez, Carlos and Abdulah, Rusli and Arvianto, Bimo and Leiva, Favio},
  title = {{Indonesia514}: A Data Science Repository to Study Regional Development in Indonesia},
  year = {2026},
  publisher = {GitHub},
  journal = {GitHub repository},
  howpublished = {\url{https://github.com/quarcs-lab/indonesia514}}
}

Licencia

Este repositorio se distribuye bajo la Licencia MIT, que permite una amplia reutilización con la atribución adecuada.


🤝 Cómo contribuir

¡Las contribuciones son bienvenidas! Si va a añadir los datos completos de los distritos, corregir un problema con el sistema de referencia de coordenadas (CRS), crear un nuevo cuaderno o integrar indicadores nuevos, envíe un Pull Request.

Carlos Mendez
Carlos Mendez
Profesor Asociado de Economía del Desarrollo

Mi investigación se centra en integrar la economía del desarrollo, la ciencia de datos espaciales y la econometría para comprender e informar mejor el proceso de desarrollo sostenible entre regiones.