Analysis of the Impact of the Covid-19 Pandemic on Unemployment in Puerto Rico: A Data Mining Approach
Ángel G. Crespo Báez
Departamento de Contabilidad
Facultad de Administración de Empresas, UPR RP
Yeliany M. Colón Rodríguez
Departamento de Gerencia
Facultad de Administración de Empresas, UPR RP
Natalie N. Ruiz Cabrera
Instituto de Estadística y Sistemas Computadorizados de Información
Facultad de Administración de Empresas, UPR RP
Recibido: 19/09/2025; Revisado: 06/11/2025; Aceptado: 26/11/2025
Resumen
Este análisis examina el impacto del covid-19 en el desempleo de los municipios de Puerto Rico entre 2019 y 2024, utilizando técnicas de minería de datos, como la limpieza de datos y la clasificación supervisada y no supervisada. Se construyen nuevas variables, incluidas clasificaciones por regiones, para identificar patrones de desempleo antes, durante y después de la pandemia. El estudio compara la magnitud del impacto regional, evalúa el progreso pos-covid y determina qué zonas requieren mayor atención. Los hallazgos permiten detectar desigualdades en la recuperación laboral y ofrecer recomendaciones basadas en evidencia para fomentar una recuperación económica equitativa.
Palabras clave: covid-19, desempleo, minería de datos, clasificación, regiones
Abstract
This analysis examines the impact of COVID-19 on unemployment across municipalities in Puerto Rico from 2019 to 2024, using data mining techniques, including data cleaning and supervised and unsupervised classification. New variables, including regional classifications, are constructed to identify unemployment patterns before, during, and after the pandemic. The study compares regional impacts, evaluates post-COVID recovery, and identifies which areas require greater support. The findings highlight inequalities in labor recovery and offer evidence-based recommendations to promote an equitable economic recovery.
Keywords: COVID-19, unemployment, data mining, classification, regions
Introducción
En los últimos años, la tasa de desempleo en Puerto Rico ha experimentado variaciones significativas. Durante 2020 y 2021, en plena pandemia, Puerto Rico enfrentó un aumento del desempleo, acompañado de una reducción de la fuerza laboral, lo que reflejó el impacto económico de las restricciones y el cierre de negocios. Según NotiCel (2021), en diciembre de 2020 se registró un incremento en la tasa de desempleo, mientras que el grupo trabajador se redujo, lo que evidencia una salida considerable de personas del mercado laboral. Este comportamiento coincide con tendencias observadas tanto a nivel mundial como en Estados Unidos, donde múltiples investigaciones reportaron aumentos significativos del desempleo durante los primeros meses de la pandemia (Longdom, 2023; U.S. Bureau of Labor Statistics, 2023). Sin embargo, para el 2023 y comienzos de 2024, Puerto Rico logró alcanzar un mínimo histórico de desempleo de 5.5%, según datos del Departamento del Trabajo (citado en Intelligent Economics, 2023). Este cambio plantea preguntas importantes sobre las dinámicas del mercado laboral, la calidad del empleo generado y la sostenibilidad de esta aparente recuperación. En esta investigación se analizan las tasas de desempleo por municipio y región, comparando datos del 2019 al 2024, con el fin de identificar patrones y evaluar la efectividad de las políticas económicas implementadas.
En el presente análisis, se agruparon los municipios de Puerto Rico en cinco regiones geográficas principales — Este, Norte Central, Noroeste, Suroeste y Sureste (ver Tabla 1) — con base en la distribución territorial utilizada por el Departamento del Trabajo y Recursos Humanos (2021). Esta división responde a criterios tanto geográficos como socioeconómicos, lo que permite observar patrones regionales en la evolución del desempleo. Esta clasificación permite realizar comparaciones más pertinentes sobre las disparidades regionales en la tasa de desempleo a lo largo del periodo 2019–2024.
Tabla 1: División regional de municipios
Fuente: Elaborado por los autores a partir del Departamento del Trabajo y Recursos Humanos (2021)
Problema de Investigación
A pesar de que la tasa de desempleo en Puerto Rico ha alcanzado niveles históricamente bajos en los últimos años, especialmente tras la pandemia del covid-19, persisten dudas sobre si esta recuperación ha sido uniforme en todas las regiones del país y qué factores han influido en estos cambios. No está claro si los municipios que presentaban altas tasas de desempleo antes de la pandemia lograron mejorar, ni si existe un patrón territorial o temporal que permita anticipar el comportamiento del desempleo en años posteriores. Esto plantea la necesidad de analizar cómo ha variado la tasa de desempleo por municipio desde 2019 hasta 2024 y qué tendencias o desigualdades se pueden identificar para entender mejor el estado actual del mercado laboral.
Metodología
El objetivo de esta investigación es analizar la evolución de las tasas de desempleo en Puerto Rico, tomando como punto de referencia el año 2019, considerado como periodo pre-covid. A partir de ese año base, se examina cómo estas tasas han cambiado, aumentado, disminuido o estabilizado durante los años posteriores (2020 a 2024), en respuesta al impacto de la pandemia y el proceso de recuperación económica.
Para este análisis se utilizaron tanto métodos de aprendizaje supervisado como no supervisado. En cuanto a la clasificación supervisada, se aplicaron dos modelos: el Clasificador de Vecinos más Cercanos (K-Nearest Neighbors, KNN) y la Máquina de Vectores de Soporte (Support Vector Machine, SVM). Estos modelos permiten predecir si un municipio presentará una tasa de desempleo alta en 2024, basándose en sus tasas anteriores y en sus características territoriales. Su principal ventaja es que capturan relaciones complejas entre las variables sin requerir supuestos estrictos, lo que mejora su precisión en escenarios con datos variados entre los municipios. Por otro lado, se empleó el método de clustering como técnica no supervisada para identificar grupos de municipios con patrones similares de comportamiento del desempleo a lo largo del tiempo. Esta técnica complementa los modelos supervisados, ya que nos ayuda a descubrir estructuras ocultas y segmentaciones naturales entre los municipios.
Los datos utilizados en esta investigación fueron recopilados del Instituto de Estadísticas de Puerto Rico (2020-2024) e incluyen información de todos los municipios desde el año 2019 hasta el 2024. Se trabajaron variables relacionadas con la fuerza laboral, el empleo, el desempleo y la tasa de desempleo en diciembre de cada año, así como una clasificación binaria del desempleo y la región geográfica de cada municipio. Estas variables permiten observar cómo ha cambiado el desempleo a lo largo del tiempo, especialmente antes, durante y después del impacto de la pandemia de covid-19. Se presentan las variables con mayor detalle en la Tabla 2 a continuación.
Tabla 2: Descripción de las variables
Fuente: Elaborado por los autores a partir de los datos del Instituto de Estadísticas de Puerto Rico, 2025
Las variables utilizadas en esta investigación corresponden a datos laborales recopilados para cada municipio de Puerto Rico durante los años 2019, 2020, 2021, 2022, 2023 y 2024. El año 2019 se considera como periodo pre-covid, el 2020 como el año en que se sintieron directamente los efectos de la pandemia, y los años 2021 en adelante como el periodo de recuperación pos-covid. Cada año se incluyen cuatro variables principales: Fuerza Laboral, Empleo, Desempleo y Tasa de Desempleo. La variable Fuerza_Laboral_DicXXXX representa el total de personas disponibles para trabajar en diciembre de cada año, incluyendo tanto a los empleados como a quienes buscan trabajo activamente. La variable Empleo_DicXXXX indica el número de personas empleadas en ese mismo periodo, mientras que Desempleo_DicXXXX refleja el número de personas desempleadas activas. Por último, la Tasa_Desempleo_DicXXXX expresa el porcentaje de personas desempleadas respecto de la fuerza laboral total y se calcula como: (Desempleo / Fuerza Laboral) × 100. Estas variables permiten observar la evolución del mercado laboral en Puerto Rico antes, durante y después del impacto de la pandemia.
Comenzando con el método del Clasificador de Vecinos más Cercanos (KNN, por sus siglas en inglés), se estableció preliminarmente una variable binaria que clasifica si la tasa de desempleo es alta o baja. Para este análisis, se consideró una tasa de desempleo alta cuando supera el 6.5% (valor asignado como 1) y baja cuando está por debajo de ese umbral (valor asignado como 0). Este valor intermedio se seleccionó tomando como referencia un artículo de CEUPE European Business School (s.f.), que clasifica una tasa de desempleo alta cuando supera el 8% y baja cuando es menor al 5%. Así, el 6.5% se consideró como un punto medio representativo para nuestro estudio. Adicionalmente, se incluyó una variable que clasifica los municipios según su región geográfica, con el objetivo de analizar qué regiones se han visto más afectadas por el desempleo en el contexto del covid-19. En cuanto al análisis con KNN, se generó una gráfica de barras y una matriz de confusión utilizando los años 2019 y 2020, con el propósito de identificar los municipios más afectados tras el inicio de la pandemia. Posteriormente, se realizaron gráficas KNN para los años subsiguientes, utilizando como referencia la tasa de desempleo de 2019 (pre-covid), con el fin de observar si dicha tasa se estabilizó, aumentó o disminuyó con el paso del tiempo.
Continuando con el segundo clasificador supervisado, se aplicó la metodología de la Máquina de Vectores de Soporte (SVM, por sus siglas en inglés). El propósito de este análisis fue visualizar cómo se han comportado las diferentes regiones de Puerto Rico en cuanto a su tasa de desempleo, tomando como referencia el año 2019 (pre-covid) y comparándolo con el último año disponible, 2024. Para ello, se construyó un gráfico tridimensional en el que el eje X representa la tasa de desempleo en 2019, el eje Y la tasa de desempleo en 2024, y el eje Z las regiones, codificadas numéricamente para que el modelo pudiera procesarlas. En esta gráfica, los puntos están representados por diferentes formas y colores: las "X" indican que el modelo clasificó el municipio con una tasa de desempleo alta (valor 1), mientras que los círculos representan una tasa baja (valor 0). Los colores de los puntos corresponden a la región geográfica del municipio: rojo para la región Este, azul para el Sureste, verde para el Norte Central, amarillo para el Noroeste y púrpura para el Suroeste. Este gráfico permitió interpretar visualmente cómo se distribuyen los municipios según su comportamiento en el desempleo y cómo estas diferencias se agrupan por región, facilitando la identificación de patrones espaciales en la evolución del desempleo tras la pandemia.
En la metodología de clasificación no supervisada, seguimos una serie de pasos utilizando las tasas de desempleo entre 2019 y 2024 como variables principales. Primero, seleccionamos estas variables por su capacidad para reflejar la evolución del desempleo antes, durante y después del impacto del covid-19, y las estandarizamos para asegurar su comparabilidad entre municipios. Luego, aplicamos diferentes métodos para determinar el número óptimo de clústeres: silueta, codo y brecha. Aunque los resultados variaron, se optó por una partición en cuatro grupos, ya que ofrecía una segmentación más equilibrada y significativa. Finalmente, visualizamos el dendrograma correspondiente y asignamos los municipios a sus respectivos grupos, lo que nos permitió identificar patrones comunes en sus trayectorias de desempleo. A continuación, discutimos con más detalle los perfiles de cada clúster.
Resultados
Como análisis preliminar de los métodos de clasificación seleccionados, se visualizó la evolución de la tasa de desempleo a lo largo de los años del estudio. Posteriormente, se identificaron los municipios que experimentaron el mayor incremento en su tasa de desempleo al inicio de la pandemia de covid-19, en particular entre 2019 y 2020. Este paso permitió tener una comprensión inicial del impacto de la pandemia en el empleo por municipio y sirvió como base para aplicar los modelos de clasificación supervisada de manera más informada.
Figura 1: Evolución de la tasa de desempleo por región (2019-2024)
Fuente: Elaborado por los autores a partir de R studio, 2025
La Figura 1 muestra la evolución de la tasa de desempleo promedio por región en Puerto Rico desde 2019 hasta 2024. En él se observa un gran aumento de la tasa de desempleo en 2020, debido al impacto inicial de la pandemia de covid-19. A partir de 2021, la mayoría de las regiones muestran una tendencia a la baja, lo que sugiere un proceso de recuperación económica progresiva.
Algo a destacar es la región Suroeste, que comenzó con una de las tasas más altas en 2019. Esta región mostró una disminución constante hasta 2022, pero presenta una leve alza en 2024. Por otro lado, la región Este registró un aumento muy marcado en 2020, probablemente debido al impacto inicial de la pandemia, pero logró mantener una de las tasas más bajas en los años siguientes, siendo una de las regiones con mejor recuperación en 2022 y 2023. La región Noroeste se mantuvo por encima del promedio durante casi todo el periodo, aunque también refleja una disminución constante. Las regiones Sureste y Norte Central mostraron una recuperación más estable, con tasas cercanas o inferiores al 7% en los años más recientes. Este análisis permite observar no solo el impacto inmediato de la pandemia en el desempleo regional, sino también cómo algunas regiones lograron estabilizarse más rápidamente que otras, lo que puede estar relacionado con factores económicos, estructurales o poblacionales propios de cada zona.
Al comenzar la clasificación con el método KNN, se realizó un análisis inicial para identificar los municipios que registraron el mayor aumento de la tasa de desempleo entre 2019 (pre-covid) y 2020 (durante el covid). Este análisis se visualizó mediante una gráfica de barras, en la que se destacó que los municipios más afectados fueron Vieques y Culebra, ambos con un aumento del 5.2% en la tasa de desempleo. En el caso de Vieques, la tasa pasó de 6.9% en 2019 a 12.1% en 2020, mientras que en Culebra aumentó de 3.9% en 2019 a 9.1% en 2020. Le sigue el municipio de Naranjito, con un incremento del 5%, pasando de 9.6% en 2019 al 14.6% en 2020. Adicionalmente, se construyó una matriz de confusión artificial con el propósito de observar cómo el modelo clasifica cada municipio según si presenta una tasa de desempleo alta o baja en el año 2020. Para esta clasificación, se utilizó una variable binaria en la que una tasa superior al 6.5% se considera "desempleo alto" (valor 1) y una tasa igual o inferior a ese umbral se clasifica como "desempleo bajo" (valor 0). Los resultados de la matriz indicaron que los 78 municipios fueron clasificados como municipios con desempleo alto. Esto sugiere que el impacto de la pandemia fue generalizado en toda la isla, aunque algunos municipios se vieron más afectados que otros. Este análisis servirá como punto de referencia para las comparaciones que se realizarán a continuación utilizando el modelo KNN para los años posteriores.
Figura 2: Clasificadores KNN últimos 4 años
Fuente: Elaborado por los autores a partir de R Studio, 2025
Luego del análisis inicial de 2020, se aplicó el modelo KNN a los años 2022, 2023 y 2024 (ver Figura 2) con el propósito de observar cómo ha cambiado la clasificación de los municipios en cuanto al desempleo alto o bajo, tomando como referencia la tasa de desempleo de 2019. En 2022, municipios como Las Marías, Rincón y Guayanilla fueron clasificados como zonas de desempleo alto, reflejando que, aunque muchas regiones comenzaron a estabilizarse, aún había focos de desempleo elevado. En 2023, el modelo identificó un nuevo conjunto de municipios, como Guánica, Guayanilla y Patillas, lo que indica una variabilidad regional en la recuperación económica. Para 2024, se mantuvieron municipios del Suroeste como Adjuntas, Yauco y Coamo dentro del grupo con desempleo alto, mientras que otros, como Trujillo Alto, Gurabo y Bayamón, fueron clasificados con desempleo bajo, evidenciando una mejora sostenida. Los resultados del modelo fueron consistentes, con una precisión de 97.4% en 2022, 96.2% en 2023 y 88.5% en 2024, con sensibilidades superiores al 83% en todos los casos. Estos resultados respaldan el uso del modelo KNN como herramienta para identificar patrones, monitorear cambios y apoyar la toma de decisiones de política pública enfocadas en las regiones más afectadas.
El segundo método de clasificación supervisada utilizado fue el SVM. Este modelo fue de gran utilidad para visualizar con mayor profundidad las divisiones regionales y el comportamiento individual de los municipios. La comparación se realizó utilizando como referencia el año 2019, correspondiente al periodo pre-covid, y el año 2024, que representa los datos más recientes disponibles. Esto nos permitió observar qué municipios lograron recuperarse y cuáles continúan presentando tasas elevadas de desempleo, así como identificar patrones según la región geográfica (ver Figura 3).
Figura 3: Máquina Vector Soporte Tres Dimensiones
Fuente: Elaborado por los autores a partir de R studio, 2025
Mediante el modelo SVM en 3D, pudimos observar el comportamiento individual de los municipios entre 2019 y 2024, considerando su región y la clasificación de desempleo alto o bajo. En un análisis previo, identificamos que Vieques, Culebra y Naranjito fueron los municipios con el mayor aumento de la tasa de desempleo entre 2019 y 2020, justo al inicio de la pandemia. Sin embargo, al observar los datos de 2024, notamos trayectorias distintas. Naranjito, por ejemplo, logró una recuperación significativa, pasando de una tasa de desempleo del 9.6% en 2019 a 5.9% en 2024, siendo clasificado como municipio de desempleo bajo. En contraste, Vieques y Culebra, ambos de la región Este, no han logrado reducir su tasa. Vieques pasó de 6.9% a 10.4%, y Culebra de 3.9% a 7.2%, manteniéndose ambos con una clasificación de desempleo alta. Esto resalta cómo, aunque algunos municipios han mejorado con el tiempo, otros han enfrentado mayores dificultades para recuperarse, lo que refleja desigualdades regionales en el impacto y la recuperación económica pospandémica.
El método de clasificación no supervisada aplicado, el análisis de clúster jerárquico permitió explorar cómo se agrupan los municipios según la similitud de sus tasas de desempleo entre 2019 y 2024. Una vez estandarizadas estas variables, se utilizaron los métodos de silueta, codo y brecha para estimar el número óptimo de clústeres. El método de silueta sugería una agrupación en dos, mientras que los métodos de codo y brecha señalaron que k = 4 ofrecía una mejor segmentación sin caer en divisiones excesivas. Por esta razón, se decidió dividir los municipios en cuatro grupos, lo que permitió capturar diferencias relevantes en las trayectorias laborales (ver Figura 4).
Figura 4: Dendrograma jerárquico con k = 4
Fuente: Elaborado por los autores a partir de R studio, 2025
Al visualizar el dendrograma con k = 4, observamos cómo el modelo agrupa los municipios según su evolución del desempleo. El grupo 1 incluye municipios semiurbanos y costeros con comportamiento intermedio; el grupo 2 está compuesto por municipios rurales con desempleo relativamente alto y estable; el grupo 3 agrupa municipios del área metropolitana con tasas más bajas y consistentes; y el grupo 4, el más reducido, reúne municipios con trayectorias atípicas o con vulnerabilidad estructural. Esta segmentación refleja distintas realidades locales y permite identificar patrones comunes y excepcionales en la recuperación económica tras la pandemia. La distribución municipal por clúster puede observarse en la Figura 4, que muestra el dendrograma jerárquico resultante.
Conclusión
Estos resultados indican que, aunque la tasa de desempleo de Puerto Rico se ha recuperado en general tras el impacto inicial de la pandemia en 2020, dicho recobro ha variado entre regiones y municipios. Las herramientas de análisis de datos utilizadas en esta investigación ofrecieron una visión más amplia del comportamiento del desempleo a nivel municipal antes y después de la pandemia. El análisis de series temporales demostró que regiones como el Este y el Norte Central estabilizaron raudamente las tasas de desempleo, mientras que el Suroeste experimentó un retraso persistente hasta el 2024. El análisis de clúster jerárquico segmentó los municipios según sus similitudes en las trayectorias de empleo. Además, las técnicas de clasificación supervisada, como KNN y SVM, identificaron patrones consistentes entre los municipios con tasas de desempleo elevadas tras la pandemia, especialmente en Vieques, Culebra y Adjuntas.
Estos hallazgos sugieren la necesidad de políticas públicas diferenciadas que consideren las condiciones económicas de cada región y refuerzan la utilidad de la minería de datos como herramienta para la planificación económica y social. Sin embargo, una limitación importante del estudio es la disponibilidad de datos anuales, en particular para el mes de diciembre, lo que limitó el análisis de las variaciones estacionales y a corto plazo. Con suerte, futuras investigaciones identificarán factores socioeconómicos adicionales, como el nivel educativo, la categoría de empleo o el ingreso promedio, para comprender mejor las causas subyacentes de las desproporciones regionales y los efectos a largo plazo de la pandemia en el mercado laboral. En conjunto, este estudio no solo aporta evidencia empírica sobre los efectos territoriales del desempleo en la isla, sino que también destaca la importancia de aplicar enfoques analíticos modernos para comprender las desigualdades estructurales y promover una recuperación económica más equitativa y sostenible.
Referencias
Benet, Chantal. (2023). La tasa de desempleo en Puerto Rico alcanza un nuevo mínimo histórico de 5.5%. Recuperado el 16 de mayo de 2025, de https://intelligenteconomics.com/la-tasa-de-desempleo-en-puerto-rico-alcanza-un-nuevo-minimo-historico-de-5-5/
CEUPE. (s.f.). ¿Qué es la tasa de desempleo? Cálculo, fórmula y ejemplo. Recuperado el 19 de mayo de 2025, de https://www.ceupe.com/blog/tasa-de-desempleo.html
Departamento del Trabajo y Recursos Humanos. (2020). Tasa de desempleo por municipio – diciembre 2019 (PDF) [Data set]. Instituto de Estadísticas de Puerto Rico. Recuperado el 16 de mayo de 2025, de https://estadisticas.pr/files/inventario/desempleo_por_municipio/2020-02-10/DTRH_LAUS_201912.pdf
Departamento del Trabajo y Recursos Humanos. (2021). Tasa de desempleo por municipio – diciembre 2020 (PDF) [Data set]. Instituto de Estadísticas de Puerto Rico. Recuperado el 10 de mayo de 2025, de https://estadisticas.pr/files/inventario/desempleo_por_municipio/2021-04-15/DTRH_LAUS_202012.pdf
Departamento del Trabajo y Recursos Humanos. (2022). Tasa de desempleo por municipio – diciembre 2021 (PDF) [Data set]. Instituto de Estadísticas de Puerto Rico. Recuperado el 10 de mayo de 2025, de https://estadisticas.pr/files/inventario/desempleo_por_municipio/2022-02-03/DTRH-LAUS-2021-12.pdf
Departamento del Trabajo y Recursos Humanos. (2023). Tasa de desempleo por municipio – diciembre 2022 (PDF) [Data set]. Instituto de Estadísticas de Puerto Rico. Recuperado el 10 de mayo de 2025, de https://estadisticas.pr/files/inventario/desempleo_por_municipio/2023-02-02/DTRH-LAUS-2022-12.pdf
Departamento del Trabajo y Recursos Humanos. (2024). Tasa de desempleo por municipio – diciembre 2023 (PDF) [Data set]. Instituto de Estadísticas de Puerto Rico. Recuperado el 10 de mayo de 2025, de https://estadisticas.pr/files/inventario/desempleo_por_municipio/2024-02-07/DTRH-LAUS-2023-12.pdf
Departamento del Trabajo y Recursos Humanos. (2025). Tasa de desempleo por municipio – diciembre 2024 (PDF) [Data set]. Instituto de Estadísticas de Puerto Rico. Recuperado el 10 de mayo de 2025, de https://estadisticas.pr/files/inventario/desempleo_por_municipio/2025-03-24/DTRH-LAUS-2024-12.pdf
NotiCel. (2021, 8 de febrero). Aumentó la tasa de desempleo en diciembre mientras se redujo el grupo trabajador. Recuperado el 16 de mayo de 2025, de https://www.noticel.com/gobierno/ahora/economia/top-stories/20210208/aumento-la-tasa-de-desempleo-en-diciembre-mientras-se-redujo-el-grupo-trabajador/
U.S. Bureau of Labor Statistics. (2023). Employment and wages annual averages, 2023. Recuperado el 1 de diciembre de 2025, de https://www.bls.gov/cew/publications/employment-and-wages-annual-averages/2023/
Esta obra está bajo una licencia de Creative Commons Reconocimiento-NoComercial 4.0 Internacional.