
Recibido: - Aprobado:
253
Año 17, Vol. 34, No. 1, Enero-Junio, 2024
COPYRIGHT © (URACCAN). TODOS LOS DERECHOS RESERVADOS • ISSN 1997-9231 (Print) • ISSN 2223-6260 (Online).
https://doi.org/10.5377/rci.v34i1.19712
Licencia Creative Commons
Atribución-NoComercial-NoDerivadas253 Recibido: 05/04/2024 - Aprobado: 10/06/2024
Mendoza, J. F., Urroz Cruz, E. de los Ángeles, Martínez Cuthbert, S. T., Kelly Kandler, K. K., y Sambola, D.-M.
(2024). Modelo basado en aprendizaje automático de probabilidad de riesgo de mortalidad
en pacientes con trauma craneoencefálico, Hospital Ernesto Sequeira Blanco. Ciencia e
Interculturalidad, 34(1), 253-268. https://doi.org/10.5377/rci.v34i1.19712
Licencia Creative Commons
Atribución-NoComercial-NoDerivadas
Modelo basado en aprendizaje automático
de probabilidad de riesgo de mortalidad
en pacientes con trauma craneoencefálico,
Hospital Ernesto Sequeira Blanco
Machine learning-based model of probability of mortality risk in patients with cranioencephalic
trauma, Hospital Ernesto Sequeira Blanco
Emely de los Ángeles Urroz Cruz1
Shanely Tatiana Martinez Cuthbert2
Kerry Kenton Kelly Kandler3
Jhonny Francisco Mendoza4
Dexon-Mckensy Sambola 5
Resumen
El objetivo de este artículo es presentar los resultados obtenidos de un proyecto
cuyo propósito fue desarrollar un modelo automático que facilitara identificar las
complicaciones y riesgos de mortalidad en pacientes con Trauma Craneoencefálico que
llegan al Hospital Regional Escuela Ernesto Sequeira Blanco de la ciudad de Bluefields.
Para el desarrollo del trabajo se utilizó el marco de trabajo SCRUM y se utilizaron
técnicas de aprendizaje automático con base al conjunto de datos de CRASH-2, el
cual cuenta con una base de 20,207 registros aleatorizados de pacientes que han
sufrido trauma craneoencefálico. Se hizo uso de dos modelos de aprendizaje, el de
regresión logística y el árbol de decisiones, haciendo una combinación entre estos para
1 Ingeniera en Sistemas. Bluefields Indian & Caribbean University. Correo: emelyurroz00@gmail.com ORCID: https://orcid.
org/0009-0001-5836-3360
Systems Engineer. Bluefields Indian & Caribbean University.
2 Ingeniera en Sistemas. Bluefields Indian & Caribbean University. Correo: shancuthbert5@gmail.com ORCID: https://orcid.
org/0009-0003-8027-4756
Systems Engineer. Bluefields Indian & Caribbean University.
3 Ingeniero en Sistemas. Bluefields Indian & Caribbean University. Correo: kerry.kelly@bicu.edu.ni ORCID: https://orcid.
org/0000-0002-2922-0424
Systems Engineer. Bluefields Indian & Caribbean University.
4 Máster en Investigación aplicada a la Educación. Bluefields Indian & Caribbean University. Correo: jhonny.mendoza@bicu.edu.ni
ORCID: https://orcid.org/0000-0001-7634-5601
Master in Applied Research in Education. Bluefields Indian & Caribbean University.
5 Máster en Nueva Tecnologías en Informática, con Especialidad en Tecnologías Inteligentes y del Conocimiento con Aplicaciones en
Medicina. Bluefields Indian & Caribbean University, email: dexon.sambola@bicu.edu.ni ORCID: https://orcid.org/0000-0002-3121-0831
Master's in New Technologies in Computing, specializing in Intelligent and Knowledge Technologies with Applications in Medicine.
Bluefields Indian & Caribbean University.

tECNologíA MéDICA
254 CIENCIA E INTERCULTURALIDAD, Volumen 34, Año 17, No. 1, Enero-Junio, 2024. 254Volumen 34, Año 17, No. 1, Enero-Junio, 2024. CIENCIA E INTERCULTURALIDAD
asegurar la obtención de mejores resultados. Los datos de la primera prueba realizada,
aplicando el modelo de regresión, se obtuvo una precisión del 76 %, una sensibilidad
del 77 % y una especificidad del 73 %. En la segunda prueba, aplicando el modelo de
árbol de decisiones, se obtuvo una precisión del 80%, una sensibilidad del 81% y una
especificidad del 79%. Los resultados obtenidos en la aplicación de ambas pruebas
mostraron resultados prometedores para una predicción más precisa en los casos
revisados durante las validaciones internas. Así mismo, estos resultados muestran
que el modelo puede ser un instrumento útil en la estimación de las probabilidades
de riesgo de mortalidad en pacientes con trauma craneoencefálico.
Palabras clave: Inteligencia Artificial, modelos de aprendizaje, Machine learning,
cuidado de la salud
Abstract
The objective of this article is to present the results obtained from a project, whose
purpose was to develop an automatic model that would facilitate the identification
of complications and mortality risks in patients with Cranioencephalic Trauma
who arrive at the Ernesto Sequeira Blanco Regional Teaching Hospital in the city of
Bluefields. The SCRUM framework was used for the development of the work and
machine learning techniques were used based on the CRASH-2 dataset, which has a
base of 20,207 randomized records of patients who have suffered cranioencephalic
trauma. Two learning models, logistic regression and decision tree, were used in
combination to ensure better results. The data of the first test performed, applying
the regression model, showed an accuracy of 76%, a sensitivity of 77% and a specificity
of 73%. In the second test, applying the decision tree model, an accuracy of 80%, a
sensitivity of 81% and a specificity of 79% were obtained. The results obtained in the
application of both tests showed promising results for a more accurate prediction
in the cases reviewed during the internal validations. Likewise, these results show
that the model can be a useful tool in the estimation of mortality risk probabilities
in patients with traumatic brain injury.
Keywords: Artificial intelligence, learning models, Machine learning, healthcare
I. Introducción
En la última década, se han logrado avances notables en el campo de la salud,
con los cuales se han generado avances e impactos muy significativos tanto para los
profesionales que laboran en este ámbito como para quienes se benefician de los
servicios que se ofrecen desde este sector. Estos progresos, se han visto impulsados
por el constante crecimiento de la tecnología que ha dado origen a una amplia gama
de herramientas dentro de esta disciplina. Entre estas herramientas, la Inteligencia

Modelo basado en aprendizaje automático de probabilidad de riesgo de mortalidad en pacientes con trauma craneoencefálico, Hospital Ernesto Sequeira Blanco
255Volumen 34, Año 17, No. 1, Enero-Junio, 2024. CIENCIA E INTERCULTURALIDAD
Artificial (IA) y el Aprendizaje Automático (Machine Learning), han emergido como
unos de los avances más destacados de la última década.
Los avances que se han generado en la tecnología, se han revelado como una pieza
fundamental en el desarrollo de software, los cuales ofrecen un potencial transformador
dentro de la medicina, pues debido a la manera en que son abordados los desafíos de
la atención médica y la prestación de los servicios de salud, estas tecnologías están
jugando un papel muy importante.
Por otra parte, estas herramientas tecnológicas han dado paso al desarrollo e
implementación de modelos basados en Inteligencia Artificial y Aprendizaje Automático,
los cuales permiten crear posibles escenarios ante los riesgos de complicación que
puedan afectar a las personas que acuden a recibir servicios médicos en los centros de
salud y hospitales. Particularmente, en personas que, producto de accidentes, hayan
sufrido trauma craneoencefálico.
Profundizando un poco más en lo anterior, de acuerdo a Palomo et al. (2008),
es válido mencionar que, en las naciones avanzadas, las lesiones por traumatismo
representan la causa principal de fallecimiento en individuos menores de 40 años,
siendo los traumatismos craneoencefálicos (TCE) los responsables de la mitad de
estas defunciones. De manera que, los accidentes de tráfico, las caídas, las agresiones,
los accidentes laborales, domésticos y deportivos, se cuentan entre las razones más
comunes que desencadenan estos traumatismos. Por otro lado, de acuerdo con Cam
(2011), es posible determinar la severidad del TCE, mediante la utilización de la escala
de Coma de Glasgow (GCS) la cual permite realizar una valorización del mismo y
determinar si este es leve (GCS 14 a15), moderado (GCS 9 a 13) o grave (GCS 3 a 8).
Trasladando toda esta tecnología dentro del área clínica que interviene para
atender los pacientes víctimas de TCE, no cabe duda que la Inteligencia Artificial ha
generado un crecimiento significativo en el área de la salud, el cual se ha potenciado
con el aprendizaje automático y, aunque este no es un concepto nuevo, pues ha estado
sobre la mesa desde 1959 cuando fue acuñado por Arthur Samuel, quien mostró su
funcionamiento en un juego de dama en un programa para computadora, su aplicación
en el contexto actual es muy novedoso.
Ahora bien, es sano mencionar que el Aprendizaje Automático adquiere o desarrolla
su conocimiento mediante el análisis de un gran volumen de datos, los que una vez
que han sido analizados, permite ser un respaldo para la toma decisiones mediante la
utilización de algoritmos; en otras palabras, su capacidad para resolver tareas implica
aspectos comparables a la inteligencia humana (Álvarez et al., 2020).

tECNologíA MéDICA
256 CIENCIA E INTERCULTURALIDAD, Volumen 34, Año 17, No. 1, Enero-Junio, 2024.
II. Revisión de literatura
Aplicación de la Inteligencia Artificial y el Aprendizaje Automático en la
medicina
De acuerdo a Mutual Médica (2022), la implementación de estas nuevas tecnologías
basadas Inteligencia Artificial dentro del campo de la medicina, ha supuesto la
introducción de una tecnología que posee la capacidad de transformar la industria
de la salud y ampliar las oportunidades para médicos, investigadores y compañías
dentro del ámbito de la medicina e incluso dentro de la industria farmacéutica.
También, es válido destacar que la Inteligencia Artificial se ha convertido en
una tecnología clave y útil en cuanto a la ejecución de investigaciones, diagnósticos
y tratamientos de múltiples enfermedades (Campus IA, 2023). Sumado a esto, de
acuerdo a Lanzagorta-Ortega et al. (2022), la IA aplicada en la medicina, promete una
innovación significativa en el cuidado de la salud en las distintas áreas médicas, lo
que podría significar un cambio de época o «momento Gutenberg» para la medicina,
planteamiento que no está lejos de la realidad actual, pues desde hace ya algunos años
la medicina ha iniciado a utilizar las diferentes tecnologías que han surgido en las
últimas décadas, para brindar servicios médicos más efectivos y rápidos.
De este modo, entre los beneficios de la Inteligencia Artificial, se puede mencionar
que son la pronta detección precoz y diagnóstico de enfermedades (Campus IA. , 2023).
Conocer a tiempo la presencia de alguna enfermedad, es de gran importancia para el
sector médico, pues más pronto podrán tomar las medidas necesarias para proteger
la salud del paciente que adquiere la enfermedad.
También, puede ser muy útil en el diseño de tratamiento personalizado, la eficiencia
de la atención médica, el apoyo en la toma de decisiones clínicas y el análisis de imágenes
(Telefónica, 2023), esta última de gran importancia, porque permite que los médicos
puedan determinar con mayor exactitud el origen del padecimiento de los pacientes.
Así mismo, en el sector de la salud, Expósito y Ávila (2008), comentan que las
aplicaciones dentro del ámbito de la Inteligencia Artificial están impulsando un gran
interés, ya que ofrecen oportunidades para intervenir en situaciones que exigen un
amplio conocimiento médico y un procesamiento rápido de la información para la
toma eficiente de decisiones. Por lo tanto, estas herramientas se muestran como una
posibilidad crucial en escenarios donde la complejidad de datos y la rapidez de acción
son fundamentales.
Por otra parte, también expresan que el avance en las tecnologías relacionadas
con la aplicación de técnicas de Inteligencia Artificial en el ámbito de la salud abre un
horizonte más innovador y prometedor. Esta evolución tiene el potencial de reducir

Modelo basado en aprendizaje automático de probabilidad de riesgo de mortalidad en pacientes con trauma craneoencefálico, Hospital Ernesto Sequeira Blanco
257Volumen 34, Año 17, No. 1, Enero-Junio, 2024. CIENCIA E INTERCULTURALIDAD
los gastos, los tiempos y los errores en la práctica médica, a la vez que mejora la
gestión de los recursos humanos en áreas médicas que demandan una mayor atención.
Finalmente, estas tecnologías ofrecen una prometedora perspectiva para mejorar la
eficiencia y la calidad en el campo de la medicina.
Otros beneficios de la Inteligencia Artificial dentro del sector médico, se puede
evidenciar en la mejora de los informes médicos, el registro de los pacientes, los ensayos
médicos, y en las revistas médicas para revelar insumos a través de la obtención de
datos relevantes que faciliten el diagnóstico médico de pacientes y desarrollo de
investigaciones (Mutual Médica, 2022).
Por otra parte, el Aprendizaje Automático, de acuerdo a Madrid y Rodríguez
(2018), forma parte de la Inteligencia Artificial y se puede definir como un enfoque de
la ingeniería que pretende imitar la estructura y funcionamiento del cerebro humano.
El objetivo de esta tecnología radica en el desarrollo de técnicas basadas en algoritmos
capaces de analizar un extenso conjunto de datos, mediante el cual extraen y generan
información para luego realizar predicciones y clasificar nuevas observaciones basadas
en análisis previos. Estos procesos se llevan a cabo mediante una etapa inicial de
entrenamiento conocida como aprendizaje.
Tal como se puede leer en el enunciado anterior, el Aprendizaje Automático, se
vuelve un aliado muy poderoso en cuanto al análisis de datos dentro del sector médico,
porque puede ser un facilitador en la toma de decisiones en relación a los pacientes
con TCE que llegan a las unidades de salud. La velocidad con la que se procesan los
datos, optimiza el tiempo y reduce significativamente los escenarios más trágicos
porque disminuye el tiempo de respuesta para dar una atención adecuada y a tiempo
para estos pacientes.
No cabe duda que, tanto la Inteligencia Artificial como el Aprendizaje Automático,
son dos herramientas de gran potencial dentro del sector de la medicina. A pesar de
ello, es importante tener en cuenta que se hace necesario tomar en cuenta ciertas
consideraciones para realizar una buena gestión de estas herramientas durante su
aplicación en la medicina. La falta de normativas, la garantía en la confidencialidad
de los pacientes, la posibilidad de que existan facilidad de usar irresponsablemente
los datos médicos y la falta de preparación de los médicos para el manejo de estas
tecnologías, pueden ser algunos factores que afecten negativamente su aplicación
dentro de la medicina (Mutual Médica, 2022).
III. Materiales y métodos
El proyecto de investigación se realizó en el Hospital Regional Escuela Dr. Ernesto
Sequeira Blanco, de la ciudad de Bluefields, Región Autónoma de la Costa Caribe Sur.
El estudio fue de carácter cuantitativo, dado que se utilizaron evaluaciones de tipo

tECNologíA MéDICA
258 CIENCIA E INTERCULTURALIDAD, Volumen 34, Año 17, No. 1, Enero-Junio, 2024.
cuantitativa, cálculos matemáticos, análisis de datos estadísticos cuantitativos y
análisis de variables para establecer patrones de comportamiento y probar algoritmos.
Se trabajó bajo un paradigma descriptivo, pues se realizó una descripción a detalle
de las particularidades relacionadas con el trauma craneoencefálico, el impacto que
este tiene en las tasas de mortalidad y en la salud general de los pacientes. El enfoque
de trabajo se basó en la implementación y aplicación del marco de trabajo SCRUM,
reconocido por ser una herramienta que facilita el desarrollo ágil de software. Este
método se diferencia por su enfoque iterativo e incremental, lo que significa que el
proceso avanza en etapas sucesivas y mejoras progresivas. SCRUM ha demostrado ser
una metodología eficaz para abordar proyectos complejos, permitiendo una mayor
flexibilidad, adaptación a cambios y una entrega más rápida y eficiente en el desarrollo
de aplicaciones y sistemas informáticos.
De acuerdo a Bhaskar (2024), el SCRUM es un marco ágil adaptable, rápido, flexible
y eficaz que está diseñado para ofrecer valor al cliente durante todo el desarrollo de un
proyecto de software, razón por la cual, se consideró una herramienta muy practica
y productiva para utilizar durante el desarrollo de los modelos propuestos dentro de
este proyecto de investigación.
Metodología de desarrollo
Para el desarrollo del proyecto de software, se utilizó el lenguaje de programación
Python en combinación con la biblioteca Scikit-learn. Asimismo, se recurrió a modelos
matemáticos como los algoritmos de regresión logística, con el propósito de facilitar
la predicción de resultados basados en conjuntos de predictores, ya sea que exista una
característica específica o no. De igual modo, se incorporaron los algoritmos de árbol
de decisión, los cuales permiten descubrir estructuras complejas de los datos que no
podrían ser identificadas mediante métodos convencionales de regresión.
Además, se eligió Python porque la legibilidad del código desarrollado en este
lenguaje de programación, asociado a Machine Learning, destaca por su simplicidad,
elegancia y búsqueda de consistencia. Hay que decir también, que este cumple con
funciones esenciales para vincular ambos ecosistemas, lo que facilita la creación de
código comprensible y de rápido aprendizaje, características fundamentales para el
desarrollo de proyectos de Aprendizaje Automático.
Siguiendo con la metodología de desarrollo, se llevó a cabo la definición de los
requisitos necesarios para el desarrollo del modelo a utilizar para la predicción de la
tasa de mortalidad, mediante el análisis y comprensión de los datos obtenidos en los
registros de pacientes con TCE del Hospital Regional Escuela Dr. Ernesto Sequeira
Blanco. Se identificaron las variables relevantes que podían influir en el riesgo de
mortalidad y se procedió a la recopilación y preparación de los datos necesarios.

Modelo basado en aprendizaje automático de probabilidad de riesgo de mortalidad en pacientes con trauma craneoencefálico, Hospital Ernesto Sequeira Blanco
259Volumen 34, Año 17, No. 1, Enero-Junio, 2024. CIENCIA E INTERCULTURALIDAD
De este modo, el proceso para el diseño del modelo predictivo se realizó en 6 pasos:
1. El primer paso fue la obtención de los datos, el cual consistió en la recopilación
y medición de la información sobre las variables que se establecen de manera
sistemática, para la obtención de respuestas de mucha relevancia, la prueba
de hipótesis y la evaluación de los resultados (KIO IT Services, s.f.). ), la cual
se hizo en un conjunto de datos que contenía toda la información sobre los
pacientes que habían sufrido trauma craneoencefálico. Además, se incluyeron
datos como características demográficas, resultados del trauma (por ejemplo,
si hubo mortalidad o no) y la propia información médica del paciente.
2. El segundo paso fue, una vez obtenido los datos, la preparación de estos a
través de la limpieza y consolidación de todos los datos sin procesar antes
de ser utilizados en el análisis (Alteryx, s.f.). En esta etapa se realizó una
limpieza y procesamiento de los datos previamente obtenidos; esto incluyó
la eliminación de valores que hicieron falta y se realizó la normalización de
las variables.
3. El tercer paso consistió en la selección de las características, lo que permitió
elegir las variables de mayor relevancia e información para el desarrollo de
un modelo de aprendizaje automático y mejorar así, la precisión y capacidad
de generalizar el modelo (Generación Automática de Conocimiento S.L. –
GAMCO, s.f.). Las características elegidas fueron aquellas que tuvieron mucha
más relevancia para el propósito del estudio, de manera que se obtuvo una
mayor significancia en el desarrollo del modelo de aprendizaje automático.
4. En el cuarto paso, se realizó el entrenamiento del modelo de aprendizaje. Este
es un proceso en que se logra enseñar al algoritmo a que logre la interpretación
correcta de los datos y, con base en ello, se pueda facilitar la toma de decisiones
con mayor precisión con el objetivo de dar solución a ciertas tareas del modelo
(Lena, 2023). Para esto, se llevó a cabo el entrenamiento del modelo mediante
la utilización de algoritmos de aprendizaje automático tales como la regresión
lineal y el árbol de decisiones, mismos que permitieron ejercitar al modelo
con los datos previamente preparados.
5. El quinto pasó fue la evaluación del modelo. Esta se llevó a cabo para valorar la
precisión del modelo mediante el uso de técnicas como la validación cruzada,
la que permite evaluar los resultados del análisis estadístico garantizando
la independencia de las particiones entre los datos utilizados para el
entrenamiento y la prueba. Para esta evaluación, se utilizaron las métricas
propuestas por Díaz (2020). Estás métricas fueron la precisión, sensibilidad,
especificidad y AUC-ROC.

tECNologíA MéDICA
260 CIENCIA E INTERCULTURALIDAD, Volumen 34, Año 17, No. 1, Enero-Junio, 2024.
6. Por último, el paso 6 consistió en la implementación del modelo entrenado.
Para esto, se desarrolló una página web de uso para el personal del hospital, de
manera que pudieran utilizarlo como una herramienta de soporte en la toma
de decisiones en la estimación de la probabilidad de riesgo de mortalidad.
También, es importante destacar que en la preparación de los datos se identificó
la columna objetivo, entre las 44 columnas disponibles. Esta columna objetivo fue la
columna con los datos necesarios para hacer las predicciones, en este caso la columna
denominada “ddeath”, la que permitió hacer la distinción entre los pacientes vivos
y los pacientes fallecidos. Para ello, se utilizó la librería panda en el lenguaje de
programación Python que, a través de la función csv, se logró la lectura de todo el
contenido del diccionario de datos CRASH-2.
En este punto, se llevó a cabo el formateo de las fechas, lo cual permitió facilitar la
manipulación de los datos. Se ajustaron los datos de la variable objetivo de manera que,
con el número 1, se mostrará si el paciente está vivo y 0, si el paciente está muerto. En
el caso de las celdas vacías, se llenaron con 0, a la vez que se eliminaron las columnas
que se consideraron defectuosas para la predicción del modelo, de manera que se
pudiera reducir el conjunto de datos. Por último, se eliminaron los valores nulos y
los valores duplicados.
De igual forma, en la selección de características de la muestra, se utilizó algoritmos
de selección de características, para medir la relevancia de cada característica en el
modelo. Para este particular, se utilizó la prueba chi-cuadrado con la librería sklearn,
trabajando con las características que se presentan a continuación:
isex: Sexo del paciente
iage: Edad del paciente
isbp: Presión arterial sistólica en mmHg (Rango 4 a 250)
icc: Tiempo de llenado capilar central en segundos
irr: Frecuencia respiratoria por minuto
ihr: Frecuencia cardiaca por minuto
bheadinj: Lesión en la cabeza (1=Yes, 0=No)
igcs: Total de puntos de la Escala de Coma Glasgow
Una vez que se logró la limpieza de los datos, estos se guardaron en un dataframe.
Seguidamente, se separaron las características (X) de la variable objetivo (y), donde
(X) son todas las columnas que se tomarán en cuenta y la (y) el objetivo del proyecto,
en este caso, la característica ddeath. De este modo, con la función SelectKBest () se
eligieron las 10 características más relevantes, mediante la utilización de la prueba
ANOVA (f_classif). La prueba ANOVA evalúa la relación entre cada característica y la
variable objetivo mediante el análisis de la varianza. La variable k indica el número
de características a seleccionar, en este caso, 10 características.

Modelo basado en aprendizaje automático de probabilidad de riesgo de mortalidad en pacientes con trauma craneoencefálico, Hospital Ernesto Sequeira Blanco
261Volumen 34, Año 17, No. 1, Enero-Junio, 2024. CIENCIA E INTERCULTURALIDAD
Obtenidos los datos y las características, se procedió al entrenamiento del modelo,
en este paso primero se normalizaron los valores. La normalización de valores implica
realizar un proceso de pre procesamiento de los datos para hacer ajuste a los valores
de las variables numéricas, de manera que puedan estar en un rango similar. De este
modo, se logra que los algoritmos de aprendizaje funcionen de una manera más
eficiente y precisa. En este caso, se utilizó el escalado Estandarización (z-score) o
StandardScaler. Este método permite transformar los datos de manera que la media
de cada característica sea igual a 0 y la desviación estándar sea igual a 1. Esto se
obtiene mediante la resta de la media y dividiéndola por la desviación estándar para
cada característica utilizando la formula la formula siguiente.
Xscaled=(X-media(X))/desviacionestandar(X)
Esta operación fue posible mediante la utilización de la librería sklearn. Para ello, se
creó un objeto StandardScaler() y se utilizó fit_transform(), de manera que permitiera
ajustar y escalar los datos, los que también pasaron por la función SMOTE(). Esto
último, sirvió para nivelar los datos de manera que no hubiera más casos positivos
que casos negativos. Finalmente, estos datos pasaron por la función train_test_split(),
la que permite separar los datos en entrenamiento y prueba, para después definir el
modelo y pasarle los datos por separado para que pueda iniciarse el entrenamiento.
La Figura 1 muestra la manera en que se separaron los datos para llevar a cabo el
entrenamiento del modelo y garantizar, de este modo, tener resultados más prácticos
y confiables para el desarrollo e implementación de los modelos.
Figura 1
Distribución de conjunto de datos

tECNologíA MéDICA
262 CIENCIA E INTERCULTURALIDAD, Volumen 34, Año 17, No. 1, Enero-Junio, 2024.
La Figura 1 muestra la manera en que se realizó la distribución de los datos. Estos
fueron segmentados en tres grupos: Entrenamiento (70 %), Prueba (20 %) y validación
(10%), de los 20,207 datos presentes en el conjunto CRASH-2. Se utilizaron técnicas
de validación cruzada, la cual es una técnica que se usa para evaluar modelos de
Aprendizaje Automático mediante el entrenamiento de varios modelos de Aprendizaje
Automático en subconjuntos de los datos de entrada disponibles para luego evaluarlos
con el subconjunto complementario de los datos para evitar sobreajuste (Amazon
Machine Learning, 2012).
Población, muestra y muestreo
La población de estudio estuvo conformada por pacientes mayores de 16 años que
ingresaron a la sala de emergencias del Hospital Regional Escuela Dr. Ernesto Sequeira
Blanco debido a traumatismos craneoencefálicos (TCE) en el período comprendido
entre 2020 y 2021. Durante este periodo, se generaron 41 expedientes clínicos de
pacientes atendidos con TCE en dicha unidad de salud, los cuales constituyen una
referencia directa para el análisis del modelo.
El muestreo empleado fue de tipo no probabilístico y se definió como una
muestra por conveniencia, complementada con el uso del conjunto de datos Clinical
Randomization of an Antifibrinolytic in Significant Hemorrhage (CRASH-2) como
base de referencia.
El conjunto de datos CRASH-2 incluye información detallada de 20,207 pacientes
con TCE, provenientes de aproximadamente 274 hospitales distribuidos en 40 países.
Este acceso a un amplio volumen de datos permitió sustentar la muestra utilizada
en el estudio, brindando una visión global de los casos de TCE y sus desenlaces
clínicos. Es importante señalar que la validación del modelo de aprendizaje se realizó
exclusivamente con los datos disponibles en el conjunto CRASH-2, complementados con
el análisis de los 41 expedientes generados durante el periodo de estudio en el hospital,
asegurando la robustez del análisis sin la necesidad de recopilar datos adicionales.
Técnicas e instrumentos de investigación
Durante el levantamiento de los datos, no se tuvo contacto directo con la muestra
de estudio, por lo que el proceso de recolección de datos se llevó a cabo mediante la
observación no participativa. De este modo, la obtención de los datos se basó en los
diagnósticos clínicos de los pacientes con TCE atendidos en el área de emergencia del
Hospital Regional Escuela Dr. Ernesto Sequeira Blanco, los que se respaldaron con
los datos obtenidos de CRASH-2.

Modelo basado en aprendizaje automático de probabilidad de riesgo de mortalidad en pacientes con trauma craneoencefálico, Hospital Ernesto Sequeira Blanco
263Volumen 34, Año 17, No. 1, Enero-Junio, 2024. CIENCIA E INTERCULTURALIDAD
IV. Resultados y discusión
En este apartado se presentan y analizan los resultados obtenidos por el equipo
de investigadores durante el proceso de investigación. Se muestran los resultados más
relevantes de la investigación y la discusión de los mismos.
No está de más mencionar la importancia del análisis crítico y la triangulación de
los datos obtenidos y realizados en la investigación, ya que esto aumentó la validez
de los resultados y facilitó la comprensión del estudio. De este modo, los resultados
que se obtuvieron durante el desarrollo e implementación del software para el modelo
de estimación de riesgo de mortalidad en pacientes con TCE, fueron prometedores.
El modelo demostró ser capaz de predecir con una precisión significativa la
probabilidad de mortalidad de los casos utilizados en la validación interna, lo cual
podrá ser de gran utilidad para el sector salud y el personal médico que toma las
decisiones clínicas.
La Figura 2, muestra que el modelo de regresión logística logró una precisión de
75.03%, lo que significa que el modelo identifica correctamente alrededor del 75% de
los pacientes con riesgo de mortalidad, sensibilidad de 76.42%, lo que indica que el
modelo puede detectar correctamente alrededor del 76% de los pacientes con riesgo
de mortalidad, especificidad de 72.39%, lo que indica que el modelo puede identificar
correctamente alrededor del 72% de los pacientes sin riesgo de mortalidad.
La curva ROC (Receiver Operating Characteristic), “permite comparar diferentes
modelos para identificar cual otorga mejor rendimiento como clasificador” (Torres,
s.f.) y también, “es un gráfico muy utilizado para evaluar modelos de Machine Learning
para problemas de clasificación" (Díaz, 2020). Por lo tanto, sigue comentando Díaz
(2020), la curva ROC también permite mostrar la relación que se genera o existe entre
la tasa de verdaderos positivos y la tasa de falsos positivos. De este modo, una curva
ROC ideal se acercaría al ángulo noroeste del gráfico, lo cual significaría que el modelo
tiene una alta tasa de verdaderos positivos, como se puede apreciar en la Figura 2, esto
se transcribe a un 81.41% de instancias que se han logrado clasificar correctamente.

tECNologíA MéDICA
264 CIENCIA E INTERCULTURALIDAD, Volumen 34, Año 17, No. 1, Enero-Junio, 2024.
Figura 2
Representación gráfica del rendimiento del modelo de regresión logística
Por otro lado, en la Figura 3, se muestra que con el modelo basado en el árbol de
decisiones se logró una precisión de 86.48%, lo que significa que el modelo identifica
correctamente alrededor del 86% de los pacientes con riesgo de mortalidad. De igual
modo, mostró una sensibilidad del 85.00%, lo cual indica que el modelo también puede
detectar correctamente alrededor del 85% de los pacientes con riesgo de mortalidad.
Así mismo, mostró una especificidad del 87.66%, lo que indica que el modelo tiene la
capacidad de identificar correctamente alrededor del 87% de los pacientes sin riesgo
de mortalidad.
El modelo basado en el árbol de decisiones, mostró una mejor puntuación que
el modelo basado en regresión logística. A pesar de ello, ambos modelos arrojaron
resultados prometedores y muy significativos para los objetivos perseguidos por el
proyecto de investigación.
Como se puede ver, la curva ROC muestra un rendimiento más bajo en comparación
con la anterior, ya que logró clasificar correctamente un 74.36% de las instancias, lo
que puede traducirse como una menor capacidad del sistema para discriminar entre las
clases positivas y las clases negativas. De ese modo, se nota que un área bajo la curva
(AUC-ROC) más cercana a 1.0 es un indicador de que el modelo es más competente
en su capacidad de clasificación.

Modelo basado en aprendizaje automático de probabilidad de riesgo de mortalidad en pacientes con trauma craneoencefálico, Hospital Ernesto Sequeira Blanco
265Volumen 34, Año 17, No. 1, Enero-Junio, 2024. CIENCIA E INTERCULTURALIDAD
Figura 3
Representación gráfica del rendimiento del modelo de árbol de decisiones
Por otra parte, es necesario mencionar que las variables edad, sexo, presión arterial
sistólica, tiempo de recarga capilar central, frecuencia cardiaca por minuto, frecuencia
respiratoria por minuto, puntaje de coma de Glasgow y tipo de lesión, utilizadas para
los ambos modelos, demostraron ser datos que tuvieron un impacto significativo en la
predicción de la mortalidad en pacientes que sufrieron TCE. A pesar de lo prometedor
de estos resultados, es conveniente destacar que los modelos desarrollados se basaron
en datos de un ensayo clínico y requieren de una validación prospectiva adicional
(validación externa) con conjuntos de datos independientes para fortalecer y validar
la generalización de los mismos.
A pesar de ello, se puede afirmar que el modelo propuesto posee un gran potencial
en cuanto a la mejora relacionada con la atención médica y, por supuesto, en la
toma de decisiones por parte del personal médico del Hospital Regional Escuela Dr.
Ernesto Sequeira Blanco de la ciudad de Bluefields. Así mismo, la implementación
de la Inteligencia Artificial y el Aprendizaje Automático en el campo de la medicina,
específicamente en el trato médico a los pacientes con TCE, ha demostrado ser
prometedora y que puede contribuir significativamente a la disminución de la
morbimortalidad asociada a esta condición de salud.
Por último, el proceso de la selección del origen de los datos y la limpieza de los
mismos que hicieron los investigadores, marcaron un papel muy valioso en el resultado
y desempeño final del modelo predictivo. La decisión de haber seleccionado únicamente
ocho variables de conjunto original de datos, aumentó en gran medida la capacidad

tECNologíA MéDICA
266 CIENCIA E INTERCULTURALIDAD, Volumen 34, Año 17, No. 1, Enero-Junio, 2024.
de predecir acertadamente la posibilidad de muerte en los pacientes que sufrieron
trauma craneoencefálico con base al conjunto de datos trabajado.
A pesar de lo mencionado anteriormente, es importante hacer algunas
consideraciones en relación a algunas limitaciones y desafíos que se tuvieron durante
la implementación de este modelo. Uno de los desafíos que se debe tener presente y
sobre el cual se debe prestar mucha atención, es el relacionado con la disponibilidad
y la calidad de los datos clínicos que se necesitan para alimentar el modelo.
V. Conclusiones
Con el desarrollo del proyecto de investigación, se logró el desarrollo de un modelo
predictivo con base en el algoritmo de árbol de decisiones y el de regresión logística.
Esto permitió a los investigadores la realización más detallada de una estimación de la
probabilidad de mortalidad existente en pacientes con TCE. De esta manera, se logró
el desarrollo de una aplicación médica que puede ser implementada en la unidad de
salud que formo parte de estudio.
El uso de las tecnologías basadas en Inteligencia Artificial y combinadas con
Aprendizaje Automático dentro del campo de la salud, muestra un potencial de mucho
valor, el cual puede permitir la mejora en la toma de decisiones de tipo clínica. A
pesar de ello, es importante mencionar que los modelos desarrollados son recursos
o herramientas complementarias a la toma de decisiones clínica y, por lo tanto, bajo
ninguna circunstancia deberían sustituir el juicio clínico del cuerpo médico.
Se reconoce que se puede obtener un mejor rendimiento con el uso de datos
mejor estructurados y con una mayor uniformidad demográfica. Además, es meritorio
reconocer la necesidad de actualizar el modelo para considerar situaciones más allá
de las ocho horas posteriores a la lesión del paciente, lo que agregaría un mayor
valor y utilidad clínica, ya que el procesamiento de los datos fue una etapa crucial
en el desarrollo del modelo, por lo que es de gran importancia la obtención de datos
confiables y de calidad para lograr un rendimiento más óptimo.
Resulta imprescindible disponer de datos más completos, exhaustivos y precisos a
fin de conseguir predicciones más fiables y completas. Además de este requerimiento,
es crucial e importante desarrollar otras investigaciones que complementen este
estudio, de manera que posibiliten la evaluación tanto de la efectividad como de la
aplicabilidad general del modelo entre distintos entornos hospitalarios y entre diversas
poblaciones de pacientes. Por lo tanto, lograr la validación externa del modelo a través
de datos provenientes de otros centros hospitalarios, así como la comparación con
otros métodos de estimación de riesgo de mortalidad, se proyectan como aspectos de
gran relevancia que deben ser considerados para realizar las mejoras y actualizaciones
necesarias para el modelo.

Modelo basado en aprendizaje automático de probabilidad de riesgo de mortalidad en pacientes con trauma craneoencefálico, Hospital Ernesto Sequeira Blanco
267Volumen 34, Año 17, No. 1, Enero-Junio, 2024. CIENCIA E INTERCULTURALIDAD
Los resultados de este estudio ofrecen una perspectiva alentadora para el desarrollo
de futuros modelos de predicción basados en Inteligencia Artificial y Aprendizaje
Automático, los cuales podrían integrarse en los sistemas de atención de pacientes
que han sufrido TCE, de manera que permita predecir la supervivencia de los mismos.
Para finalizar, el presente estudio puede tomarse como referencia y punto de
partida para futuras investigaciones en esta línea de investigación, mismas que estén
relacionadas con la obtención del impacto que estos modelos pueden generar en la
predicción de los resultados como producto del tratamiento y atenciones ofrecidas a
los pacientes que han sufrido TCE.
VI. Referencias
Álvarez, V. M., Quirós, M. L. M., y Cortés, B. M. V. (2020). Inteligencia artificial y
aprendizaje automático en medicina. Revista Médica Sinergia, 5(8), e557. https://
doi.org/10.31434/rms.v5i8.557
Amazon Machine Learning. (2022). Guía para Desarrolladores-Validación Cruzada.
Amazon.com. https://acortar.link/AvrMyd
Alteryx. (s.f.). Preparación de datos. Recuperado el 3 de julio de 2023, de https://www.
alteryx.com/es/glossary/data-preparation
Bhaskar, S. (5 de marzo, 2024). ¿Qué Es La Metodología Scrum? Y Gestión De Proyectos
Scrum. https://www.nimblework.com/es/agile/que-es-scrum/
Cam, P. J. L. (2011). Manejo inicial del paciente con trauma craneoencefálico e
hipertensión endocraneana aguda. Acta Médica Peruana, 28(1), 39-45. http://www.
scielo.org.pe/scielo.php?script=sci_arttext&pid=S1728-59172011000100007&ln
g=es&tlng=es
Campus IA. (10 de mayo de 2023). Usos de la inteligencia artificial en medicina y sus
beneficios en la salud de los pacientes. Recuperado el 10 de julio de 2023, de https://
campus.sanofi.es/es/noticias/2021/inteligencia-artificial-salud
Díaz, R. (08 de mayo, 2020). Métricas de Clasificación. The Machine Learners.
Recuperado el 20 de julio de 2023, de https://www.themachinelearners.com/
metricas-de-clasificacion

tECNologíA MéDICA
268 CIENCIA E INTERCULTURALIDAD, Volumen 34, Año 17, No. 1, Enero-Junio, 2024.
Expósito, G. M.C., y Ávila, Á. R. (2008). Aplicaciones de la inteligencia artificial en la
Medicina: perspectivas y problemas. ACIMED, 17(5). http://scielo.sld.cu/scielo.
php?script=sci_arttext&pid=S1024-94352008000500005&lng=es&tlng=es
Telefónica. (10 de marzo, 2023). ¿Qué beneficios tiene la Inteligencia
Artificial en la medicina? Telefónica. Recuperado el 10 de julio de
2023, de https://www.telefonica.com/es/sala-comunicacion/blog/
que-beneficios-tiene-la-inteligencia-artificial-en-la-medicina/
KIO IT Services. (s.f.). Técnicas y beneficios de recolección de datos digitales.
Recuperado el 3 de julio de 2023, de https://www.kio.tech/blog/aplicaciones/
tecnicas-y-beneficios-de-recoleccion-de-datos-digitales
Lanzagorta-Ortega, D., Carrillo-Pérez, D., y Carrillo-Esper, R. (2022). Inteligencia
artificial en medicina: presente y futuro. Gaceta médica de México, 158(Supl. 1),
17-21. https://doi.org/10.24875/gmm.m22000688
Lena, I. (18 de julio de 2023). Pasos y mejores prácticas en el entrenamiento
de modelos de la IA . https://blog.pangeanic.com/es/
pasos-y-mejores-practicas-en-el-entrenamiento-de-modelos-de-la-ia
Madrid, G. A., y Rodríguez, R. L. (junio de 2018). Aprendizaje Automático en la
Medicina. Cuadernos de Autoinmunidad (1), 04 - 14. https://aadea.es/wp-content/
uploads/2018/07/Cuadernos-de-Autoinmunidad.-A%C3%B1o-11.-Num1.pdf
Mutual Médica (02 de junio de 2022). La Inteligencia Artificial y sus aplicaciones en la
medicina. Recuperado el 5 de agosto de 2023, de https://www.mutualmedica.com/
post/mutualmedica/la-inteligencia-artificial-y-sus-aplicaciones-en-la-medicina
Palomo, R. J. L., Ramos, M. V., Palomo, G. I., López, C. A., y Santos, A. I. M. (2008).
Patología forense y neurología asociada de los traumatismos craneoencefálicos:
Estudio práctico. Cuadernos de Medicina Forense, (52), 87-118. http://scielo.
isciii.es/scielo.php?script=sci_arttext&pid=S1135-76062008000200001&lng
=es&tlng=es
Generación Automática de Conocimiento S. L. – GAMCO (s.f.). Qué es la selección de
características. Recuperado el 4 de mayo de 2023, de https://gamco.es/glosario/
seleccion-de-caracteristicas
Torres, L. (s.f.). Curva ROC y AUC en Python. The Machine Learners. Recuperado
el 20 de mayo de 2020, de https://www.themachinelearners.com/
curva-roc-vs-prec-recall/#%C2%BFQue_es_la_curva_ROC