Estudios científicos
Combination of Machine Learning Techniques to Predict Overweight/Obesity in Adults.
Abstract:
(1) Background: Artificial intelligence using machine learning techniques may help us to predict and prevent obesity. The aim was to design an interpretable prediction algorithm for overweight/obesity risk based on a combination of different machine learning techniques. (2) Methods: 38 variables related to sociodemographic, lifestyle, and health aspects from 1179 residents in Madrid were collected and used to train predictive models. Accuracy, precision, and recall metrics were tested and compared between nine classical machine learning techniques and the predictive model based on a combination of those classical machine learning techniques. Statistical validation was performed. The shapely additive explanation technique was used to identify the variables with the greatest impact on weight gain. (3) Results: Cascade classifier model combining gradient boosting, random forest, and logistic regression models showed the best predictive results for overweight/obesity compared to all machine learning techniques tested, reaching an accuracy of 79%, precision of 84%, and recall of 89% for predictions for weight gain. Age, sex, academic level, profession, smoking habits, wine consumption, and Mediterranean diet adherence had the highest impact on predicting obesity. (4) Conclusions: A combination of machine learning techniques showed a significant improvement in accuracy to predict risk of overweight/obesity than machine learning techniques separately.
Comentarios divulgativos:
Este trabajo utiliza una combinación de técnicas de aprendizaje automático para tratar de predecir el riesgo de obesidad y sobrepeso en adultos, generando un algoritmo de predicción que tiene en cuenta múltiples factores de riesgo modificables y no modificables (ej. relacionados con el estilo de vida, la salud, el sexo, la edad, etc.).
Los resultados indicaron que la suma de estas nuevas metodologías, que constaba de tres etapas, podría ser más útil para predecir el riesgo de sobrepeso y obesidad que su uso por separado.
La precisión del modelo era superior al 80% siendo los factores con mayor impacto en la predicción de la obesidad la edad, el sexo, el nivel educativo, la profesión, el hábito tabáquico, el consumo de vino y la adherencia a la dieta mediterránea. El perfil de mayor riesgo de sobrepeso/obesidad estaría constituido por mujeres mayores de 50 años, con bajo nivel educativo y económico, exfumadoras o no fumadoras, con una baja adherencia a la dieta mediterránea, un consumo semanal de vino, sedentarismo y diagnosticadas de enfermedades crónicas, como la apnea y/o síndrome metabólico.
No obstante, son necesarios futuros estudios que validen los resultados de este trabajo, permitan mejorar la calidad de las predicciones, y que tengan en cuenta variables que no se han tenido en cuenta en este trabajo.
Estudio observacional. 1179 adultos (51,7% mujeres) españoles de Madrid. Se debe tener en cuenta que a partir de los resultados no es posible establecer conclusiones de tipo causa-efecto.