TY - JOUR
T1 - ChemTastesPredictor
T2 - An ensemble of machine learning classifiers to predict the taste of molecular tastants
AU - Rojas, Cristian
AU - Abril González, Mónica Fernanda
AU - Ballabio, Davide
AU - García, Fernando
AU - Rojas, Cristian
N1 - Publisher Copyright:
© 2025 Elsevier B.V.
PY - 2025/6/15
Y1 - 2025/6/15
N2 - El sentido del gusto juega un papel crítico en la ciencia de los alimentos , ya que impacta directamente el consumo de alimentos, la nutrición humana y la salud general. Los modelos computacionales que predicen el sabor de los saborizantes moleculares basados en su estructura química y los clasificadores de aprendizaje automático sirven como herramientas poderosas en el campo avanzado de la informática de los alimentos. Este estudio describe el desarrollo de ChemTastesPredictor diseñado para predecir el sabor de 4075 saborizantes moleculares incluidos en la versión extendida de ChemTastesDB ( https://zenodo.org/records/14963136 ). Hasta donde sabemos, esto representa el conjunto de datos más grande con un espacio químico de base amplia utilizado para calibrar modelos de aprendizaje automático (ML) para la predicción del sabor basado en descriptores moleculares y huellas dactilares. Para la validación, los conjuntos de datos se dividieron aleatoriamente en conjuntos de entrenamiento y prueba en una proporción de 75:25, asegurando distribuciones de clase equilibradas. En tareas de clasificación binaria, el clasificador Random Forest demostró el mayor rendimiento predictivo para la clasificación dulce/amargo ( NER = 0,928 y puntuación F = 0,927) y amargo/no amargo ( NER = 0,902 y puntuación F = 0,903). Adaptive Boosting sobresalió en la predicción de dulce/no dulce ( NER = 0,861 y puntuación F = 0,862). El clasificador N -Nearest Neighbors emergió como el clasificador óptimo para umami/no umami ( NER = 0,957 y puntuación F = 0,860) y dulce/amargo/umami ( NER = 0,870 y puntuación F = 0,843). Estos modelos pueden ser útiles en el desarrollo y análisis de nuevos saborizantes químicos.
AB - El sentido del gusto juega un papel crítico en la ciencia de los alimentos , ya que impacta directamente el consumo de alimentos, la nutrición humana y la salud general. Los modelos computacionales que predicen el sabor de los saborizantes moleculares basados en su estructura química y los clasificadores de aprendizaje automático sirven como herramientas poderosas en el campo avanzado de la informática de los alimentos. Este estudio describe el desarrollo de ChemTastesPredictor diseñado para predecir el sabor de 4075 saborizantes moleculares incluidos en la versión extendida de ChemTastesDB ( https://zenodo.org/records/14963136 ). Hasta donde sabemos, esto representa el conjunto de datos más grande con un espacio químico de base amplia utilizado para calibrar modelos de aprendizaje automático (ML) para la predicción del sabor basado en descriptores moleculares y huellas dactilares. Para la validación, los conjuntos de datos se dividieron aleatoriamente en conjuntos de entrenamiento y prueba en una proporción de 75:25, asegurando distribuciones de clase equilibradas. En tareas de clasificación binaria, el clasificador Random Forest demostró el mayor rendimiento predictivo para la clasificación dulce/amargo ( NER = 0,928 y puntuación F = 0,927) y amargo/no amargo ( NER = 0,902 y puntuación F = 0,903). Adaptive Boosting sobresalió en la predicción de dulce/no dulce ( NER = 0,861 y puntuación F = 0,862). El clasificador N -Nearest Neighbors emergió como el clasificador óptimo para umami/no umami ( NER = 0,957 y puntuación F = 0,860) y dulce/amargo/umami ( NER = 0,870 y puntuación F = 0,843). Estos modelos pueden ser útiles en el desarrollo y análisis de nuevos saborizantes químicos.
KW - ChemTastesDB
KW - ChemTastesPredictor
KW - Machine learning classifiers
KW - Molecular tastant
KW - QSPR
KW - ChemTastesDB
KW - ChemTastesPredictor
KW - Machine learning classifiers
KW - Molecular tastant
KW - QSPR
UR - https://www.scopus.com/pages/publications/105000237282
UR - https://www.sciencedirect.com/science/article/abs/pii/S0169743925000656
U2 - 10.1016/j.chemolab.2025.105380
DO - 10.1016/j.chemolab.2025.105380
M3 - Artículo
AN - SCOPUS:105000237282
SN - 0169-7439
VL - 261
JO - Chemometrics and Intelligent Laboratory Systems
JF - Chemometrics and Intelligent Laboratory Systems
M1 - 105380
ER -