Tesis Caracterización y Control de Calidad Con Plantas Medicinales PDF
Tesis Caracterización y Control de Calidad Con Plantas Medicinales PDF
Tesis Caracterización y Control de Calidad Con Plantas Medicinales PDF
Aplicación de Métodos Quimiométricos
para la Caracterización y Control de Calidad
de Plantas Medicinales.
Juan Ricardo Lucio Gutiérrez
TESIS DOCTORAL
Programa de Doctorado de Química
Director: Dr. Jordi Coello Bonilla
Departamento de Química
Facultad de Ciencias
2012
Memòria presentada per aspirar al Grau de Doctor per Juan Ricardo Lucio Gutiérrez
Juan Ricardo Lucio Gutiérrez
Vist i plau
Dr. Jordi Coello Bonilla
Catedràtic Química Analítica
Bellaterra, 11 de Juliol de 2012.
Agradecimientos
A Dios quién me da fuerza para enfrentar los retos que surgen en el cumplimiento de
mi Leyenda Personal y para seguir por el sendero de la vida cada día.
A mi familia por su apoyo y comprensión, en esta estancia tan lejana.
Quiero empezar por mi asesor, el Dr. Jordi Coello, por toda la ayuda que me ha brindado a lo
largo de este proyecto; por su asistencia a través de los (tediosos) trámites administrativos y
por su tiempo, esfuerzo y paciencia. Así mismo, por las positivas contribuciones que ha
realizado a mi formación profesional y como persona. También por haberme ayudado tanto, a
través de sus explicaciones y consejos, con el proceso de adaptación al nuevo entorno cultural;
una situación siempre complicada para un extranjero cuando se encuentra recién llegado a un
País. También quiero hacer mención del Dr. Santiago Maspoch por las, siempre certeras,
observaciones y contribuciones hechas durante este proyecto. Así mismo, agradezco a los
catedráticos que integran el Grupo de Quimiometría Aplicada, en especial al Dr. Marcelo
Blanco, por las facilidades prestadas para que fuesen posibles los trabajos realizados.
A mis compañeros del Grupo de Quimiometría Aplicada, a los más antiguos y a los que han
llegado en fechas más recientes y también a las personas con las que he convivido durante
estos años en Barcelona; todos me han dejado alguna experiencia de vida y por lo tanto he
aprendido algo nuevo de todos y cada uno, que de un modo u otro me ha enriquecido como
persona. Espero tener la sabiduría para aplicar lo aprendido. No me es posible listar a todas las
personas en este apartado, no quiero que nadie se sienta menospreciado; no obstante, me
gustaría hacer mención de David Zamora por su amistad (siempre dispuesto a ofrecer
asistencia, consejo y consuelo ante las adversidades personales que me aquejaban); al Sr.
“Don” Ing. M. Sc. Francesc Vila García (Rancez), por su valiosa asistencia en el campo de la
informática (me ahorro algunos euros en paracetamol); al Dr. José Amigo por su buena
disposición para explicar aspectos técnicos de Matlab y de la quimiometría y a Isabel Osorio
por su apoyo moral.
A mis profesores y amigos de la Facultad de Medicina de la U.A.N.L., en especial a la Dra. Ma.
de la Luz Salazar Cavazos y a la Dra. Noemí Waksman, pues gracias a su apoyo fueron posibles
la gestiones necesarias para realizar la Tesis Doctoral en España. Así mismo, agradezco a la Dra.
Aurora Garza por su colaboración en el trabajo sobre Turnera diffusa. A mi estimada amiga
Anabel Torres Cirio que siempre tiene palabras para motivarme.
Agradecimientos
Agradezco a la Licenciada en Farmacia María José Alonso Osorio, vocal de plantas medicinales
y homeopatía del Colegio Oficial de Farmacéuticos de Barcelona, por la orientación recibida
sobre el uso y consumo de plantas medicinales en España y a la Empresa Amorós Nature por la
donación realizada de diversas muestras autenticadas de plantas medicinales.
A las instituciones que posibilitaron el desarrollo de este proyecto de formación en Barcelona
(España) por medio de una beca: La fundación Alan ‐ Universidad Autónoma de Nuevo León;
“Con el apoyo del Programa Alan, Programa de Becas de Alto Nivel de la Unión Europea para
América Latina, beca nº E07D401919MX” (octubre de 2007 ‐ julio de 2010) y el Consejo
Nacional de Ciencia y Tecnología (Conacyt), beca nº 308657 (octubre de 2010 ‐ abril de 2012).
Al Ministerio de Ciencia y Tecnología de España por la financiación de los materiales necesarios
para el desarrollo de esta Tesis en el marco del proyecto CTQ2007‐26528.
La felicidad es un viaje, no un destino.
Robin S. Sharma
(El monje que vendió su Ferrari)
Índice
Resumen..................................................................................................................... xv
Abstract...................................................................................................................... xvii
1. Introducción............................................................................................................ 1
1.1. Medicina tradicional.............................................................................................. 3
1.2. Plantas Medicinales............................................................................................... 4
1.3. Situación actual y tendencias del control de calidad de las plantas medicinales... 5
1.4. Desafíos en el control de calidad de las plantas medicinales................................. 7
1.5. Procedimientos analíticos empleados en el control de calidad de las plantas
medicinales............................................................................................................ 9
1.5.1. Procedimientos de extracción........................................................................ 9
1.5.2. Técnicas instrumentales empleadas con los productos fitoterapéuticos...... 10
1.5.3. Espectroscopia en el infrarrojo cercano........................................................ 12
1.5.4. Cromatografía de líquidos de alta resolución (CLAR).................................... 14
1.5.4.1. Factores que afectan el establecimiento del perfil cromatográfico.. 14
1.6. Quimiometría......................................................................................................... 16
1.6.1. Pretratamientos de los datos obtenidos con los métodos instrumentales... 17
1.6.1.1. Variable aleatoria normal tipificada (SNV, Standard
Normal Variate)............................................................................... 17
1.6.1.2. Derivadas......................................................................................... 17
1.6.1.3. Normalización.................................................................................. 18
1.6.1.4. Escalado (Scaling)............................................................................ 18
1.6.1.5. Corrección de la línea base (Baseline correction)........................... 18
1.6.1.6. Alineación optimizada mediante correlación (COW,
Correlation Optimized Warping).................................................... 19
1.61.7. Centrado (Mean centering)............................................................. 20
1.6.2. Métodos de reconocimiento de pautas....................................................... 20
1.6.2.1. Análisis en componentes principales (PCA,
Principal Component Analysis)........................................................ 20
1.6.2.2. Modelado blando independiente de analogías de clases (SIMCA,
Soft Independent Modeling of Class Analogy)................................ 21
1.6.2.3. Análisis discriminante (DA, Discriminat Analysis)........................... 23
Índice
1.6.3. Métodos de regresión.................................................................................. 23
1.6.3.1. Regresión por mínimos cuadrados parciales (PLSR,
Partial Least Squares Regression)................................................. 23
1.6.3.2. Análisis discriminante con mínimos cuadrados parciales (PLS‐DA,
Partial Least Squares ‐ Discriminat Analysis).................................. 24
1.6.4. Resolución multivariable de curvas ‐ mínimos cuadrados alternados
(MCR‐ALS, Multivariate Curve Resolution ‐ Alternating Least Squares)... 25
1.6.5. Verificación de los modelos y selección del número de factores................. 26
Referencias del capítulo................................................................................................... 29
2. Objetivos............................................................................................................... 35
2.1. Objetivo General……………………………………………………………………………………………… 37
2.2. Objetivos Específicos……………………………………………………………………………………….. 38
3. Eleutherococcus senticosus………………………………………………………………………………….. 39
3.1. Introducción…………………………………………………………………………………………………….. 41
3.1.1. Descripción de la planta medicinal…………………………………………………………… 41
3.1.2. Problemática con el control de calidad del Eleutherococcus senticosus…… 41
3.1.3. Descripción del estudio……………………………………………………………………………. 42
3.2. Metodología específica……………………………………………………………………………………. 42
3.2.1. Descripción de las muestras…………………………………………………………………….. 42
3.2.2. Análisis espectroscópico en el infrarrojo cercano.…………………………………... 44
3.2.3. Análisis multivariante………………………………………………………………………………. 45
3.3. Resultados y discusión…………………………………………………………………………………….. 47
3.3.1. Características de los espectros de infrarrojo cercano…………………………….. 47
3.3.2. Estudio del agrupamiento natural de las muestras…………………………………. 49
3.3.3. Modelado blando independiente de analogías de clases (SIMCA)………...... 50
3.3.4. Análisis discriminante con mínimos cuadrados parciales (PLS‐DA).......... 54
3.3.5. Análisis discriminante (DA)……………………………………………………………………... 57
3.4. Conclusiones del capítulo ……………………………………………………………………………..... 59
Referencias del capítulo…………………………………………………………………………………………….. 61
Índice
4. Panax ginseng........................................................................................................ 63
4.1. Introducción......................................................................................................... 65
4.1.1. Descripción de la planta medicinal.............................................................. 65
4.1.2. Problemática con el control de calidad del Panax ginseng.......................... 65
4.1.3. Descripción del estudio................................................................................ 66
4.2. Metodología específica........................................................................................ 67
4.2.1. Descripción de las muestras........................................................................ 67
4.2.2. Análisis espectroscópico en el infrarrojo cercano........................................ 69
4.2.3. Análisis multivariante.................................................................................. 70
4.3. Resultados y discusión......................................................................................... 72
4.3.1. Características de los espectros de infrarrojo cercano................................ 72
4.3.2. Estudio de la similitud de las muestras........................................................ 73
4.3.3. SIMCA (Soft Independent Modeling of Class Analogy)................................ 75
4.3.4. PLS‐DA (partial least squares ‐ discriminant analysis).................................. 76
4.3.5. DA (discriminant analysis)........................................................................... 77
4.3.6. Análisis semicuantitativo de mezclas........................................................... 78
4.4. Conclusiones del capítulo..................................................................................... 80
Referencias del capítulo.................................................................................................... 83
5. Valeriana officinalis……………………………………………………………………………………………… 85
5.1. Introducción…………………………………………………………………………………………………….. 87
5.1.1. Descripción de la planta medicinal…………………………………………………………… 87
5.1.2. Problemática con el control de calidad de Valeriana officinalis……………….. 87
5.1.3. Antecedentes…………………………………………………………………………………………… 88
5.1.4. Descripción del estudio……………………………………………………………………………. 89
5.2. Metodología específica……………………………………………………………………………………. 90
5.2.1. Descripción de las muestras…………………………………………………………………….. 90
5.2.2. Reactivos…………………………………………………………………………………………………. 91
5.2.3. Preparación de las muestras y de las mezclas de laboratorio………………….. 92
5.2.4. Instrumentación y procedimiento cromatográfico………………………………….. 92
5.2.5. Análisis multivariante………………………………………………………………………………. 93
5.2.6. Construcción de las huellas dactilares con múltiples longitudes de onda… 95
5.2.6.1. Reducción de variables……………………………………………………………………. 95
5.2.6.2. Ajuste de la línea de base y normalización de los datos…………………… 96
Índice
5.2.6.3. Desdoblamiento de la matriz (unfolding)………………………………………….. 96
5.2.7. Optimización de los parámetros para COW
(correlation optimized warping)……………………………………………………………….. 97
5.3. Resultados y discusión……………………………………………………………………………………… 97
5.3.1. Optimización y validación de la metodología……………………………………………. 97
5.3.2. Características de los cromatogramas y de las
huellas dactilares aumentadas…………………………………………………………………. 99
5.3.3. COW (correlation optimized warping) dirigida mediante
PCA (principal component analysis)…………………………………………………………. 104
5.3.4. Comparación de los resultados de los modelos de clasificación………………. 107
5.4. Conclusiones del capítulo………………………………………………………………………........... 109
Referencias del capítulo………………………………………………………………………………………………. 111
6. Turnera diffusa....................................................................................................... 113
6.1. Introducción......................................................................................................... 115
6.1.1. Descripción de la planta medicinal.............................................................. 115
6.1.2. Problemática con el control de calidad de Turnera diffusa......................... 115
6.1.3. Antecedentes............................................................................................... 116
6.1.4. Descripción del estudio................................................................................. 117
6.2. Metodología específica......................................................................................... 117
6.2.1. Descripción de las muestras......................................................................... 117
6.2.2. Reactivos....................................................................................................... 117
6.2.3. Preparación de los extractos......................................................................... 118
6.2.4. Instrumentación y procedimientos analíticos............................................. 118
6.2.4.1. Procedimiento por CLAR‐DAD............................................................... 118
6.2.4.2. Determinación de la actividad captadora del
radical libre DPPH mediante espectrofotometría................................ 119
6.2.5. Análisis multivariante................................................................................... 120
6.2.6. Construcción de las huellas dactilares con múltiples longitudes de onda... 121
6.2.7. Alineación de las huellas dactilares aumentadas mediante COW............. 121
6.3. Resultados y discusión.......................................................................................... 122
6.3.1. Resultados del ensayo con DPPH y del método CLAR................................. 122
6.3.2. Construcción de las huellas dactilares aumentadas.................................... 122
6.3.2.1. Selección de las longitudes de onda de trabajo.................................. 123
Índice
6.3.2.2. Efecto de los pretratamientos.............................................................. 125
6.3.2.3. Alineación............................................................................................ 126
6.3.3. Predicción de la actividad antioxidante (EC50) por PLSR.............................. 128
6.4. Conclusiones del capítulo..................................................................................... 131
Referencias del capítulo................................................................................................... 133
7. Conclusiones generales........................................................................................... 135
8. Perspectivas........................................................................................................... 139
Anexo........................................................................................................................ 143
Resumen
La medicina tradicional herbolaria y sus preparaciones han sido ampliamente
empleadas por miles de años; sin embargo en muchos de los países occidentales aún
no ha sido oficialmente aceptada. Esto es debido a que no hay datos suficientes de
eficacia y seguridad que cumplan con los criterios requeridos para que su uso sea
universal. No obstante, la Organización Mundial de la Salud ha confirmado que el 80 %
de la población mundial, especialmente millones de personas de las áreas rurales de
los países en desarrollo, hacen uso de las medicinas herbales para sus necesidades de
salud. La seguridad en el consumo de un producto herbal debe ser otorgada por un
proceso completo de control de calidad; este debe ser un proceso estandarizado,
detallado, claro, conciso y reproducible. De no existir este proceso pueden surgir
confusiones entre los productos que pueden resultar peligrosas para la salud del
usuario. La falta de datos de investigación se debe, no sólo a políticas de salud pública,
sino también a la falta de control de calidad de estos productos; debido principalmente
a que no se dispone de metodologías adecuadas y aceptadas para la evaluación de los
mismos. Uno de los motivos para la falta de métodos aceptables podría ser que, a
diferencia de los compuestos de síntesis de alta pureza, una fórmula herbal puede
consistir en cientos de compuestos. Con ayuda de la quimiometría se puede
definitivamente tener una mayor oportunidad de afrontar las dificultades que surgen
al emplear técnicas cromatográficas o espectroscópicas para el análisis de calidad de
las plantas medicinales, como son las señales no resueltas y la gran cantidad de
componentes en las plantas.
En esta memoria, se presenta la aplicación de diversos métodos
quimiométricos para realizar el control de calidad de cuatro plantas medicinales de
amplio uso comercial, para las cuales existen informes de confusiones, adulteraciones
o presentación de reacciones adversas en los consumidores: Panax ginseng,
Eleutherococcus senticosus, Valeriana officinalis y Turnera diffusa. Los capítulos
guardan relación entre sí, pero han sido estructurados para ser autónomos,
presentando la descripción y problemática de cada planta, metodología, resultados y
bibliografía particulares.
xv
Resumen
El primer capítulo de la tesis consiste en una introducción general sobre el uso
de la medicina tradicional, específicamente de las plantas medicinales, y sobre las
diferentes estrategias que han sido utilizadas para su control de calidad, incluyendo
una revisión de los aspectos analíticos y finalizando con la descripción de los métodos
quimiométricos usados en los trabajos presentados en los capítulos. El capitulo dos
consiste en los objetivos que persigue esta Tesis Doctoral.
Los capítulos tres y cuatro describen el uso de la espectroscopia de infrarrojo
cercano como técnica analítica en el control de calidad del Eleutherococcus senticosus
y el Panax ginseng, respectivamente, junto con varios métodos de reconocimiento de
pautas (análisis en componentes principles, modelado blando independiente de
analogías de clases y análisis discriminante) y el método de regresión de análisis
discriminante con mínimos cuadrados parciales. Para el Panax ginseng (capítulo 4) se
describe también el uso de la resolución multivariable de curvas ‐ mínimos cuadrados
alternados con el fin de realizar la cuantificación de mezclas.
En el capítulo cinco se describe un tratamiento de la información que implica el
uso de cromatogramas a varias longitudes de onda para la construcción de huellas
dactilares aumentadas de Valeriana officinalis, con la correspondiente evaluación de
los resultados obtenidos de la clasificación efectuada con los métodos de
reconocimiento de pautas.
El capítulo seis trata sobre la aplicación de la estrategia de huellas dactilares
aumentadas, junto con la regresión por mínimos cuadrados parciales, para mejorar la
predicción de la actividad antioxidante de Turnera diffusa.
El capítulo siete presenta las conclusiones globales obtenidas de los métodos
de control de calidad propuestos para las cuatro plantas medicinales en estudio y el
capítulo ocho describe las perspectivas que abre esta Tesis Doctoral, proponiendo
diversas líneas de trabajo. Finalmente, en el anexo se lista las publicaciones resultantes
de los trabajos realizados.
xvi
Abstract
Traditional herbal medicine and its preparations have been widely used for
thousands of years, but in many Western countries it has not yet been officially
accepted. The reason is a lack of data about their efficacy and security that are
required for a universal use. However, the World Health Organization has confirmed
that 80% of the people in the world, especially millions who live in the rural areas in
developing countries, make use of herbal medicines for their needs of health. Safety in
the use of an herbal product should be granted for a complete process of quality
control that should be a standardized, detailed, clear, concise and reproducible
process. Its absence may arise confusion between products that may be hazardous to
the health of the user. The lack of research data is due not only to public health policy
but also to the deficient quality control of these products, mainly due to the
unavailability of suitable methodologies for the evaluation thereof. One reason for so
little acceptable methods may be that, unlike the synthesis of compounds of high
purity, an herbal formulation may consist of hundreds of compounds. With the aid of
chemometrics there is a greater opportunity to face the difficulties that arise when
using chromatographic or spectroscopic techniques for the analysis of quality of the
medicinal plants, such as unresolved signals and the large number of components in
plants.
In this thesis, it is presented the application of different chemometric methods
for quality control of four medicinal plants in widespread commercial use for which
there are reports of confusion, adulteration or presentation of adverse reactions in
consumers: Panax ginseng, Eleutherococcus senticosus, Valeriana officinalis and
Turnera diffusa. The chapters are interrelated, but have been structured to be self‐
describing; presenting description, problems, methodology, results and literature for
each plant.
The first chapter of the thesis is a general introduction to the use of traditional
medicine, particularly medicinal herbs, and about the different strategies that have
been used for its quality control, including a review of analytical issues and finally, the
description of the chemometric methods used in the studies presented in each
chapter. Chapter two presents the objectives of this thesis.
xvii
Abstract
Chapters three and four describe the use of near infrared spectroscopy as an
analytical technique in the quality control of Eleutherococcus senticosus and Panax
ginseng, respectively, along with various methods of pattern recognition (Principal
Component Analysis, Soft Independent Modeling of Class Analogy and Discriminant
Analysis) and the regression method of Partial Least Squares ‐ Discriminat Analysis. For
Panax ginseng (Chapter 4) is also described the quantification of mixtures using
Multivariate Curve Resolution ‐ Alternating Least Squares.
Chapter five describes an information processing that involves the use of
chromatograms at various wavelengths for the construction of enhanced fingerprints
of Valeriana officinalis, with the corresponding evaluation of the results from the
classification conducted by pattern recognition methods.
Chapter six deals with the implementation of the enhanced fingerprint strategy
together with Partial Least Squares Regression, in order to improve the prediction of
the antioxidant activity of Turnera diffusa.
Chapter seven presents the overall conclusions drawn from the quality control
methods proposed for the four medicinal plants studied and Chapter eight describes
the prospects offered by this thesis, proposing several possibilities for further research.
Finally, the appendix lists the publications resulting from the work carried out.
xviii
1
Introducción.
Introducción
1.1. Medicina tradicional.
Se puede definir la medicina tradicional como la suma total de los
conocimientos, habilidades y prácticas basadas en las teorías, creencias y experiencias
indígenas de distintas culturas (sean o no explicables), que se utilizan en la
preservación de la salud; así como en la prevención, el diagnóstico, la mejora o el
tratamiento de enfermedades físicas y mentales. En algunos países, donde la medicina
tradicional no está incorporada al sistema predominante para el cuidado de la salud,
los términos “medicina complementaria”, “alternativa” o “no convencional” son
usados de manera indistinta [1]. En las últimas décadas, el uso de la medicina
tradicional se ha expandido a nivel mundial debido a que ha ganado popularidad y, en
consecuencia, no solamente está siendo utilizada para la atención primaria de la salud
de los pobres en los países en desarrollo, sino que también se está utilizando en los
países desarrollados donde la medicina convencional es predominante. Considerando
la importante expansión mundial en el uso de la medicina tradicional, la seguridad, la
eficacia así como el control de calidad de las medicinas tradicionales y los
procedimientos basados en terapias tradicionales, se han convertido en tópicos
relevantes tanto para las autoridades sanitarias como para los usuarios de estos
remedios [2].
Se considera que la seguridad y la eficacia de la medicina tradicional ha sido
demostrada a través del uso histórico; es decir, a través de la experiencia transmitida
de generación en generación. No obstante, se reconoce que es necesaria la
investigación científica para proporcionar evidencia adicional de su seguridad y eficacia
[3]. Sin embargo, diversas prácticas de la medicina tradicional no han sido oficialmente
reconocidas en la mayoría de los países occidentales; debido a esto, no existe un
desarrollo paralelo de normas internacionales y métodos apropiados para su
evaluación en diferentes culturas y regiones. Consecuentemente, la cantidad y calidad
de los datos de seguridad y eficacia de la medicina tradicional están lejos de ser
suficientes para cumplir con los criterios necesarios para apoyar su uso en todo el
mundo. De esta manera, el reto actual es asegurar que la medicina tradicional es
3
Introducción
empleada correctamente y determinar cómo debe de llevarse a cabo la investigación y
evaluación en este campo [4].
1.2. Plantas Medicinales.
La medicación tradicional normalmente implica el uso de plantas medicinales,
partes de animales y minerales; siendo las plantas medicinales el recurso terapéutico
más ampliamente utilizado [5]. Así, de las diversas prácticas de la medicina tradicional,
el presente trabajo se focaliza en el control de calidad de las plantas medicinales.
Históricamente las plantas han sido utilizadas como medicamentos. Durante
mucho tiempo los remedios naturales y sobre todo las plantas medicinales, fueron el
principal e incluso el único recurso del que disponían los médicos para el tratamiento
de enfermedades, por lo que las plantas medicinales forman parte esencial de las
estrategias utilizadas por la población de países en desarrollo para enfrentar sus
enfermedades cotidianas. Se estima que han sido identificadas de 250.000 a 350.000
especies de plantas en el mundo y que cerca de 35.000 son ampliamente usadas con
propósitos medicinales. El uso de plantas medicinales se da no solamente en el medio
indígena y rural, sino en las zonas urbanas y suburbanas, como resultado de la
necesidad de recursos accesibles para enfrentar muy diversos padecimientos [6]. La
Organización Mundial de la Salud (OMS) ha confirmado que el 80 % de la población
mundial hace uso de la fitoterapia para atender sus necesidades de salud [3].
Por otro lado, las plantas medicinales y sus preparaciones han sido
ampliamente usadas en muchos países orientales y su popularidad se ha extendido en
las últimas décadas a países occidentales, aunque sin ser aún aceptadas oficialmente
en muchos de ellos; esto es debido principalmente a que no hay datos suficientes de
eficacia y seguridad. Las razones para la falta de estos datos incluye la carencia de
políticas de salud pública y de metodologías adecuadas y aceptadas para la evaluación
de las plantas medicinales. La escasez de metodologías puede ser debida a que, a
diferencia de los compuestos de síntesis de alta pureza, un medicamento tradicional a
base de plantas puede consistir en cientos de compuestos [7].
4
Introducción
1.3. Situación actual y tendencias del control de calidad de las plantas medicinales.
El creciente interés en el uso de plantas medicinales está dando lugar a un
mercado de rápido crecimiento para los productos fitoterapéuticos, suplementos
dietéticos, nutracéuticos y alimentos funcionales [8]. Esta importante expansión en el
uso de plantas medicinales plantea muchas inquietudes acerca de su control de
calidad, ya que podría dar lugar a la recolección masiva y sin supervisión, sin ninguna
consideración de la calidad de las plantas usadas como materias primas [9]. La
seguridad en el consumo de un producto fitoterapéutico debe ser garantizada por un
proceso completo de control de calidad. Este debe ser un proceso estandarizado,
detallado, conciso y reproducible que pueda ser utilizado para evaluar a otros
productos de la misma naturaleza. El aseguramiento de calidad de productos
fitoterapéuticos, es un prerrequisito para realizar ensayos clínicos con resultados
reproducibles y es necesario con el fin de identificar adulteraciones, falsificaciones o
confusiones entre plantas [3,6,10].
Una gran parte de los productos fitoterapéuticos son clasificados como
suplementos dietéticos, por lo que no están sujetos a los mismos procesos de
monitorización de los medicamentos; es por ello que en Estados Unidos, la FDA (Food
and Drug Administration) emitió la guía DSHEA (Dietary Supplement Health and
Education Act of 1994) para la regulación de este tipo de productos. La guía permite a
las compañías hacer afirmaciones sobre los beneficios de sus productos en la
conservación de la salud. Sin embargo, no revisa que se cumplan los estándares de
control de calidad en cuanto a seguridad, eficacia y pureza [11].
La OMS, en su manual de métodos de control de calidad para plantas
medicinales, la FDA y las Farmacopeas de diversos países presentan una colección de
procedimientos recomendados para evaluar la identidad, pureza y contenido de los
materiales de plantas medicinales; con estos procedimientos intentan proporcionar a
los laboratorios una herramienta para llevar a cabo el control de calidad de los
productos fitoterapéuticos. Los parámetros que incluyen estas referencias para
describir la calidad de los productos a base de plantas usados como medicamentos
5
Introducción
son: a) pruebas de identidad, donde consideran las características macroscópicas,
microscópicas y organolépticas, así como el perfil obtenido por cromatografía en capa
fina; b) pruebas de pureza para determinar humedad, cenizas, materia extraña,
disolventes, la presencia de contaminantes microbianos, aflatoxinas, metales pesados
y residuos de plaguicidas; y c) la valoración de principios activos y/o marcadores
[1,6,10,12].
La mayoría de las plantas medicinales han sido autenticadas tradicionalmente
por medios morfológicos e histológicos. Sin embargo, este enfoque puede no ser fiable
porque las plantas de la misma familia son morfológicamente similares y los productos
comerciales elaborados con plantas se preparan de diversas maneras que hacen más
difícil su identificación a través de una inspección sensorial [13]. Actualmente, es una
práctica común entre los analistas de productos naturales la selección de uno o más
compuestos como marcadores para la identificación y evaluación de la calidad [14]. Sin
embargo, es reconocido que este tipo de determinaciones no proporciona por sí una
idea completa de un producto farmacéutico a base de plantas, ya que son múltiples los
constituyentes responsables de sus efectos terapéuticos y a veces la selección de
marcadores adecuados es difícil y subjetiva [15,16]. Estos constituyentes pueden
trabajar sinérgicamente y pueden variar dependiendo no únicamente de la especie,
sino también de las condiciones de crecimiento, de la época de cosecha, del origen, de
los métodos de proceso y secado y del tiempo de almacenaje, entre otros factores
[17,18]. Por otra parte, algunos productores sin escrúpulos continuamente están
tratando de desarrollar maneras de hacer el perfil químico de sus productos similar al
perfil auténtico presentado por la planta medicinal en cuestión. En estas circunstancias
específicas, el uso de compuestos marcadores es incapaz de confirmar la identidad de
una planta. Es por estas razones que se hace necesario determinar la mayoría de los
constituyentes de las plantas medicinales con el propósito de asegurar la confiabilidad
y precisión de las investigaciones farmacológicas y clínicas, para conocer su
bioactividad y los posibles efectos colaterales de los compuestos activos, así como
mejorar el control de calidad de sus productos [5].
6
Introducción
El establecimiento de huellas dactilares para las plantas medicinales es un
enfoque relativamente reciente adoptado por los investigadores para hacer frente a la
complejidad química de los productos fitoterapéuticos y los problemas relacionados
con el uso de pocos compuestos marcadores. La huella dactilar de una planta
medicinal podría ser un espectro o un cromatograma obtenido por un procedimiento
definido para caracterizar la composición química de una muestra; se supone que es
una característica única para la identificación de las plantas, extractos de plantas o
preparados en cuestión [16,19]. Así pues, el perfil cromatográfico o el perfil
espectroscópico de la planta medicinal, parece ser la herramienta más conveniente
para llevar a cabo el control de calidad de los productos de uso farmacéutico a base de
plantas [20‐24]. Normativas actualizadas sobre plantas medicinales publicadas por la
Organización Mundial de la Salud (OMS), la Agencia de Medicinas y Alimentos de los
Estados Unidos (Food and Drug Administration, FDA) y la Agencia Europea del
Medicamento (EMA) se pronuncian por el uso de las huellas dactilares; indican que la
identificación de la planta medicinal debe ser una de las primeras pruebas aplicadas
para garantizar la calidad y para discriminar entre especies relacionadas o muestras
adulteradas [3,12,25,26].
1.4. Desafíos en el control de calidad de las plantas medicinales.
La metabolómica de las plantas puede ser empleada para obtener huellas
dactilares de las especies con propósitos bioquímicos o taxonómicos, ya que el
metaboloma es la expresión final de los genes y define el fenotipo bioquímico de una
célula o tejido; así, la determinación cualitativa y cuantitativa de los metabolitos
celulares proveen una visión del estatus bioquímico de un organismo dado [27]. El
concepto de fitoequivalencia hace uso del fenotipo bioquímico y fue desarrollado en
Alemania para asegurar la congruencia entre la composición de distintos lotes de
medicamentos tradicionales basados en plantas. Según este concepto, para ser
considerada fitoequivalente, una planta medicinal requiere presentar un perfil químico
que debe ser comparable con el perfil de un producto ya conocido; con este fin se
pueden aplicar diversas técnicas cromatográficas y espectroscópicas, considerando
como componente activo la planta medicinal en su totalidad [28‐32].
7
Introducción
8
Introducción
1.5. Procedimientos analíticos empleados en el control de calidad de las plantas
medicinales.
En general, los métodos de control de calidad de las plantas medicinales
deberían incluir, además de la inspección sensorial, ensayos analíticos tales como la
cromatografía en capa fina, la cromatografía de gases, la cromatografía de líquidos de
alta resolución, espectros de infrarrojo medio y análisis mediante otras
espectrometrías diversas, como el infrarrojo cercano o resonancia magnética nuclear.
En la presente memoria se han utilizado las técnicas de la espectroscopia de infrarrojo
cercano y de la cromatografía de líquidos de alta resolución y se hace énfasis en sus
aplicaciones para el control de calidad de las plantas medicinales.
1.5.1. Procedimientos de extracción.
El método de extracción y preparación de muestra es muy importante para
obtener buenos resultados, ya que si se quiere tener una buena información del perfil
de una planta medicinal es necesario contar con un método que extraiga la mayoría de
los componentes activos de las plantas, que garantice la integridad de la actividad
farmacológica y, a la vez, que sea un método preciso y ofrezca buenas recuperaciones
[39]. En los productos fitoterapéuticos, los compuestos de interés suelen presentar
grandes diferencias en cuanto a polaridad y termoestabilidad. Por ello, aún con una
misma técnica de extracción las condiciones de trabajo (solvente, temperatura, etc.)
pueden variar de un material vegetal a otro, lo que hace indispensable evaluar
cuidadosamente la eficiencia del método empleado. El calentamiento con reflujo y la
extracción soxhlet se encuentran entre los métodos más empleados para productos
naturales. Sin embargo, este tipo de métodos son lentos, requieren grandes
cantidades de solventes y pueden tener eficiencias de extracción bajas [40].
En la última década, se han desarrollado técnicas como la microextracción en
fase sólida (SPME) o la microextracción en fase líquida (LPME) cuyas principales
ventajas son la disminución en el consumo de disolventes y en los tiempos de análisis,
su relativo bajo costo, su simplicidad y en muchos casos la posibilidad de obtener
9
Introducción
factores de enriquecimiento mayores [41]. La SPME fue introducida en los años 90 y se
ha convertido en una técnica muy utilizada para la preparación de muestras para
cromatografía de gases y en menor medida para cromatografía líquida. En el análisis
de productos fitoterapéuticos esta técnica ha sido empleada principalmente para
caracterizar compuestos volátiles [41‐46]. Se han publicado algunas aplicaciones de la
SPME en modo headspace para la obtención de la huella dactilar de compuestos
volátiles en plantas medicinales chinas y en otros en vegetales [47,48].
1.5.2. Técnicas instrumentales empleadas con los productos fitoterapéuticos.
Con respecto a las técnicas de análisis de las plantas medicinales, las
cromatográficas tienen una muy poderosa capacidad de separación para los complejos
componentes químicos de los extractos, siendo posible separarlos en muchas sub‐
fracciones relativamente simples. La cromatografía de capa fina (CCF) ha sido la técnica
de elección para el análisis de plantas medicinales y es aún usada con mucha
frecuencia [6,10]. Con las limitaciones habituales de la técnica, la CCF es usada como
un método de rastreo y semicuantitativo que provee perfiles cromatográficos
característicos y permite identificar adulteraciones en los productos. Las principales
ventajas de esta técnica es que es sencilla, rápida, versátil y permite analizar muchas
muestras a la vez [16,49]. No obstante, su aplicación regularmente se limita a la
identificación de compuestos marcadores, con las desventajas que ello conlleva.
Es bien conocido que muchos de los principios farmacológicamente activos en
las plantas medicinales son compuestos volátiles, por lo que su estudio es de gran
importancia en el análisis de medicinas tradicionales a base de plantas. La
cromatografía de gases (CG) ha sido empleada en el análisis de compuestos volátiles
de las plantas medicinales con propósitos de establecer perfiles de identificación de las
mismas, ya que la composición y concentración relativa de los compuestos orgánicos
volátiles (aceites) son característicos de algunas plantas. Cambios en la composición de
los aceites volátiles, pueden indicar adulteraciones o indicar cambios enzimáticos de
oxidación o fermentación [5,50,51]. El empleo del acoplamiento con espectrometría
de masas (CG‐EM) para establecer perfiles cromatográficos de plantas ha sido
10
Introducción
empleado por varios autores [7,43,45,47,52]. El establecimiento de estos perfiles se
realiza mediante comparación de los tiempos de retención y los espectros de masas de
los componentes comunes en los especímenes. La CG‐EM tiene la ventaja de que
proporciona, además, información de identidad de los compuestos. La principal
desventaja de la CG es que no puede ser empleada para análisis de compuestos
polares y no volátiles, a menos que se realice una derivatización previa de la muestra
[5].
La electroforesis capilar (EC) fue introducida a principios de los 80 como una
poderosa técnica analítica de separación que ha sido desarrollada rápidamente. Los
métodos electroforéticos, especialmente la EC, han sido empleados en el análisis de
plantas medicinales en la última década [53]. La EC permite la separación y análisis de
los ingredientes activos en las plantas medicinales; tiene la ventaja de que requiere
poca cantidad de muestra y permite realizar análisis rápidamente con muy buena
capacidad de separación [54]. También es una buena herramienta para la generación
de huellas dactilares de las plantas medicinales. Estudios recientes de alcaloides y
flavonoides en plantas medicinales han empleando la EC [55].
Si bien los métodos cromatográficos han sido ampliamente utilizados para
establecer la huella dactilar en productos fitoterapéuticos, ha habido avances en el uso
de la resonancia magnética nuclear (RMN) de alta resolución y la espectroscopia de
infrarrojo. Las huellas dactilares obtenidas por 1HRMN han sido utilizadas, sobre todo,
en el análisis de alimentos naturales como vino, aceites de oliva, cervezas, entre otros.
El método es versátil, no depende de la naturaleza de la muestra y se pueden obtener
huellas dactilares cuantitativas [56]. Permite detectar simultáneamente todos los
componentes en la muestra que tengan núcleos de hidrogeno, lo cual cubre
prácticamente todos los compuestos orgánicos como carbohidratos, aminoácidos,
ácidos grasos, aminas, ésteres, éteres, fenoles y lípidos [57]. Gingko biloba es una de
las plantas sobre la cual se han publicado mayor número de trabajos con esta técnica,
hasta el momento, con sensibilidades semejantes a las obtenidas por CLAR, pero con
menor tiempo de análisis y evitando el consumo de insumos caros (solventes y
columnas) [58]. Además, actualmente se dispone de programas para el procesamiento
11
Introducción
de los datos post‐adquisición en forma off‐line, lo cual permite mejorar la resolución,
obtener una óptima relación señal/ruido y aumentar la sensibilidad [59‐61].
1.5.3. Espectroscopia en el infrarrojo cercano.
La región del infrarrojo cercano (NIR), se extiende entre 800 y 2500 nm o,
expresado en número de onda, de 12 500 a 4000 cm‐1. Es la primera región espectral
que muestra bandas de absorción relacionadas con las vibraciones moleculares y se
caracteriza por las bandas armónicas y las bandas de combinación. Esta región se
utiliza ampliamente para el análisis de la composición de diversos productos,
incluyendo los alimenticios [62]. La espectroscopia NIR recoge la información de las
estructuras químicas, a través de la valoración de los enlaces moleculares reflejados en
el espectro obtenido (p. ej. C‐H, N‐H and O‐H, que son los principales componentes
estructurales de las moléculas orgánicas). La composición química de la muestra
origina diferencias que quedan reflejadas en las vibraciones armónicas y de
combinación, construyendo de esta manera un espectro característico que sirve como
huella dactilar [63‐66]. La relación entre la huella dactilar y la composición química de
la muestra puede parecer poco evidente pero el hecho es que, aplicando el mismo
procedimiento experimental, el espectro obtenido puede considerarse como una
característica determinada únicamente por los componentes químicos presentes en la
planta medicinal y en estas circunstancias es aplicable el concepto de fitoequivalencia,
ya que este no exige el aislamiento e identificación de los componentes de la muestra
[16,28].
Existen tres tipos de configuración instrumental para el registro de espectros
NIR: transmitancia, reflectancia y transflectancia; en la Figura 1.1 se muestra una
representación esquemática. Considérese que el haz de luz que emite la fuente de
radiación ya ha atravesado el correspondiente sistema de selección de longitudes de
onda. En las medidas por reflectancia (sólidos y semisólidos), el haz de luz es reflejado
por la propia muestra y llega al detector. En modo transmitancia (gases, líquidos,
semilíquidos y sólidos), el haz de luz atraviesa la muestra desde la fuente de radiación
hasta el detector. Finalmente, un caso intermedio lo ocupa las medidas por
12
Introducción
transflectancia (líquidos turbios y semilíquidos), donde el haz de luz atraviesa la
muestra y se refleja en un reflector que está en contacto con la misma, hasta llegar de
nuevo al detector. Para los trabajos descritos en la presente memoria se empleó el
modo de reflectancia.
Figura 1.1. Esquema de las configuraciones para el registro de espectros NIR.
La espectroscopia NIR presenta las ventajas de ser un método rápido y no
destructivo, que requiere una mínima (o ninguna) preparación de muestra; así mismo,
hace posible la determinación simultánea del contenido químico y de algunas
propiedades físicas de la muestra [67]. Como resultado, en los últimos años, ha habido
una tendencia creciente en el uso de la espectroscopia NIR para el análisis cualitativo y
cuantitativo de las plantas medicinales. Por mencionar algunos ejemplos, empleando
el método NIR se ha determinado la autenticidad de S. miltiorrhiza, se han identificado
las diferentes variedades geográficas de Paeonia lactiflora, Phellodendri chinensis y P.
amurensis; así mismo, los algunos compuestos representativos de estas plantas se han
cuantificado con PLS (partial least squares) [49]. A pesar de las ventajas en el empleo
de los perfiles espectroscópicos, los cromatográficos siguen siendo los más utilizados
para evaluar la calidad de las plantas medicinales [5]; probablemente debido a que la
técnica no es muy sensible, así que por lo general sólo puede aplicarse a los
componentes mayoritarios [68].
13
Introducción
1.5.4. Cromatografía de líquidos de alta resolución (CLAR).
La CLAR es un método popular empleado en el análisis de plantas medicinales
debido a que es una técnica relativamente sencilla y muy versátil, ya que permite
analizar compuestos tanto volátiles como no volátiles, polares, no polares y hasta
iónicos [14,69]. En general, la CLAR puede ser empleada para analizar la mayoría de los
compuestos en las plantas medicinales, tal y como lo revelan las publicaciones a este
respecto. Entre los métodos cromatográficos para la toma de huellas dactilares de las
plantas medicinales, el más popular sigue siendo la cromatografía líquida de alta
resolución acoplada a un detector de diodos (CLAR‐DAD) [5,34,49]. El uso de
detectores de diodos en línea proporciona información adicional a los perfiles
cromatográficos obtenidos a longitudes de onda simples, ya que se pueden obtener
además los espectros relacionados con cada uno de los picos, lo cual puede ser
empleado como criterio de identificación y análisis de pureza de cada uno de los picos
[15,20,70].
Otros acoplamientos, tales como: CLAR–EM, CLAR‐RMN, también han sido
utilizados con estos mismos propósitos; en particular, los acoplamientos CLAR‐EM se
han convertido en una herramienta ampliamente utilizada en el análisis de productos
fitoterapéuticos ya que proporcionan también información espectral adicional, que es
muy útil para el análisis cualitativo y para la elucidación estructural. Aunque
tradicionalmente este tipo de acoplamientos han sido utilizados para la identificación
de compuestos específicos, en la actualidad existe un interés creciente en su aplicación
a la obtención de la huella dactilar del producto completo [20,21,71‐73].
1.5.4.1. Factores que afectan el establecimiento del perfil cromatográfico.
La huella dactilar cromatográfica de una planta es una característica obtenida
por un procedimiento definido, separando tantos compuestos como sea posible para
construir un patrón de reconocimiento específico. La identidad de estos componentes
químicos puede ser conocida o desconocida [14,34]. Puesto que todo el conjunto de
compuestos caracteriza la composición química de la planta medicinal, la huella digital
14
Introducción
cromatográfica representa una metodología cualitativa razonable, en la cual todo el
cromatograma es evaluado durante el análisis de datos para discriminar entre
diferentes especies de la misma familia de plantas [5,34,49]. Obtener un buen perfil
cromatográfico que represente la fitoequivalencia de una planta medicinal depende de
varios factores, tales como el procedimiento de extracción, el instrumento de
medición y las condiciones de separación, entre otros [14,74‐77]. La mayoría de los
procesos de extracción para plantas medicinales, emplean mezclas hidroalcohólicas
como solvente de extracción y los solventes más comúnmente utilizados son agua,
metanol y etanol [2,5,16,49,78].
En cuanto a los aspectos instrumentales, se debe considerar que la huella
dactilar puede ser afectada por factores como la degradación de la fase estacionaria;
por ejemplo, debido a la baja estabilidad del sílice y de los soportes a base de sílice a
valores altos de pH y también se debe contemplar la posibilidad del colapso de la fase
unida C18 a causa de una fase móvil altamente polar (dewetting). Los pequeños
cambios en la composición de la fase móvil también afectan a los perfiles obtenidos;
causados por fluctuaciones de temperatura y presión, variaciones en la velocidad de
flujo y en la dispersión del gradiente. Algunas variaciones pueden tener origen en el
detector, por ejemplo, un desplazamiento de la longitud de onda en un espectrómetro
UV‐Visible o un mal alineamiento del monocromador. Hay que tener cuidado de no
sobrecargar la columna, ya que algunos componentes pueden presentar una alta
concentración. Finalmente, los perfiles cromatográficos se pueden ver afectados por la
interacción entre analitos; este último factor, junto con los cambios instrumentales
desconocidos, produce una gran incertidumbre en el establecimiento de los perfiles
[5,38,79].
Una vez optimizadas las condiciones de tratamiento de muestra y separación,
el siguiente reto es el análisis de los datos obtenidos. Como ya se ha mencionado es
posible emplear las técnicas cromatográficas para obtener perfiles relativamente
completos de las plantas medicinales que permitan establecer la fitoequivalencia. Sin
embargo, la interpretación de estos perfiles se complica cuando el número de
componentes es grande y más aún cuando se presentan señales no resueltas. La
15
Introducción
quimiometría permite afrontar las dificultades en el análisis de calidad de las plantas
medicinales. El empleo de técnicas quimiométricas facilita el análisis de datos, tanto
cromatográficos como espectrales.
1.6. Quimiometría.
Como se ha estado mencionando anteriormente, se pueden emplear muchas
técnicas cromatográficas y espectroscópicas, incluyendo técnicas con acoplamientos,
para el análisis de los productos fitoterapéuticos y para construir los perfiles típicos de
éstos. El problema aquí es cómo se evalúa la información obtenida con estas técnicas.
La quimiometría es un campo interdisciplinario que involucra el análisis
multivariable, los modelos matemáticos, la informática y la química analítica. Algunas
de las áreas de aplicación más importantes de la quimiometría incluyen (1) la
calibración, validación y pruebas de significación, (2) la optimización de las mediciones
químicas y procedimientos experimentales y (3) la extracción del máximo de
información química a partir de datos analíticos [80]. El perfil cromatográfico o
espectroscópico de una planta medicinal es un sistema multivariable, tanto por la
manera en que los instrumentos actuales realizan el registro de las señales analíticas,
como porque se involucra en el perfil a la mayoría de los componentes fitoquímicos de
la planta medicinal. Con ayuda de la quimiometría se puede afrontar, con mayores
posibilidades de éxito, las dificultades que surgen al emplear técnicas cromatográficas
o espectroscópicas para el control de calidad de las plantas medicinales, como son las
señales no resueltas, la gran cantidad de componentes en las plantas y la complejidad
de los espectros del infrarrojo cercano.
La quimiometría abarca diversos objetivos como la aplicación de
pretratamientos a los datos experimentales para mejorar la calidad de la señal, la
construcción de modelos para el reconocimiento de pautas y la determinación
cuantitativa [81]. Son muchas las técnicas quimiométricas que se pueden utilizar para
llevar a cabo estos objetivos; en esta sección se describen aquéllas que han sido
utilizadas en esta memoria.
16
Introducción
1.6.1. Pretratamientos de los datos obtenidos con los métodos instrumentales.
De manera general, el pretratamiento es la modificación de datos realizada
antes de construir un modelo matemático o antes de aplicar otra forma de analizar
los datos. El propósito del pretratamiento es hacer lineal la respuesta de las variables
y eliminar las fuentes extrañas de variación que no son de interés en el análisis. De no
ser eliminada la varianza debida a los errores sistemáticos presentes en los
experimentos, el modelo requerirá un trabajo más complejo para obtener la
información de interés [78,82].
1.6.1.1. Variable aleatoria normal tipificada (SNV, Standard Normal Variate).
SNV es una transformación que se aplica habitualmente a los datos
espectroscópicos para minimizar los efectos de la dispersión de la luz. Utiliza el
centrado y escalado de cada espectro individual (es decir, estandariza cada espectro
manipulando únicamente los datos del mismo). El resultado práctico del SNV es que
minimiza las interferencias multiplicativas de la dispersión en los datos espectrales
producidas por los distintos tamaños de partícula en la muestra; un efecto del SNV es
que, en la escala vertical, cada espectro está centrado en cero [83].
1.6.1.2. Derivadas.
Las derivadas permiten aumentar las diferencias entre las bandas anchas y
solapadas de los espectros; también se utilizan para corregir los efectos de línea base.
La primera derivada elimina los desplazamientos de línea base paralelos al eje de las
abscisas, mientras que la segunda derivada elimina los términos que varían
linealmente con la longitud de onda. Los métodos de derivación más utilizados son el
de Norris [84] y el de Savitzky‐ Golay [85], el cual incluye un suavizado simultáneo con
la derivación.
17
Introducción
1.6.1.3. Normalización.
En muchos métodos analíticos, las variables medidas para una muestra dada
son incrementadas o disminuidas de su valor auténtico por un factor multiplicativo.
Los métodos de normalización intentan corregir este tipo de efectos mediante la
identificación de algún aspecto de cada muestra que debería ser esencialmente
constante de una muestra a otra, y realizar la corrección de la escala de todas las
variables utilizando dicha característica. Cuando se construyen modelos de análisis
discriminante tales como PLS‐DA (partial least squares ‐ discriminat analysis) o SIMCA
(soft independent modeling of class analogy), la normalización se efectúa si la relación
entre las variables y no la magnitud absoluta de la respuesta es el aspecto más
importante de los datos para la identificación de una especie; por ejemplo, la
concentración de un compuesto no es tan relevante, sólo el hecho de que se
encuentre en una cantidad detectable. El uso de la normalización en estas condiciones
debería ser considerado después de evaluar cómo son los cambios en la respuesta de
las variables para las diferentes clases de interés [82,86].
1.6.1.4. Escalado (Scaling).
El escalado de los datos de una matriz entre un valor mínimo y uno máximo, es
un caso particular de normalización que puede ser aplicado antes de la construcción
de los modelos matemáticos. Este pretratamiento puede ser útil para evitar la
presencia de valores extremos en la escala de los datos en algunas muestras de origen
natural y se prefiere su uso cuando se trata de aplicaciones cuantitativas [69].
1.6.1.5. Corrección de la línea base (Baseline correction).
Existen diferentes maneras de hacer la corrección de la línea base; en la
presente memoria se ha utilizado el método de mínimos cuadrados ponderados (WLS,
Weighted Least Squares). Este método es comúnmente empleado en aplicaciones
espectroscópicas (o cromatográficas) donde la señal de algunas variables es debida
solamente a la señal de fondo. Estas variables sirven como referencia para determinar
18
Introducción
cuanta señal de fondo debe ser eliminada de las variables cercanas. El algoritmo WLS
emplea un enfoque automático para determinar qué puntos son los más probables
para ser sólo línea base; esto lo hace ajustando de manera iterativa un línea base a
cada espectro (o cromatograma) y determinando qué variables están claramente por
arriba de la línea base (es decir, la señal) y cuáles están debajo de ésta. Se asume que
los puntos debajo de la línea base son más significativos en el ajuste de la señal de
fondo del espectro.
Este método también es llamado "asymmetric weighted least squares". El
efecto práctico de su uso es una eliminación automática de la señal de fondo, evitando
la creación de picos intensamente negativos [79,82].
1.6.1.6. Alineación optimizada mediante correlación (COW, Correlation Optimized
Warping).
COW es un método para alinear las señales de datos de muestras que exhiben
cambios en su posición a lo largo del eje x, empleando un vector de referencia para
alinear el vector de la muestra. El vector usado como referencia debe ser
representativo de las muestras que se quieren alinear. El método funciona mediante la
división del vector de la muestra a ser alineada en segmentos de tamaño definido y
permitiendo el aumento o la disminución de la longitud de estos segmentos para
buscar la correlación óptima con los segmentos del vector de referencia [87].
Así, los parámetros que hay que definir para la aplicación de este método de
alineación son: el vector a ser usado como referencia, la longitud del segmento y el
grado de flexibilidad (slack); la selección adecuada de estos parámetros puede ser
realizada aplicando algoritmos como los descritos por Skov [88] y Tomasi [89]. COW se
aplica típicamente en datos cromatográficos donde la posición de los picos puede
cambiar entre análisis, debido a pequeños cambios en las muestras o en las
condiciones del cromatógrafo.
19
Introducción
1.6.1.7. Centrado (Mean centering).
Éste pretratamiento calcula el valor medio de cada columna de la matriz de
datos y resta este valor de la columna, trasladando los ejes del sistema de
coordenadas hacia el centroide de los datos y hace que cada muestra exhiba solo las
diferencias que tiene con respecto a la muestra promedio de los datos originales [81].
1.6.2. Métodos de reconocimiento de pautas.
Aquí se mencionan las técnicas multivariables utilizadas en esta memoria
mediante las que se puede establecer agrupaciones de muestras en función de su
similitud y métodos de clasificación de nuevas muestras.
1.6.2.1. Análisis en componentes principales (PCA, Principal Component Analysis).
El PCA es un método matemático bilineal que provee una interpretación
general de la principal información contenida en una tabla multivariable, mediante la
extracción y visualización de la variación sistemática de los datos en dicha tabla [35].
Los datos originales se transforman en una combinación lineal de variables no
correlacionadas entre sí, llamadas componentes principales (PCs). No todos los
componentes principales contienen la misma información; los primeros son los que
describen la mayor variación en los datos, que se asocia a la información más
relevante, mientras que los últimos describen variaciones en los datos que pueden ser
debidas a ruido o error experimental, o a un sobreajuste del modelo y pueden ser
descartados, con lo que se consigue una importante reducción del número de
variables. Se aplica la siguiente ecuación:
X ti piT E (1.1)
i a
donde X es la matriz de datos a tratar (en esta tesis serán huellas dactilares, datos
espectrales o cromatográficos después de su pretratamiento), a es el número de
20
Introducción
componentes principales que contienen la información deseada, ti son los scores para
cada componente principal y pi los loadings y E es una matriz de error, es decir la
variación residual de X que no es explicada por el modelo con a componentes
principales. El superíndice T indica la matriz traspuesta. La ecuación 1.1 se puede
expresar de la siguiente manera:
X TPT E (1.2)
donde T es la matriz de scores, con tantas filas como la matriz original X, y que
contiene la información sobre las filas (los objetos) de la matriz original; PT
corresponde a la transpuesta de la matriz de loadings, con tantas columnas como los
datos originales, y que contiene información sobre las columnas (las variables) de la
matriz original. El número de columnas de la matriz de scores corresponde al número
calculado de componentes principales, a; PC1 explica la máxima variabilidad de la
matriz X, PC2 es ortogonal a la primera componente y abarca la mayor cantidad de la
variación restante, y así sucesivamente, hasta que se explica el total de la variación
útil de la matriz original X. Al representar gráficamente los valores de los scores, es
posible detectar e interpretar las pautas presentadas por las muestras, agrupaciones,
similitudes, diferencias y muestras anómalas.
1.6.2.2. Modelado blando independiente de analogías de clases (SIMCA, Soft
Independent Modeling of Class Analogy).
SIMCA es un método de clasificación supervisado donde cada clase se modela
usando un PCA de forma independiente, de forma que cada clase tiene un modelo
específico que la describe con el número óptimo de PCs [80]. De esta manera, se
puede construir un “espacio de la clase”, cuya volumen marca el límite entre las
muestras que son descritas por el modelo como pertenecientes a la clase estudiada y
las muestras que no pueden ser consideradas como pertenecientes a ella, para un
nivel de confianza seleccionado [17]. Para saber si una nueva muestra se ajusta a la
clase, la información que se calcula es dividida en dos, una parte explicada por el
modelo de la clase y otra que permanece en los residuales. Si los residuales de la
21
Introducción
muestra son significativamente mayores que los de la clase, la muestra es rechazada
[74].
Dependiendo del programa utilizado en la construcción del modelo SIMCA, se
pueden tener diferentes maneras de representar los resultados en la clasificación de
las muestras desconocidas; por ejemplo, pueden ser visualizados empleando un
gráfico de Cooman, que muestra la discriminación de dos clases a la vez (véase la
Figura 1.2). La distancia desde el modelo para la clase 1 es representada frente la
distancia del modelo 2, las distancias críticas son indicadas en ambos ejes. Por lo
tanto, se definen cuatro zonas en el gráfico: clase 1 (I), clase 2 (II), una zona de
confusión en la cual se superponen las clases 1 y 2 (III), y la zona de valores atípicos
(IV). Al representar las muestras del conjunto de validación en este gráfico, es más
fácil evaluar qué tan certera es la clasificación.
II IV
III I
Figura 1.2. Ejemplo de un grafico de Cooman; las líneas rojas indican las
distancias críticas. (Imagen extraída del software The Unscrambler X).
Otra forma de interpretar los resultados obtenidos, es determinar el espacio
definido por una clase dada (T2) y su espacio residual (Q), con la finalidad de evaluar si
los valores de cada muestra predicha están mejor descritos por el espacio T2; de ser
así, las muestras son clasificadas como miembros de la clase.
22
Introducción
1.6.2.3. Análisis discriminante (DA, Discriminat Analysis).
El análisis discriminante es una técnica supervisada de clasificación, es decir,
donde se han definido previamente el número de clases y de muestras que pertenecen
a cada una de ellas [63]. Cuanto mayores son las diferencias entre dos clases dadas,
mayor es la distancia de Mahalanobis entre ellas. La discriminación de las muestras se
consigue mediante el cálculo de la distancia de Mahalanobis de cada una de ellas a los
centros de los grupos considerados [95]. Una muestra desconocida se clasifica como
perteneciente al grupo con el cual tenga una distancia más cercana al centro [80]. El
DA puede considerarse similar al PCA sólo en el sentido de que ambos determinan un
hiperplano con un menor número de variables en el cual se proyectan los datos de las
muestras desde un plano con más variables. Sin embargo, el PCA selecciona la
dirección que retiene la máxima estructura entre los datos, mientras que el DA
selecciona la dirección en la que se consigue una separación máxima entre los grupos
definidos [96]. En la construcción de este modelo se debe tener en consideración que
se requiere un mayor número de muestras que de variables.
1.6.3. Métodos de regresión.
A continuación se mencionan las técnicas multivariables empleadas en esta
memoria para buscar una relación entre la señal analítica y alguna propiedad de la
muestra.
1.6.3.1 Regresión por mínimos cuadrados parciales (PLSR, Partial Least Squares
Regression).
La regresión parcial por mínimos cuadrados (PLSR) se utiliza para encontrar las
relaciones fundamentales entre las variables independientes (X) y las variables
dependientes (Y), las cuales son modeladas simultáneamente teniendo en cuenta no
sólo la varianza de X, sino la covarianza entre X e Y [90]. Entonces, X e Y se
descomponen simultáneamente en un producto de otras dos matrices de scores y
loadings; como es descrito por las siguientes ecuaciones:
23
Introducción
X = TPT + E (1.3)
Y = UQT+ F (1.4)
donde TPT se aproxima a los datos de la matriz X y UQT a los verdaderos valores de Y.
La descomposición no es independiente y existe una relación lineal entre los scores T
y U. Los términos E y F de las ecuaciones 1.3 y 1.4 son matrices de error y el
superíndice T significa la transpuesta de la matriz. El algoritmo PLS trata de encontrar
factores (llamados variables latentes) que maximizan la cantidad de variación
explicada en X que es relevante para la predicción de Y, es decir, capturar varianza y
conseguir correlación [91].
1.6.3.2. Análisis discriminante con mínimos cuadrados parciales (PLS‐DA, Partial
Least Squares ‐ Discriminat Analysis).
Es un método supervisado de análisis que se basa en la regresión en mínimos
cuadrados parciales [96]. Las variables independientes (X) pueden ser el espectro o el
cromatograma de cada muestra, mientras que la variable dependiente Y es una
variable categórica, definida por el analista, que codifica cada clase de manera
numérica [81]. Habitualmente, la matriz Y consta de números enteros [97].
El resultado de la regresión son valores de Y cercanos a los que indican cada
categoría. Una muestra del conjunto de predicción se considera que está
correctamente categorizada si cumple dos criterios: debe tener un perfil
cromatográfico o espectral que no sea significativamente diferente de los perfiles de
las muestras que forman el conjunto de calibración y el valor calculado de la variable
categórica debe estar dentro de un intervalo de valores alrededor del número con el
que se codifica la categoría (cut ‐ off value).
24
Introducción
25
Introducción
consideradas se ve obligada a ser igual a un valor constante, es decir, a la
concentración total). La convergencia se logra cuando en dos ciclos de iteraciones
consecutivas, la diferencia relativa en la desviación estándar de los residuales que hay
entre los datos experimentales y los obtenidos con ALS son menores a un valor
previamente seleccionado.
1.6.5. Verificación de los modelos y selección del número de factores.
La verificación (también llamada validación) de un modelo basado en datos
empíricos significa revisar qué tan bien se desempeñará cuando sea utilizado en la
predicción de nuevas muestras, del mismo tipo que las utilizadas en su construcción;
es decir, estima la incertidumbre de las futuras predicciones. Si la incertidumbre es
razonablemente baja, el modelo puede ser considerado válido [80,81].
La verificación de la bondad del modelo se puede ensayar sobre un nuevo
conjunto de muestras, distintas de las utilizadas en la construcción del mismo (llamado
conjunto de prueba, test set) o mediante un sistema de validación cruzada (cross‐
validation). Con el método de la validación cruzada, las mismas muestras se utilizan
tanto para la estimación del modelo, como para su evaluación. Unas cuantas muestras
quedan fuera del conjunto de calibración y se construye un modelo con las muestras
restantes. Entonces, son predichas las muestras que han quedado fuera de la
calibración y se calculan los residuales de predicción. El proceso se repite con otro
subconjunto de muestras del conjunto de calibración, y así sucesivamente hasta que
todos los objetos se ha dejado fuera una vez [80]. A partir de la validación cruzada se
pueden calcular figuras de mérito para evaluar cómo se comporta el modelo cuando se
aplica a nuevos datos y también se puede determinar el número óptimo de factores a
incluir (componentes principales para un PCA o variables latentes en un PLS) [82]. Los
nombres de las figuras de mérito obtenidas, en la validación cruzada y en la predicción
de un conjunto de muestras independiente, varían entre los diferentes programas de
quimiometría; en este trabajo, se han utilizado los siguientes:
26
Introducción
Raíz del error cuadrático medio de calibración (RMSEC, root mean square error
of calibration), nos proporciona información sobre el ajuste del modelo a los
datos de calibración; es una medida de lo bien que se ajusta el modelo a los
datos.
Raíz del error cuadrático medio de la validación cruzada (RMSECV, root mean
square error of cross‐validation), que es una medida de la capacidad de un
modelo para predecir las muestras que no fueron utilizadas para construirlo
durante el procedimiento de validación cruzada.
Raíz del error cuadrático medio de predicción (RMSEP, root mean square error
of prediction), nos da información sobre el ajuste del modelo a los datos de
predicción. Son utilizadas las muestras de validación preparadas y medidas
independientemente de las muestras de calibración; es decir, que no fueron
empleadas en la construcción del modelo o en la validación cruzada.
El parámetro PRESS (Prediction Sum of Squares) es la suma del cuadrado de los
residuales utilizando un modelo construido con un determinado número de
componentes principales o variables latentes. El PRESS se representa gráficamente en
función del número de factores y sirve como ayuda para la selección del número
óptimo de componentes en el modelo. El error del modelo debería decrecer en la
medida en que se incluyen factores que describen grandes cantidades de varianza
sistemática, y debería aumentar al incluir factores que describen ruido; es decir, que
sólo describen una pequeña cantidad de varianza. Se debe seleccionar el número de
factores donde el error del modelo sea mínimo [81,82].
Hay otras maneras de seleccionar el número adecuado de factores para un
modelo. Algunos programas proporcionan las curvas de varianza explicada (o las
curvas de varianza residual), tanto para la calibración como para la predicción obtenida
por la validación cruzada; el usuario debe comparar dichas curvas para elegir el
número de factores.
27
Introducción
Referencias.
(1) Xiaorui, Z. General Guidelines for Methodologies on Research and Evaluation of Traditional
Medicine. 2000. Geneva. WHO/EDM/TRM/2000.1.
(2) Drašar, P.; Moravcova, J. Recent advances in analysis of Chinese medical plants and
traditional medicines. Journal of Chromatography B 2004, 812, 3‐21.
(3) WHO. WHO guidelines on good manufacturing practices (GMP) for herbal medicines. 2007.
Geneva. ISBN: 978 92 4 154716 1.
(4) WHO. National policy on traditional medicine and regulation of herbal medicines: Report of
a WHO global survey. 2005. France. ISBN: 92 4 159323 7.
(5) Liang, Y.; Xie, P.; Chan, K. Quality control of herbal medicines. Journal of Chromatography B
2004, 812, 53‐70.
(6) Secretaria de Salud; Comisión Permanente de la Farmacopea de los Estados Unidos
Mexicanos. Farmacopea Herbolaria de los Estados Unidos Mexicanos. 2001. México. ISBN:
9789688119822.
(7) Li, B.; Hu, Y.; Liang, Y.; Xie, P.; Du, Y. Quality evaluation of fingerprints of herbal medicine
with chromatographic data. Anal. Chim. Acta 2004, 514, 69‐77.
(8) Mahady, G. B. Global Harmonization of Herbal Health Claims. The Journal of Nutrition 2001,
131, 1120S‐1123S.
(9) Perez‐Meseguer, J.; Garza‐Juarez, A.; Salazar‐Aranda, R.; Salazar‐Cavazos, M. L.; de la Torre
Rodriguez, Y. C.; Rivas‐Galindo, V.; Waksman de Torres, N. Development and validation of
an HPLC‐DAD analytical procedure for quality control of damiana (Turnera diffusa), using
an antioxidant marker isolated from the plant. J. AOAC Int. 2010, 93, 1161‐1168.
(10) European Pharmacopoeia. European Pharmacopoeia 5.0, Volumes 1 and 2. The European
Pharmacopoeia Commission. 2005. Strasbourg: EDQM.
(11) FDA. Dietary Supplements. http://www.fda.gov/food/dietarysupplements/default.htm
(con acceso el 21/06, 2012).
(12) FDA. Guidance for Industry, Botanical Drug Products. Rockville, MD. CDER/FDA 2004.
(13) Yap, K. Y.; Chan, S. Y.; Lim, C. S. Infrared‐based protocol for the identification and
categorization of ginseng and its products. Food Res. Int. 2007, 40, 643‐652.
(14) Xie, P.; Chen, S.; Liang, Y.; Wang, X.; Tian, R.; Upton, R. Chromatographic fingerprint
analysis—a rational approach for quality assessment of traditional Chinese herbal
medicine. Journal of Chromatography A 2006, 1112, 171‐180.
(15) Lau, A.; Seo, B.; Woo, S.; Koh, H. High‐performance liquid chromatographic method with
quantitative comparisons of whole chromatograms of raw and steamed Panax
notoginseng. Journal of Chromatography A 2004, 1057, 141‐149.
(16) Mok, D. K. W.; Chau, F. Chemical information of Chinese medicines: A challenge to
chemist. Chemometrics Intellig. Lab. Syst. 2006, 82, 210‐217.
(17) Gallardo‐Velázquez, T.; Osorio‐Revilla, G.; Loa, M. Z.; Rivera‐Espinoza, Y. Application of
FTIR‐HATR spectroscopy and multivariate analysis to the quantification of adulterants in
Mexican honeys. Food Res. Int. 2009, 42, 313‐318.
(18) Laasonen, M.; Harmia‐Pulkkinen, T.; Simard, C. L.; Michiels, E.; Rasanen, M.; Vuorela, H.
Fast identification of Echinacea purpurea dried roots using near‐infrared spectroscopy.
Anal. Chem. 2002, 74, 2493‐2499.
(19) Dumarey, M.; van Nederkassel, A. M.; Deconinck, E.; Vander Heyden, Y. Exploration of
linear multivariate calibration techniques to predict the total antioxidant capacity of green
tea from chromatographic fingerprints. Journal of Chromatography A 2008, 1192, 81‐88.
(20) Yang, L.; Wu, D.; Tang, X.; Peng, W.; Wang, X.; Ma, Y.; Su, W. Fingerprint quality control of
Tianjihuang by high‐performance liquid chromatography–photodiode array detection.
Journal of Chromatography A 2005, 1070, 35‐42.
29
Introducción
(21) Ji, Y.; Xu, Q.; Hu, Y.; Heyden, Y. V. Development, optimization and validation of a
fingerprint of Ginkgo biloba extracts by high‐performance liquid chromatography. Journal
of Chromatography A 2005, 1066, 97‐104.
(22) Sun, Y.; Guo, T.; Sui, Y.; Li, F. Fingerprint analysis of Flos Carthami by capillary
electrophoresis. Journal of Chromatography B 2003, 792, 147‐152.
(23) Wang, L.,C.; Cao, Y.,H.; Xing, X.,P.; Ye, J.,N. Fingerprint Studies of Radix Scutellariae by
Capillary Electrophoresis and High Performance Liquid Chromatography. Chromatographia
2005, 283‐288.
(24) Zhang, M. H.; Xu, Q. S.; Massart, D. L. Robust principal components regression based on
principal sensitivity vectors. Chemometrics Intellig. Lab. Syst. 2003, 67, 175‐185.
(25) EMEA Guideline on quality of herbal medicinal products/traditional herbal medicinal
products. CPMP/QWP/2819/00. 2006, Rev.1.
(26) EMEA Guideline on specifications: Test procedures and acceptance criteria for herbal
substances, herbal preparations and herbal medicinal products/traditional herbal
medicinal products. CPMP/QWP/2820/00. 2006, Rev.1.
(27) Sumner, L. W.; Mendes, P.; Dixon, R. A. Plant metabolomics: large‐scale phytochemistry in
the functional genomics era. Phytochemistry 2003, 62, 817‐836.
(28) Tyler, V. E. Phytomedicnines: Back to the Future. J. Nat. Prod. 1999, 62, 1589‐1592.
(29) Chen, P.; Luthriau, D.; Harringtonohio, P. d. B.; Harnly, J. M. Discrimination Among Panax
Species Using Spectral Fingerprinting. Journal of AOAC International 2011, 94, 1411‐1421.
(30) Garza‐Juarez, A.; de la Luz Salazar‐Cavazos, M.; Salazar‐Aranda, R.; Perez‐Meseguer, J.;
Waksman de Torres, N. Correlation between Chromatographic Fingerprint and Antioxidant
Activity of Turnera diffusa (Damiana). Planta Med. 2011, 77, 958‐963.
(31) Peng, L.; Wang, Y.; Zhu, H.; Chen, Q. Fingerprint profile of active components for Artemisia
selengensis Turcz by HPLC–PAD combined with chemometrics. Food Chem. 2011, 125,
1064‐1071.
(32) Cserháti, T. Multivariate Methods in Chromatography; John Wiley & Sons, Ltd. 2008. ISBN:
9780470754146.
(33) Garza‐Juarez, A.; Waksman‐De‐Torres, N.; Ramirez‐Duron, R.; Salazar Cavazos, M.
Development and validation of fingerprints of Turnera diffusa extracts obtained by use of
high‐performance liquid chromatography with diode array detection and chemometric
methods. Acta Chromatographica 2009, 21, 217‐235.
(34) Dejaegher, B.; Alaerts, G.; Matthijs, N. Methodology to develop liquid chromatographic
fingerprints for the quality control of herbal medicines. Acta Chromatographica 2010, 22,
237‐258.
(35) Chen, Y.; Xie, M.; Yan, Y.; Zhu, S.; Nie, S.; Li, C.; Wang, Y.; Gong, X. Discrimination of
Ganoderma lucidum according to geographical origin with near infrared diffuse reflectance
spectroscopy and pattern recognition techniques. Anal. Chim. Acta 2008, 618, 121‐130.
(36) Jin, Z.; Xu, S.; Sun, S.; Zhou, Q. Analysis of Acanthopanax senticosus Harms for different
parts using Fourier transform infrared spectroscopy. Guangpuxue Yu Guangpu Fenxi 2008,
28, 2859‐2863.
(37) Gong, F.; Liang, Y.; Xie, P.; Chau, F. Information theory applied to chromatographic
fingerprint of herbal medicine for quality control. Journal of Chromatography A 2003,
1002, 25‐40.
(38) Gong, F.; Liang, Y.; Fung, Y.; Chau, F. Correction of retention time shifts for
chromatographic fingerprints of herbal medicines. Journal of Chromatography A 2004,
1029, 173‐183.
(39) Circosta, C.; De Pasquale, R.; Samperi, S.; Pino, A.; Occhiuto, F. Biological and analytical
characterization of two extracts from Valeriana officinalis. J. Ethnopharmacol. 2007, 112,
361‐367.
(40) Ong, E. S. Extraction methods and chemical standardization of botanicals and herbal
preparations. Journal of Chromatography B 2004, 812, 23‐33.
30
Introducción
(41) Ye, M.; Guo, D. Analysis of bufadienolides in the Chinese drug ChanSu by high‐
performance liquid chromatography with atmospheric pressure chemical ionization
tandem mass spectrometry. Rapid Communications in Mass Spectrometry 2005, 19, 1881‐
1892.
(42) Belliardo, F.; Bicchi, C.; Cordero, C.; Liberto, E.; Rubiolo, P.; Sgorbini, B. Headspace‐Solid‐
Phase Microextraction in the Analysis of the Volatile Fraction of Aromatic and Medicinal
Plants. Journal of Chromatographic Science 2006, 44, 416‐429.
(43) Deng, C.; Ji, J.; Li, N.; Yu, Y.; Duan, G.; Zhang, X. Fast determination of curcumol, curdione
and germacrone in three species of Curcuma rhizomes by microwave‐assisted extraction
followed by headspace solid‐phase microextraction and gas chromatography–mass
spectrometry. Journal of Chromatography A 2006, 1117, 115‐120.
(44) Lucero, M. E.; Fredrickson, E. L.; Estell, R. E.; Morrison, A. A.; Richman, D. B. Volatile
Composition of Gutierrezia sarothrae (Broom Snakeweed) as Determined by Steam
Distillation and Solid Phase Microextraction. J. Essent. Oil Res. 2006, 18, 121‐125.
(45) Cao, J.; Qi, M.; Fang, L.; Zhou, S.; Fu, R.; Zhang, P. Solid‐phase microextraction–gas
chromatographic–mass spectrometric analysis of volatile compounds from Curcuma
wenyujin Y.H. Chen et C. Ling. J. Pharm. Biomed. Anal. 2006, 40, 552‐558.
(46) Krist, S.; Stuebiger, G.; Unterweger, H.; Bandion, F.; Buchbauer, G. Analysis of Volatile
Compounds and Triglycerides of Seed Oils Extracted from Different Poppy Varieties
(Papaver somniferum L.). J. Agric. Food Chem. 2005, 53, 8310‐8316.
(47) Guo, F.; Huang, L.; Zhou, S.; Zhang, T.; Liang, Y. Comparison of the volatile compounds of
Atractylodes medicinal plants by headspace solid‐phase microextraction‐gas
chromatography–mass spectrometry. Anal. Chim. Acta 2006, 570, 73‐78.
(48) Flamini, G.; Cioni, P. L.; Morelli, I. Composition of the essential oils and in vivo emission of
volatiles of four Lamium species from Italy: L. purpureum, L. hybridum, L. bifidum and L.
amplexicaule. Food Chem. 2005, 91, 63‐68.
(49) Jiang, Y.; David, B.; Tu, P.; Barbin, Y. Recent analytical approaches in quality control of
traditional Chinese medicines—A review. Anal. Chim. Acta 2010, 657, 9‐18.
(50) Johnson, K. J.; Wright, B. W.; Jarman, K. H.; Synovec, R. E. High‐speed peak matching
algorithm for retention time alignment of gas chromatographic data for chemometric
analysis. Journal of Chromatography A 2003, 996, 141‐155.
(51) Guo, F.; Liang, Y.; Xu, C.; Huang, L.; Li, X. Comparison of the volatile constituents of
Artemisia capillaris from different locations by gas chromatography–mass spectrometry
and projection method. Journal of Chromatography A 2004, 1054, 73‐79.
(52) van Nederkassel, A. M.; Xu, C. J.; Lancelin, P.; Sarraf, M.; MacKenzie, D. A.; Walton, N. J.;
Bensaid, F.; Lees, M.; Martin, G. J.; Desmurs, J. R.; Massart, D. L.; Smeyers‐Verbeke, J.;
Vander Heyden, Y. Chemometric treatment of vanillin fingerprint chromatograms: Effect of
different signal alignments on principal component analysis plots. Journal of
Chromatography A 2006, 1120, 291‐298.
(53) Suntornsuk, L. Capillary electrophoresis of phytochemical substances. J. Pharm. Biomed.
Anal. 2002, 27, 679‐698.
(54) Chen, J.; Zhu, H.; Chu, V. M.; Jang, Y. S.; Son, J. Y.; Kim, Y. H.; Son, C. G.; Seol, I. C.; Kang, J.
S. Quality control of a herbal medicinal preparation using high‐performance liquid
chromatographic and capillary electrophoretic methods. J. Pharm. Biomed. Anal. 2011, 55,
206‐210.
(55) Gotti, R. Capillary electrophoresis of phytochemical substances in herbal drugs and
medicinal plants. J. Pharm. Biomed. Anal. 2011, 55, 775‐801.
(56) Pauli, G. F.; Jaki, B. U.; Lankin, D. C. Quantitative 1H NMR: Development and Potential of a
Method for Natural Products Analysis. J. Nat. Prod. 2005, 68, 133‐149.
(57) Eisenreich, W.; Bacher, A. Advances of high‐resolution NMR techniques in the structural
and metabolic analysis of plant biochemistry. Phytochemistry 2007, 68, 2799‐2815.
31
Introducción
(58) van Beek, T. A.; Montoro, P. Chemical analysis and quality control of Ginkgo biloba leaves,
extracts, and phytopharmaceuticals. Journal of Chromatography A 2009, 1216, 2002‐2032.
(59) Bilia, A. R.; Bergonzi, M. C.; Mazzi, G.; Vincieri, F. F. NMR spectroscopy: a useful tool for
characterisation of plant extracts, the case of supercritical CO2 arnica extract. J. Pharm.
Biomed. Anal. 2002, 30, 321‐330.
(60) Jaki, B.; Sticher, O.; Veit, M.; Frahlich, R.; Pauli, G. F. Evaluation of Glucoiberin Reference
Material from Iberis amara by Spectroscopic Fingerprinting. J. Nat. Prod. 2002, 65, 517‐
522.
(61) Ward, J. L.; Harris, C.; Lewis, J.; Beale, M. H. Assessment of 1H NMR spectroscopy and
multivariate analysis as a technique for metabolite fingerprinting of Arabidopsis thaliana.
Phytochemistry 2003, 62, 949‐957.
(62) Dufour, É. In Chapter 1 ‐ Principles of Infrared Spectroscopy; Infrared Spectroscopy for
Food Quality Analysis and Control; Academic Press: San Diego, 2009; pp 1‐27.
(63) Cozzolino, D.; Fassio, A.; Restaino, E.; Fernandez, E.; La Manna, A. Verification of Silage
Type Using Near‐Infrared Spectroscopy Combined with Multivariate Analysis. J. Agric. Food
Chem. 2008, 56, 79‐83.
(64) Xie, L.; Ying, Y.; Ying, T. Classification of tomatoes with different genotypes by visible and
short‐wave near‐infrared spectroscopy with least‐squares support vector machines and
other chemometrics. J. Food Eng. 2009, 94, 34‐39.
(65) Ren, G.; Chen, F. Simultaneous Quantification of Ginsenosides in American Ginseng (Panax
quinquefolium) Root Powder by Visible/Near‐Infrared Reflectance Spectroscopy. J. Agric.
Food Chem. 1999, 47, 2771‐2775.
(66) Woo, Y.; Kim, H.; Cho, J. Identification of Herbal Medicines Using Pattern Recognition
Techniques with Near‐Infrared Reflectance Spectra. Microchemical Journal 1999, 63, 61‐
70.
(67) Lau, C.; Chan, C.; Chau, F.; Mok, D. K. Rapid analysis of Radix puerariae by near‐infrared
spectroscopy. Journal of Chromatography A 2009, 1216, 2130‐2135.
(68) Blanco, M.; Villarroya, I. NIR spectroscopy: a rapid‐response analytical tool. TrAC Trends in
Analytical Chemistry 2002, 21, 240‐250.
(69) Fan, X.; Cheng, Y.; Ye, Z.; Lin, R.; Qian, Z. Multiple chromatographic fingerprinting and its
application to the quality control of herbal medicines. Anal. Chim. Acta 2006, 555, 217‐
224.
(70) Yan, S.; Xin, W.; Luo, G.; Wang, Y.; Cheng, Y. An approach to develop two‐dimensional
fingerprint for the quality control of Qingkailing injection by high‐performance liquid
chromatography with diode array detection. Journal of Chromatography A 2005, 1090, 90‐
97.
(71) Gómez‐Ariza, J. L.; García‐Barrera, T.; Lorenzo, F. Anthocyanins profile as fingerprint of
wines using atmospheric pressure photoionisation coupled to quadrupole time‐of‐flight
mass spectrometry. Anal. Chim. Acta 2006, 570, 101‐108.
(72) Zhang, J.; Ke, Y.; Liu, H.; Yang, X. Fingerprint Analysis of Flos carthami and Safflower Yellow
Pigments by High‐Performance Liquid Chromatography. Anal. Lett. 2005, 38, 981‐995.
(73) Steinmann, D.; Ganzera, M. Recent advances on HPLC/MS in medicinal plant analysis. J.
Pharm. Biomed. Anal. 2011, 55, 744‐757.
(74) Ni, Y.; Lai, Y.; Brandes, S.; Kokot, S. Multi‐wavelength HPLC fingerprints from complex
substances: An exploratory chemometrics study of the Cassia seed example. Anal. Chim.
Acta 2009, 647, 149‐158.
(75) Zheng, L.; Watson, D. G.; Johnston, B. F.; Clark, R. L.; Edrada‐Ebel, R.; Elseheri, W. A
chemometric study of chromatograms of tea extracts by correlation optimization warping
in conjunction with PCA, support vector machines and random forest data modeling. Anal.
Chim. Acta 2009, 642, 257‐265.
32
Introducción
(76) Navarrete, A.; Avula, B.; Choi, Y. W.; Khan, I. A. Chemical fingerprinting of valeriana
species: simultaneous determination of valerenic acids, flavonoids, and phenylpropanoids
using liquid chromatography with ultraviolet detection. J. AOAC Int. 2006, 89, 8‐15.
(77) Peng, L.; Wang, Y.; Zhu, H.; Chen, Q. Fingerprint profile of active components for Artemisia
selengensis Turcz by HPLC–PAD combined with chemometrics. Food Chem. 2011, 125,
1064‐1071.
(78) Hendriks, M. M. W. B.; Cruz‐Juarez, L.; Bont, D. D.; Hall, R. D. Preprocessing and
exploratory analysis of chromatographic profiles of plant extracts. Anal. Chim. Acta 2005,
545, 53‐64.
(79) Daszykowski, M.; Walczak, B. Use and abuse of chemometrics in chromatography. TrAC
Trends in Analytical Chemistry 2006, 25, 1081‐1096.
(80) P. Gemperline. Practical Guide to Chemometrics, Second Edition, CRC Press, Boca Raton
FL, 2006.
(81) Brereton, R. G. Applied Chemometrics for Scientist, John Wiley & Sons, Ltd, Great Britain,
2007.
(82) Wise, B.; Gallagher, N.; Bro, R.; Shaver, J.; Windig, W.; Koch, R. Chemometrics Tutorial for
PLS_Toolbox and Solo. 2006. ISBN: 0‐9761184‐1‐6.
(83) Barnes, R. J.; Dhanoa, M. S.; Lister, S. J. Standard normal variate transformation and de‐
trending of near‐infrared diffuse reflectance spectra. Applied Spectroscopy 1989, 43, 772‐
777.
(84) Norris, K. H.; Williams, P. C. Optimization of Mathematical Treatments of Raw Near‐
Infrared Signal in the Measurement of Protein in Hard Red Spring Wheat. I. Influence of
Particle Size.. Cereal Chemistry 1984, 61, 158‐165.
(85) Savitzky, A.; Golay, M. J. E. Smoothing and Differentiation of Data by Simplified Least
Squares Procedures. Anal. Chem. 1964, 36, 1627‐1639.
(86) Rinnan, Å.; Nørgaard, L.; Berg, F. v. d.; Thygesen, J.; Bro, R.; Engelsen, S. B. In Chapter 2 ‐
Data Pre‐processing; Infrared Spectroscopy for Food Quality Analysis and Control;
Academic Press: San Diego, 2009; pp 29‐50.
(87) Nielsen, N. V.; Carstensen, J. M.; Smedsgaard, J. Aligning of single and multiple wavelength
chromatographic profiles for chemometric data analysis using correlation optimised
warping. Journal of Chromatography A 1998, 805, 17‐35.
(88) Skov, T.; van den Berg, F.; Tomasi, G.; Bro, R. Automated alignment of chromatographic
data. Journal of Chemometrics, 2006, 20, 484‐497.
(89) Tomasi, G.; van den Berg, F.; Andersson, C. Correlation optimized warping and dynamic
time warping as preprocessing methods for chromatographic data. Journal of
Chemometrics 2004, 18, 231‐241.
(90) Harald Martens; Tormod Naes. Multivariate Calibration; Wiley & Sons, Great Britain, 1989.
(91) Brereton, R. G. In Calibration; Applied Chemometrics for Scientists; John Wiley & Sons,
Ltd: 2007; pp 193‐220.
(92) de Juan, A.; Tauler, R. Chemometrics applied to unravel multicomponent processes and
mixtures: Revisiting latest trends in multivariate resolution. Anal. Chim. Acta 2003, 500,
195‐210.
(93) Jaumot, J.; Gargallo, R.; de Juan, A.; Tauler, R. A graphical user‐friendly interface for MCR‐
ALS: a new tool for multivariate curve resolution in MATLAB. Chemometrics Intellig. Lab.
Syst. 2005, 76, 101‐110.
(94) Kessler, W.; Oelkrug, D.; Kessler, R. Using scattering and absorption spectra as MCR‐hard
model constraints for diffuse reflectance measurements of tablets. Anal. Chim. Acta 2009,
642, 127‐134.
(95) Brereton, R. G. In Pattern Recognition; Applied Chemometrics for Scientists; John Wiley &
Sons, Ltd: 2007; pp 145‐191.
(96) Berrueta, L. A.; Alonso‐Salces, R. M.; Héberger, K. Supervised pattern recognition in food
analysis. Journal of Chromatography A 2007, 1158, 196‐214.
33
Introducción
(97) Liu, F.; He, Y. Classification of brands of instant noodles using Vis/NIR spectroscopy and
chemometrics. Food Res. Int. 2008, 41, 562‐567.
34
2
Objetivos.
Objetivos
La eficacia de gran cantidad de productos fitoterapéuticos ha sido demostrada
desde el punto de vista científico; sin embargo, para asegurar la efectividad es
necesario que cada medicamento de plantas medicinales cumpla con una serie de
requisitos que garanticen su calidad y seguridad. Mientras que en países de la Unión
Europea, el simple procedimiento de registro de productos fitoterapéuticos implica un
estricto control de calidad, en países en desarrollo la situación es completamente
contraria. No obstante, tanto en países desarrollados como en desarrollo, siguen
apareciendo reacciones adversas por el consumo de suplementos dietéticos
elaborados a base de plantas medicinales y los informes en la literatura señalan la
mala calidad de una gran parte de los productos de origen herbolario que están
disponibles en el mercado. Realizar el control de calidad en productos de origen
herbolario no es tarea fácil, por lo complejo de la matriz y por la gran cantidad de
componentes que presentan este tipo de muestras. Por ello la OMS recomienda
utilizar los perfiles cromatográficos y espectroscópicos y hoy en día la construcción de
huellas dactilares es una de las aproximaciones más poderosas para el control de
calidad de plantas medicinales, aunque para poder manejar los resultados obtenidos
es imprescindible aplicar herramientas quimiométricas. Además, el correlacionar la
información obtenida de las huellas dactilares de las plantas y la actividad biológica, lo
que se puede traducir en eficacia de las mismas, es uno de los requerimientos de
investigación urgentes para el control de calidad de productos fitoterapéuticos.
Todo ello conlleva a que se haya realizado esta Tesis Doctoral con los siguientes
objetivos:
2.1. Objetivo General.
Establecer métodos de control de calidad para plantas con uso medicinal a
partir del tratamiento de sus perfiles cromatográficos o espectroscópicos (huellas
dactilares) con técnicas quimiométricas.
37
Objetivos
2.2. Objetivos Específicos.
1) Obtener el perfil cromatográfico o espectroscópico de las plantas medicinales
seleccionadas: Panax ginseng, Eleutherococcus senticosus, Valeriana officinalis
y Turnera diffusa.
2) Pre‐tratamiento de los datos obtenidos en el objetivo 1 y construcción de los
modelos quimiométricos cualitativos, semi‐cuantitativos o cuantitativos.
3) Comparar los métodos quimiométricos desarrollados y seleccionar el más
adecuado para el control de calidad de cada una de las plantas medicinales
elegidas.
4) Correlacionar, en su caso, la información obtenida de la huella dactilar de la
planta con la actividad biológica.
38
3
Eleutherococcus senticosus.
Eleutherococcus senticosus
3.1. Introducción.
3.1.1. Descripción de la planta medicinal.
Eleutherococcus senticosus (Rupr. y Maxim.) Maxim. también conocido como
Acanthopanax senticosus, ciwujia o ginseng siberiano, es un arbusto espinoso que
pertenece a la familia Araliaceae, que crece en Siberia y partes del noreste de China y
Corea [1‐3]. En las últimas tres décadas ha habido un creciente interés en esta planta
debido al amplio espectro de propiedades terapéuticas de sus raíces y rizomas; que
incluyen efectos anticancerígeno, antioxidante, antibacterial, antiviral,
hipocolesterolémico, actividades antiinflamatoria e inmunoestimulante,
hipoglucemiante y propiedades adaptogénicas [1,2,4]. A pesar de que la acción
farmacológica de E. senticosus podría parecerse a la de Panax ginseng y de que ambos
son de la familia Araliaceae, su composición química es muy diferente y por lo tanto no
pueden ser utilizados de manera intercambiable. Los compuestos aislados en
Eleutherococcus son de grupos químicos muy variados e incluyen fenilpropanoides,
lignanos, saponinas, cumarinas, el ácido betulínico triterpeno, provitaminas, vitaminas
y otros compuestos que, aún hoy, están sin identificar o sin nombre [1]. Componentes
característicos de esta planta son los eleuterósidos, compuestos heterogéneos que son
responsables, en cierta medida, de sus actividades biológicas. El eleuterósido E
(siringinoresinol diD‐glucósido, un lignano) y eleuterósido B (siringina, un
derivado de fenilpropano) se han propuesto como los compuestos marcadores en la
identificación y el análisis de E. senticosus [5].
3.1.2. Problemática con el control de calidad del Eleutherococcus senticosus.
Davydov et al. han descrito problemas de nomenclatura e identidad de E.
senticosus debido a la ubiquidad de los compuestos marcadores seleccionados en su
control de calidad [1]. Por otra parte, algunos productores sin escrúpulos
continuamente están tratando de desarrollar maneras para obtener un perfil químico
de sus productos similar al perfil auténtico presentado por la planta medicinal en
cuestión. En estas circunstancias específicas, el uso de compuestos marcadores no sólo
41
Eleutherococcus senticosus
es incapaz de confirmar la identidad de una planta concreta, sino que también podría
ignorar la influencia de otros componentes químicos de origen intrínseco y, por lo
tanto, en algunos casos, su uso puede ser inadecuado para los propósitos de control de
calidad [6,7]. Además, sería deseable que el tiempo del análisis fuera lo más corto
posible, aunque como la mayoría de estos procedimientos se basan en aplicaciones
cromatográficas son bastante lentos, por ejemplo, la determinación de eleuterósidos
puede tardar de 35 ‐ 40 min por análisis sin incluir la preparación de las muestras
[2,5,8].
3.1.3. Descripción del estudio.
En este estudio se ha propuesto un procedimiento para una rápida
identificación de las raíces de E. senticosus empleando huellas dactilares obtenidas
mediante la espectroscopia de infrarrojo cercano (NIR). El procedimiento de
preparación de la muestra es simple; sólo es necesario moler y tamizar la muestra para
registrar los espectros. De esta manera, en lugar de un análisis cromatográfico largo,
puede lograrse en unos pocos minutos un examen rápido por espectroscopia NIR,
incluyendo la preparación de la muestra sin el uso de disolventes [9]. La complejidad
de los espectros NIR requiere el uso de quimiometría para extraer y visualizar la
información analítica útil; así, se han utilizado y comparado el PCA (principal
component analysis), el método SIMCA (soft independent modeling of class analogy),
el DA (discriminant analysis) y el PLS‐DA (partial least squares ‐ discriminant analysis).
Por lo que sabemos, sólo hay un informe de uso de la espectroscopia molecular (FT‐IR)
para el establecimiento de huellas dactilares de E. senticosus [10], por lo que decidió
investigar este tema.
3.2. Metodología específica.
3.2.1. Descripción de las muestras.
Con el fin de incluir la mayor variabilidad posible en las muestras,
independientemente de su origen geográfico, las muestras fueron recolectadas de
42
Eleutherococcus senticosus
varios proveedores durante los años 2007‐2009. Las raíces de E. senticosus (ES), Panax
ginseng (PG), Panax quinquefolium (PQ), Panax notoginseng (PN), Lepidium meyenii
(LM), Withania somnifera (WS), Angelica sinensis (AS), Pfaffia paniculata (PP) y
jengibre (una especia de cocina con propiedades estimulantes [G]) fueron obtenidas
de Amorós Nature (Girona, Catalunya, España), Galke (Gittelde, Alemania), Richters
(Ontario, Canada), Desert Botanicals (Gilbert, AZ, EE.UU.), Frontier Natural Products
Co‐op (Norway, IA, EE.UU.), MaxNature (Los Angeles, CA, EE.UU.), Modern Jungle
(EE.UU.) y herboristerías de la zona metropolitana de Barcelona (España) y la ciudad de
Monterrey (México). Varios proveedores autenticaron sus productos y proporcionaron
un certificado de identidad. Por lo tanto, el conjunto de muestras consistió en
miembros de la familia Araliaceae (ES, PG y PQ), y otros tipos de plantas que no están
relacionados con Araliaceae, que son llamados "ginseng" de forma genérica. En la
Tabla 3.1 se presenta un resumen de las muestras en estudio.
Tabla 3.1. Resumen de las muestras y conjuntos de espectros.
Muestras Lotes Número de espectros en
SIMCA,
Número PLS‐DA, DA
ID a Origen b QS c NSSQC d PCA f
Total e
CS g PS g
ES CA, DE, ES,
5 15 20 45 42 18
MX, US
PG DE, ES, US 3 5 10 21 21 9
LM DE, ES, US 3 3 5 12 0 15
PQ CA, US 3 3 4 9 12 0
AS ES, US 2 2 4 9 0 12
WS DE, US 3 3 4 9 0 12
PP DE, US 3 3 3 6 0 9
PN US 1 1 1 3 0 3
Jengibre US 0 0 1 3 0 3
a
Identidad: ES, Eleutherococcus senticosus; PG, Panax ginseng; PQ, Panax quinquefolium; PN, Panax
notoginseng; AS, Angelica sinensis; LM, Lepidium meyenii; PP, Pfaffia paniculata and WS, Withania
somnifera.
b
CA, Canadá; DE, Alemania; ES, España; MX, México and US, Estados Unidos.
c
Proveedores de calidad; número de proveedores con una certificación de calidad.
d
Número de muestras procedentes de proveedores con alguna certificación de calidad.
e
Diferentes lotes de plantas adquiridos de varios proveedores y herboristerías en tres años (es decir,
todas las muestras proceden de diferentes lotes, proveedores o años).
f
Número de espectros empleados para construir un modelo de PCA global (N.B. éste no es el modelo
empleado para la reducción de variables en el análisis discriminante).
g
Número de espectros empleados en el conjunto de calibración (CS) o en el conjunto de predicción (PS)
para la construcción y evaluación de los modelos de clasificación.
43
Eleutherococcus senticosus
Las raíces se utilizaron tal como fueron adquiridas; es decir, no fue aplicado
ningún secado adicional en el laboratorio para evitar la modificación de sus
características originales y posibles cambios en la composición química. Las muestras
recibidas como raíces enteras o troceadas se molieron en un molinillo Turmix Mill
(Barcelona, España) y luego fueron sometidas a un tamizado por vibración empleando
una tamizadora RP‐15 (CISA, Barcelona, España). Las muestras recibidas en forma de
polvo se tamizaron directamente. En todos los casos, fue obtenido un polvo con un
tamaño de partícula igual o inferior a 100 m. Además, como parte del conjunto de
predicción, se prepararon en el laboratorio diez mezclas sintéticas, mezclando
diferentes cantidades de las plantas en estudio con muestras de E. senticosus; estas
mezclas contenían finalmente 5%, 10% o 20% del adulterante seleccionado. En la Tabla
3.2 se presenta la composición de cada muestra adulterada.
Tabla 3.2. Composición de las mezclas sintéticas.
Adulterante ES
Mezcla no. a Identidad del adulterante
(%) b (%) b
1 P. ginseng 5 95
2 P. quinquefolium 5 95
3 P. notoginseng 5 95
4 Jengibre 5 95
5 P. ginseng 10 90
6 L. meyenii 10 90
7 A. sinensis 10 90
8 P. ginseng 20 80
9 W. somnifera 20 80
10 P. paniculata 20 80
a
Cada mezcla fue preparada por triplicado y se registró el espectro de cada replicado.
b
Porcentajes por pesada. Peso total de 3 g.
3.2.2. Análisis espectroscópico en el infrarrojo cercano.
Se registraron los espectros NIR utilizando un espectrómetro con
monocromador de barrido NIRSystems modelo 5000 (Foss NIRSystems, Silver Spring,
MD), equipado con un módulo RCA (Rapid Content Analyzer), una lámpara halógena
de cuarzo y un detector de sulfuro de plomo. Los espectros fueron obtenidos en modo
de reflectancia sobre la región espectral de 1100 ‐ 2498 nm con una resolución de 2
44
Eleutherococcus senticosus
nm, empleando como referencia un patrón interno de cerámica, que viene provisto
con el instrumento. La lectura de las muestras se realizó en una cubeta de muestra
circular de vidrio (40 mm de diámetro y 10 mm de espesor) llena hasta el borde. Se
aplicó un peso constante de 100 g durante aproximadamente 30 segundos en la
muestra con el fin de obtener una compactación del polvo relativamente constante.
Cada muestra se midió por triplicado, empleando tres porciones de muestra
procesadas de forma independiente, donde cada espectro fue el promedio de 64
barridos sucesivos (obteniendo 700 datos por barrido). El control del espectrómetro y
la manipulación de los archivos espectrales se realizaron utilizando el software Vision,
versión 2.51, de NIRSystems Foss. Los datos de reflectancia fueron almacenados como
el recíproco del logaritmo de la reflectancia, log (1 / R). Se revisó todos los días de
trabajo el buen funcionamiento del instrumento utilizando las opciones de diagnóstico
proporcionados por el fabricante del mismo.
3.2.3. Análisis multivariante.
Los espectros sin tratar fueron exportados desde el programa Vision como
archivos NSAS para el análisis de datos. La construcción de los modelos de PCA, SIMCA
y PLS‐DA fue realizada utilizando el programa Unscrambler (v 9.8; CAMO, Oslo,
Noruega), mientras que el DA se llevó a cabo con el programa SPSS (v 18.0, IBM, IL,
EE.UU.). Con el fin de minimizar el efecto de dispersión de la radiación, los espectros
necesitan ser pre‐tratados; con este fin se ensayaron los pre‐tratamientos de SNV
(standard normal variate), primera y segunda derivada [11]. Las principales bandas de
absorción debidas al agua fueron eliminadas para reducir la influencia de la humedad
en los espectros NIR [12].
El PCA es a menudo el primer paso para el análisis de los espectros obtenidos
con el fin de detectar patrones en las muestras registradas empleando NIR. En este
caso se utilizó con el fin de examinar los agrupamientos naturales de las plantas en
estudio, la detección de muestras anómalas, así como para desarrollar el método
SIMCA y realizar el DA en las componentes principales (PCs) que explican más varianza
del sistema.
45
Eleutherococcus senticosus
Los resultados del método SIMCA fueron visualizados utilizando el gráfico de
Cooman, que muestra la discriminación entre dos clases; al representar las muestras
del conjunto de validación en este gráfico, es más fácil evaluar qué tan certera es la
clasificación.
En este estudio se utilizó el DA para discriminar E. senticosus (grupo 1), de los
otros miembros de la familia Araliaceae, Panax ginseng (grupo 2) y Panax
quinquefolium (grupo 3) y de otras plantas que pudieran ser confundidas con ginseng.
El DA requiere un mayor número de muestras que de variables; por esta razón, se
realizó previamente un PCA y el DA fue realizado utilizando los scores de las primeras
componentes principales, las que contienen la mayor parte de la información útil del
sistema estudiado. Las reglas de clasificación se elaboraron utilizando únicamente las
plantas de los grupos 1 – 3.
Para la construcción del modelo de PLS‐DA, se asignaron a las muestras del
conjunto de calibración dos variables indicando la categoría de las mismas: 1 para E.
senticosus y 0 para otras plantas. Se considera que una muestra del conjunto de
predicción está correctamente clasificada si su valor calculado está dentro de un
intervalo de valores calculado a partir de los valores experimentales. El número óptimo
de factores se determinó con el criterio del valor mínimo de PRESS (prediction sum of
squares) [13]. Como figuras de mérito de los modelos construidos, fueron evaluados el
RMSEC, el RMSEP y el coeficiente de determinación r2. En la construcción de los
modelos de calibración de PCA y PLS‐DA, fue utilizada la validación cruzada (CV),
empleando tres muestras por segmento y estableciendo la selección de muestra como
aleatoria. La comparación de los resultados obtenidos con SIMCA, PLS‐DA y DA se hizo
en términos de sensibilidad, especificidad, la tasa general de éxito en la clasificación
(GSR) y el porcentaje de mezclas clasificadas correctamente (MCC).
46
Eleutherococcus senticosus
3.3. Resultados y discusión.
3.3.1. Características de los espectros de infrarrojo cercano.
Las moléculas poliatómicas presentes en la matriz de las plantas medicinales
exhiben múltiples vibraciones armónicas y de combinación, haciendo que sus bandas
espectrales se superpongan. Como resultado, se pueden observar bandas espectrales
muy amplias y sin rasgos distintivos; las Figuras 3.1a y 3.1b presentan espectros
registrados.
No obstante, los espectros NIR contienen información molecular de las
muestras, y esta información puede ser extraída por medio de métodos
quimiométricos. Las bandas de humedad originadas por el enlace O‐H, se encuentran
alrededor de 1350 nm y 1950 nm, que son respectivamente bandas de armónicos y de
combinación. Con el fin de excluir a estas bandas del análisis, las longitudes de onda
comprendidas de 1306 a 1396 nm y de 1846 a 2016 nm, fueron excluidas en el pre‐
tratamiento y la construcción del modelo matemático. Es evidente que no se puede
realizar la identificación de la especie de la planta a través de la inspección visual los
espectros. Aparecen algunas diferencias en los espectros a longitudes de onda por
encima de 2050 nm; sin embargo, también sufren un efecto relativamente importante
de dispersión. Aunque no son visualmente perceptibles, existen diferencias en todo el
espectro, por lo que se pueden construir los modelos de clasificación utilizando todas
las longitudes de onda que quedan.
De todos los pre‐tratamientos ensayados, el SNV efectuó la mejor corrección de
los artefactos espectrales y produjo los modelos más sencillos, por lo que este pre‐
tratamiento fue seleccionado para ser aplicado en el resto del estudio.
47
Eleutherococcus senticosus
Figura 3.1. (a) Espectros de infrarrojo cercano de los miembros de la familia Araliaceae y (b)
plantas no relacionadas. (c) Representación de los scores de la PC1 vs. PC2 de un PCA global,
presentando la elipse de confianza al 95%. (d) Gráfico de influencia; las muestras anómalas
presentan valores altos de leverage y de varianza residual. En (c) y (d), se señalan las muestras
sospechosas de ser anómalas.
48
Eleutherococcus senticosus
3.3.2. Estudio del agrupamiento natural de las muestras.
Se realizó un PCA global empleando algunas muestras de cada tipo de planta
(véase la Tabla 3.1). El conjunto de calibración incluyó 117 espectros, tomados al azar
de los 156 espectros disponibles para ser evaluados; excluyendo las mezclas
preparadas en el laboratorio. Este conjunto de calibración, que incluyó todos los tipos
de plantas, nos permitió examinar la presencia de pautas. Las otras muestras se
utilizaron para construir el conjunto de predicción y, posteriormente, fueron utilizadas
como muestras externas (es decir, objetos completamente nuevos no utilizados en el
desarrollo del modelo). El modelo de PCA fue construido empleando 4 PCs,
presentando una varianza explicada del 97.90%. La capacidad del modelo en la
predicción de nuevos objetos se evaluó por medio de la varianza explicada obtenida de
la validación cruzada, la cual presentó un valor de 97.76%, lo que indica una buena
capacidad predictiva. Los elevados valores de varianza explicada alcanzados en la
calibración y la validación del modelo, así como la pequeña diferencia que presentan
entre ellos, sugiere que el sistema no se ve afectado de forma importante por
muestras anómalas. En el gráfico de scores se pueden observar las pautas de
agrupación de acuerdo con la especie de planta (Figura 3.1c). La primera componente
principal separó el E. senticosus de otras especies, al posicionar este grupo en valores
positivos de scores mientras que la mayoría de las otras muestras se ubican en valores
negativos. Las muestras de P. paniculata fueron las más cercanas al grupo del E.
senticosus. Las fronteras del grupo E. senticosus parecen estar bien definidas, sólo una
muestra apareció a una distancia moderada del grupo.
Así, parece posible la identificación de E. senticosus frente a otras especies de
plantas, independientemente si están o no relacionadas con la familia Araliaceae. La
muestra sospechosa ubicada entre los valores de score 4 y 5 de PC1, la muestra ES23, y
aquéllas fuera de la elipse de confianza del 95% (AS18, AS41) fueron examinadas
usando el gráfico de influencia, con el fin de decidir si eran o no muestras anómalas
(Figura 3.1d). A partir de la figura se determinó que la muestra ES23 era una muestra
anómala evidente. Tomar una decisión para las otras muestras sospechosas (G, AS18 y
AS41) fue más complicado. Aunque se sospechaba que estas muestras podrían ser
49
Eleutherococcus senticosus
anómalas, fueron conservadas ya que son descritas correctamente por el modelo, tal
como se puede observar del análisis de los residuales y de las distancias que
presentaron al modelo construido. El comportamiento presentado por la muestra ES23
se debió a longitudes de onda que estaban por encima de 2200 nm.
Al igual que con todos los métodos no supervisados de clasificación, el PCA
proporciona un panorama general para explicar las pautas de las muestras estudiadas,
pero la asignación de nuevas muestras a una clase puede ser una tarea difícil con este
método, ya que no calcula una regla que defina fronteras o regiones que diferencien
entre los grupos de muestras en estudio. Por lo tanto, fueron empleados métodos
supervisados con el fin de lograr una clasificación más objetiva.
3.3.3. Modelado blando independiente de analogías de clases (SIMCA).
Como las muestras de la familia Araliaceae tienen espectros similares,
consideramos apropiado estudiar la posibilidad de que las muestras de E. senticosus
(ES) fueran mal clasificadas en las clases P. ginseng (PG) y P. quinquefolium (PQ). En
consecuencia, para la construcción del modelo SIMCA se consideraron tres clases: ES,
PG y PQ. El número de espectros empleados en cada clase, se indica en la Tabla 3.1. El
número de componentes principales necesarias para definir adecuadamente cada
clase fueron de 6, 4 y 3, respectivamente, presentando en todos los casos una varianza
explicada > 97%, obtenida mediante la validación cruzada. Todas las variables incluidas
en la construcción del modelo SIMCA exhibieron una buena capacidad de modelado y
de discriminación. Adicionalmente, las distancias presentadas entre los modelos de
PCA de cada clase fueron grandes, indicando que hubo una buena resolución entre
ellas. En la Figura 3.2a se presenta un gráfico de Cooman, que muestra la distancia de
las muestras de validación con respecto a las clases del E. senticosus y P. ginseng. A
partir de esta gráfica llegamos a la conclusión de que las muestras de validación de E.
senticosus tienen una buena probabilidad de ser asignadas a la clase correcta, dentro
de un nivel de significación del 5%.
50
Eleutherococcus senticosus
Figura 3.2. (a) Gráfico de Cooman que presenta la distancias ortogonales de las muestras de
validación a las clases (modelos) del E. senticosus y el P. ginseng. (b) Leverage (distancia al
centro del modelo de E. senticosus) vs. distancia de la muestra a la clase del E. senticosus. En
(a) y (b) fue marcada con un circulo la muestra anómala ES23. (c) Ampliación del recuadro.
51
Eleutherococcus senticosus
Como era de esperar, la muestra ES23 estaba más lejos de la clase
correspondiente que otras muestras de E. senticosus, lo cual es un resultado coherente
con las observaciones realizadas en los scores y loadings obtenidos del PCA global
realizado previamente. En ningún caso las muestras de E. senticosus estuvieron cerca
de la clase PG o de la clase PQ; además, ninguna muestra de P. ginseng empleada en la
validación presentó proximidad a la clase del E. senticosus. Esta comprobación
cruzada, permitió confirmar la correcta asignación de clase entre los miembros de la
familia Araliaceae.
La clasificación final de las muestras del conjunto de predicción fue realizada
con el gráfico de la distancia de la muestra a la clase del E. senticosus y el leverage
(Figura 3.2b). Como era de esperar, todas las muestras de E. senticosus estuvieron
dentro de los límites de clasificación, y la muestra ES23 fue excluida correctamente de
la clase. El resto de las otras especies de plantas en estudio excedieron los valores
límite de clasificación, claramente indicando que no pertenecen a la clase del E.
senticosus.
La semejanza a E. senticosus presentada por las plantas estudiadas, expuesta
en orden decreciente, es como sigue: PP, PN, WS, PG, LM and AS. Esta información
también está de acuerdo con los resultados obtenidos en el PCA. Los resultados para
las mezclas preparadas en el laboratorio se muestran en la Figura 3.2c, las muestras
clasificadas como E. senticosus están dentro del cuadrado formado por los límites y los
ejes. Las últimas cuatro mezclas de la Tabla 3.2 fueron excluidos por el modelo de la
clase ES, por lo que es posible detectar muestras adulteradas, con certeza, desde un
20% de adulterante. A pesar de que la mezcla siete se preparo con un 10% de otra
especie de planta y se identificó como adulterada, SIMCA no pudo detectar las mezclas
cinco y seis, que presentan la misma proporción de adulterante. Los resultados de la
mezcla siete podría atribuirse a la especie de planta utilizada, ya que AS es el producto
más diferente a E. senticosus y es fácilmente discriminado por el modelo. En resumen,
sólo es posible detectar mezclas que tengan alrededor de un 20% de contaminante.
52
Eleutherococcus senticosus
Tabla 3.3. Resultados obtenidos en la clasificación con los modelos construidos.
Clasificado en b
Tipo de a Sensibilidad Especificidad MCC GSR
Modelo n Clase Clase
Muestra (%) (%) (%) (%)
ES NOES
SIMCA 84
ES 15 15 0 100
OHPs 66 0 66 100
Mezclas 30 18 12 40
PLS‐DA 92
ES 15 11 4 73
OHPs 66 0 66 100
Mezclas 30 5 25 83
DA 70
ES 15 15 0 100
OHPs 66 3 63 96
Mezclas 30 30 0 0
a
Número de espectros en el conjunto de prueba (PS).
b
Clase ES, muestras que pertenecen a la clase E. senticosus;
Clase NOES, muestras que no pertenecen a la clase E. senticosus.
La Tabla 3.3 recoge los resultados generales obtenidos con SIMCA. La tasa
general de éxito en la clasificación (GSR) representa el porcentaje total de las muestras
correctamente clasificadas. Utilizando SIMCA se obtuvo un valor de GSR bastante
bueno, sólo disminuido a causa de mezclas con cantidades de adulterante que eran
inferiores al 20%. El porcentaje de mezclas correctamente clasificadas (MCC) es el
porcentaje de mezclas clasificadas como ajenos a la clase E. senticosus. Dos
parámetros relacionados afectan a este valor, el producto herbal utilizado para
preparar las mezclas y la cantidad mínima de adulterante discriminada por el modelo.
La sensibilidad es la proporción de muestras que pertenecen a la clase E. senticosus
que fueron correctamente identificadas por el modelo matemático. La especificidad es
la proporción de muestras que no pertenecen a la clase E. senticosus que fueron
identificadas como extrañas por el modelo (aquí denotadas de manera general como
OHPs, otros productos herbales). Estos dos criterios son similares a los propuestos por
Lau, et al. [14]. El valor de sensibilidad obtenido indica que hay una probabilidad muy
pequeña de obtener un falso negativo al realizar la prueba de identidad usando el
53
Eleutherococcus senticosus
modelo construido. Además, de acuerdo con la especificidad, los OHPs en todos los
casos serian excluidos de la clase del E. senticosus.
3.3.4. Análisis discriminante con mínimos cuadrados parciales (PLS‐DA).
Las variaciones en las variables espectrales (X) y las variables categóricas (Y)
fueron descritas por tres variables latentes (LVs), presentando una varianza explicada
de 94.75% y 96.59%, respectivamente, obtenida por la validación cruzada. Este
número relativamente pequeño de LVs sugiere una baja correlación en los espectros
de diferentes clases, pero similitudes en los espectros dentro de las clases. Además, el
bajo número de LVs proporciona una indicación de la buena diferenciación entre las
clases construidas. Estas suposiciones fueron confirmadas mediante la inspección del
gráfico de scores, donde sólo fue necesaria la LV1 para lograr una separación de la
clase ES de las otras dos. No hubo presencia de muestras anómalas en el conjunto de
calibración, de acuerdo a lo observado en un grafico de leverage vs. la varianza
residual de las variables X. En la Figura 3.3a, se presenta un gráfico de los valores Y de
referencia vs. los valores Y calculados por el modelo (predicción de la validación
cruzada), para todas las muestras de la clase ES. La línea de regresión obtenida en la
predicción de las muestras utilizadas en la calibración, mostró una pendiente de 0.982,
una ordenada de 0.011 y r2 = 0.983. Así mismo, el RMSECV no superó el valor de 0.07
(unidades arbitrarias, au). Considerando estos resultados, se concluyó que el modelo
PLS‐DA desarrollado es útil para clasificar las nuevas muestras del conjunto externo de
predicción.
Para ser clasificada correctamente, una muestra debe cumplir dos criterios:
debe tener un espectro que no sea significativamente diferente de los espectros de las
muestras que forman el conjunto de calibración y el valor de la variable categórica Y
calculada, ha de caer dentro de un cierto intervalo de aceptación, calculado a partir de
los resultados experimentales.
54
Eleutherococcus senticosus
Figura 3.3. (a) Gráfico de los valores Y de referencia vs. los valores Y calculados; se presentan
las líneas de regresión para la calibración y la validación. Las líneas discontinuas muestran el
intervalo de aceptación y la línea continua el valor categórico asignado. (b) Representación de
los valores de Hotelling T2 vs. los valores del estadístico “inlier”; se consideró que todas las
muestras con valores fuera de los límites no pertenecen a la clase E. senticosus. El círculo
señala la muestra ES23. (c) Ampliación del recuadro.
55
Eleutherococcus senticosus
56
Eleutherococcus senticosus
absolutos fue el valor del intervalo aceptado para clasificar nuevas muestras en una
clase u otra:
Cutoff value = ± (│m│ + │M│+│RMSECV│)/ 3 (3.1)
El siguiente paso para clasificar las muestras restantes, las que están dentro de
los límites de los estadísticos de Hotelling y de la distancia inlier, fue comprobar el
ajuste de sus valores calculados de Y en el intervalo de aceptación definido
previamente. El intervalo hallado fue de ± 0.10. Esto significa que todas las muestras
con un valor calculado de Y de 0.90 a 1.10, y que no se han considerado inliers, serán
clasificadas como pertenecientes a la clase del E. senticosus.
Los resultados generales después de los dos pasos se presentan en la Tabla 3.3.
El valor de la sensibilidad disminuyó debido a las muestras con falso negativo, las
cuales eran todas réplicas de la muestra ES33 y una réplica de la muestra ES35. Por
otro lado, el método construido presentó una buena especificidad; ninguna de las
muestras de otras plantas medicinales fue clasificada erróneamente. Además, la
mayoría de las mezclas probadas fueron clasificadas correctamente fuera de la clase
del E. senticosus; sólo la mezcla 3 y un replicado de las mezclas 4 y 5 fueron asignados
erróneamente. Por lo tanto, mediante el uso de PLS‐DA, es posible detectar muestras
adulteradas a partir de 5% de adulterante, pero teniendo en cuenta que la especie de
la planta empleada como adulterante no debe de ser de los miembros de la familia
Araliaceae, especialmente el P. notoginseng. El PLS‐DA presentó un mejor valor de GSR
que SIMCA, principalmente debido a una mayor capacidad para detectar mezclas y una
buena especificidad, aunque es posible rechazar algunas muestras auténticas de E.
senticosus.
3.3.5. Análisis discriminante (DA).
El método DA presenta la importante limitación de requerir más muestras que
variables para que la matriz de covarianza pueda ser invertible. Se llevó a cabo un PCA
con el fin de reducir el número de variables espectrales a unas pocas componentes
57
Eleutherococcus senticosus
principales y se utilizaron como variables de entrada las primeras 10 PCs, que
explicaban una varianza > 98%. Las muestras de las clases de Araliaceae previamente
definidas (Tabla 3.1) fueron utilizadas para la construcción del modelo. El método de
inclusión de variables por etapas (stepwise) fue aplicado a fin de incluir en el modelo
discriminante las PCs estadísticamente significativas. Para tal fin, fue utilizado el
criterio de maximización de la distancia de Mahalanobis, ya que éste considera la
dirección y dispersión de los datos multivariantes [13]. Al final fue utilizado un modelo
con las primeras 8 PCs como variables independientes.
La prueba de Box rechazó la igualdad de la covarianza para las clases
establecidas, de modo que, en la clasificación fueron utilizadas las matrices de
covarianza por separado. Al haber sido empleadas tres clases fueron obtenidas dos
funciones discriminantes, aquí nombradas como CF1 y CF2. La matriz de estructura
sugirió la mayor correlación absoluta entre la variable PC1 y CF1, mientras que la
variable PC4 hizo lo mismo con CF2. Como era de esperar, CF1 fue la principal función
para la clasificación, su correlación canónica fue de 0.997 con una varianza explicada
del 94.10%. Para el conjunto de calibración, el porcentaje de muestras correctamente
clasificadas fue del 100%.
Las muestras del conjunto de predicción fueron proyectadas sobre el modelo
de PCA construido previamente y, a continuación, se utilizaron los scores obtenidos en
el análisis discriminante. Los resultados alcanzados se pueden ver en la Tabla 3.3.
Todas las muestras auténticas de E. senticosus fueron asignadas correctamente a su
clase; sin embargo, la especificidad se vio afectada por la clasificación errónea de la
muestra ES23. Los OHPs fueron excluidos de la clase ES; desgraciadamente, todas las
mezclas fueron clasificadas en la clase ES, independientemente de la cantidad o el tipo
de adulterante presente en la mezcla. Por lo tanto, el método DA no es adecuado para
la detección de muestras adulteradas, tal como ha indicado el valor de MCC, pero aun
así es útil para discriminar E. senticosus no procesado de otros productos
fitoterapéuticos procedentes de diferentes orígenes. De todos los modelos ensayados,
el método DA obtuvo el valor más bajo de GSR como resultado de la limitación en la
detección de mezclas y la posibilidad de falsos positivos.
58
Eleutherococcus senticosus
3.4. Conclusiones del capítulo.
Mediante el uso de la espectroscopia NIR y la quimiometría se consiguió la
diferenciación rápida de materiales sin procesar de E. senticosus de otras ocho
especies de plantas, relacionadas y no relacionadas con la familia Araliaceae.
Los tres métodos de clasificación evaluados, SIMCA, DA, y PLS‐DA, permitieron
hacer una buena discriminación entre E. senticosus y otras plantas; sin embargo, las
pruebas con mezclas preparadas en laboratorio indicaron que sólo el PLS‐DA y SIMCA
eran realmente útiles para la detección de falsificaciones y adulteraciones. El método
SIMCA y el PLS‐DA obtuvieron una tasa general de éxito en la clasificación de 84% y
92%, respectivamente. La sensibilidad y la especificidad de todos los modelos
(supervisados) de clasificación construidos fueron superiores al 73%.
El DA requiere la compresión previa de las variables originales por medio de un
PCA y, en consecuencia, la reducción de la especificidad fue evidente, por lo que se vio
afectada la capacidad para detectar muestras adulteradas.
El método SIMCA, intuitivo y sencillo, sería útil si el objetivo principal del
estudio fuese detectar confusiones de especie, ya que tiene una excelente sensibilidad
y especificidad.
El PLS‐DA proporcionó los mejores resultados y es capaz de descubrir mezclas
de plantas con una cantidad de adulterante menor a las que puede detectar SIMCA; la
clasificación de las mezclas de laboratorio mostró que es posible detectar
adulteraciones con una cantidad de material herbal cercana al 5%, dependiendo de la
proximidad que tenga esta planta con la familia Araliaceae. Los resultados sugieren
que la espectroscopia NIR puede ser utilizada para autenticar E. senticosus.
59
Eleutherococcus senticosus
Referencias.
(1) Davydov, M.; Krikorian, A. D. Eleutherococcus senticosus (Rupr. & Maxim.) Maxim.
(Araliaceae) as an adaptogen: a closer look. J. Ethnopharmacol. 2000, 72, 345‐393.
(2) Zgórka, G.; Kawka, S. Application of conventional UV, photodiode array (PDA) and
fluorescence (FL) detection to analysis of phenolic acids in plant material and
pharmaceutical preparations. J. Pharm. Biomed. Anal. 2001, 24, 1065‐1072.
(3) Niu, H.; Hsu, F.; Liu, I. Role of sympathetic tone in the loss of syringin‐induced plasma
glucose lowering action in conscious Wistar rats. Neurosci. Lett. 2008, 445, 113‐116.
(4) Liu, K. Y.; Wu, Y.; Liu, I.; Yu, W. C.; Cheng, J. Release of acetylcholine by syringin, an active
principle of Eleutherococcus senticosus, to raise insulin secretion in Wistar rats. Neurosci.
Lett. 2008, 434, 195‐199.
(5) Apers, S.; Naessens, T.; Van Miert, S.; Pieters, L.; Vlietinck, A. Quality control of roots of
Eleutherococcus senticosus by HPLC. Phytochem. Anal. 2005, 16, 55‐60.
(6) Mok, D. K. W.; Chau, F. Chemical information of Chinese medicines: A challenge to chemist.
Chemometrics Intellig. Lab. Syst. 2006, 82, 210‐217.
(7) Xie, P.; Chen, S.; Liang, Y.; Wang, X.; Tian, R.; Upton, R. Chromatographic fingerprint
analysis—a rational approach for quality assessment of traditional Chinese herbal
medicine. Journal of Chromatography A 2006, 1112, 171‐180.
(8) European Pharmacopoeia. European Pharmacopoeia 5.0, Volumes 1 and 2. The European
Pharmacopoeia Commission. 2005. Strasbourg: EDQM.
(9) Pereira, A. F. C.; Pontes, M. J. C.; Neto, F. F. G.; Santos, S. R. B.; Galvão, R. K. H.; Araújo, M.
C. U. NIR spectrometric determination of quality parameters in vegetable oils using iPLS
and variable selection. Food Res. Int. 2008, 41, 341‐348.
(10) Jin, Z.; Xu, S.; Sun, S.; Zhou, Q. Analysis of Acanthopanax senticosus Harms for different
parts using Fourier transform infrared spectroscopy. Guangpuxue Yu Guangpu Fenxi 2008,
28, 2859‐2863.
(11) Rinnan, Å.; Nørgaard, L.; Berg, F. v. d.; Thygesen, J.; Bro, R.; Engelsen, S. B. In Chapter 2 ‐
Data Pre‐processing; Infrared Spectroscopy for Food Quality Analysis and Control;
Academic Press: San Diego, 2009; pp 29‐50.
(12) Ren, G.; Chen, F. Determination of moisture content of ginseng by near infra‐red
reflectance spectroscopy. Food Chem. 1997, 60, 433‐436.
(13) Brereton, R. G. Applied Chemometrics for Scientist, John Wiley & Sons, Ltd, Great Britain,
2007.
(14) Lau, C.; Chan, C.; Chau, F.; Mok, D. K. Rapid analysis of Radix puerariae by near‐infrared
spectroscopy. Journal of Chromatography A 2009, 1216, 2130‐2135.
(15) Chen, Y.; Xie, M.; Yan, Y.; Zhu, S.; Nie, S.; Li, C.; Wang, Y.; Gong, X. Discrimination of
Ganoderma lucidum according to geographical origin with near infrared diffuse reflectance
spectroscopy and pattern recognition techniques. Anal. Chim. Acta 2008, 618, 121‐130.
(16) Woodcock, T.; Downey, G.; O’Donnell, C. P. Near infrared spectral fingerprinting for
confirmation of claimed PDO provenance of honey. Food Chem. 2009, 114, 742‐746.
61
4
Panax ginseng.
Panax ginseng
4.1. Introducción.
4.1.1. Descripción de la planta medicinal.
Panax ginseng es una famosa planta medicinal que se usa ampliamente en la
medicina tradicional oriental, pertenece a la familia Araliaceae y crece principalmente
en Corea y China [1‐3]. Los componentes activos principales de P. ginseng, y también
de otras especies pertenecientes al género Panax, son saponósidos del dammarano
comúnmente referidos como ginsenósidos [1,4]. Ha habido un creciente interés en
esta planta debido al amplio espectro de propiedades terapéuticas de sus raíces y
rizomas, que incluyen efectos anticancerígeno, antioxidante, antibacterial, antiviral,
hipocolesterolémico, actividades antiinflamatoria e inmunoestimulante,
hipoglucemiante y propiedades adaptogénicas [5‐7]. A pesar de que la acción
farmacológica de otros miembros de la familia Araliaceae (p. ej. E. senticosus) podría
parecerse a la de Panax ginseng, ya se ha mencionado en el capítulo 3 que la
composición química de Araliaceae es muy diferente y por lo tanto no pueden ser
utilizados de manera intercambiable [8].
4.1.2. Problemática con el control de calidad del Panax ginseng.
El P. ginseng tiene que ser diferenciado de otras especies de Panax, de otros
integrantes de la familia Araliaceae y de otros tipos de plantas que no están
relacionados con Araliaceae, que se consideran como ginseng. Dado que ha habido
informes de reacciones adversas, es obvio que es necesaria una mejora en el control
de calidad para evitar indeseables efectos secundarios [5,9].
En la actualidad, el método más común de análisis es CLAR de los extractos de
ginseng con detección ya sea por espectrometría UV o de masas; sin embargo, los
métodos cromatográficos destruyen las muestras de ginseng, consumen tiempo y
disolventes y se centran principalmente en los ginsenósidos [4,6]. Se han desarrollado
métodos que utilizan la espectroscopia de infrarrojo medio o cercano para el control
de calidad de las especies de Panax; sin embargo, éstos se centran en la determinación
65
Panax ginseng
de la humedad y de ginsenósidos específicos [7,10], en la distinción de áreas de cultivo
y calidades (grados) del ginseng [6,11] o en discriminar el ginseng de un pequeño
número de plantas de aspecto similar [3‐5,12]. A partir de aquí, es evidente que sigue
siendo necesaria una estrategia complementaria para el establecimiento de la huellas
dactilar del P. ginseng; sobre todo para discriminarlo de un número mayor de posibles
falsificaciones, incluyendo las mezclas de plantas.
4.1.3. Descripción del estudio.
En este estudio se ha desarrollado un procedimiento para una identificación
rápida de las raíces de P. ginseng empleando huellas dactilares obtenidas mediante la
espectroscopia de infrarrojo cercano (NIR). El procedimiento de preparación de la
muestra es simple, sólo es necesario moler y tamizar para registrar los espectros. De
esta manera, en lugar de un largo análisis cromatográfico, en unos pocos minutos
puede lograrse un examen rápido por espectroscopia NIR, incluyendo la preparación
de la muestra sin el uso de disolventes.
La complejidad de los espectros NIR requiere el uso de quimiometría para
extraer y visualizar la información analítica útil; en este trabajo, se han utilizado y
comparado el PCA (principal component analysis), el método SIMCA (soft independent
modeling of class analogy), el DA (discriminant analysis) y el PLS‐DA (partial least
squares ‐ discriminant analysis).
Además, se han utilizado mezclas preparadas en el laboratorio en la evaluación
de la capacidad de los modelos para detectar muestras adulteradas. Si la intención del
análisis de las mezclas de plantas es la exploración de su composición, una opción útil
podría ser el uso de los espectros NIR y el MCR‐ALS (multivariate curve resolution ‐
alternating least squares), ya que el análisis habitual por CLAR de mezclas de plantas
podría llevar mucho tiempo y consume cantidades considerables de disolventes. Así, se
ha llevado a cabo el análisis semicuantitativo de mezclas binarias de P. gingseng y un
adulterante utilizando MCR‐ALS.
66
Panax ginseng
4.2. Metodología específica.
4.2.1. Descripción de las muestras.
Las raíces de Panax ginseng (PG), E. senticosus (ES), Panax quinquefolium (PQ),
Panax notoginseng (PN), Lepidium meyenii (LM), Withania somnifera (WS), Angelica
sinensis (AS), Pfaffia paniculata (PP) y jengibre (ginger, una especia de cocina con
propiedades estimulantes [G]) fueron obtenidas de Amorós Nature (Girona, Catalunya,
España), Galke (Gittelde, Alemania), Richters (Ontario, Canada), Desert Botanicals
(Gilbert, AZ, EE.UU.), Frontier Natural Products Co‐op (Norway, IA, EE.UU.), MaxNature
(Los Angeles, CA, EE.UU.), Modern Jungle (EE.UU.) y herboristerías de la zona
metropolitana de Barcelona (España) y la ciudad de Monterrey (México).
Así, el conjunto de muestras consistió en miembros de la familia Araliaceae
(PG, ES, PQ y PN), y otros tipos de plantas que no están relacionados con Araliaceae, y
que son considerados como ginseng. Varios proveedores poseen una certificación de
calidad (p. ej. ISO, GMP o de otro tipo); otros son capaces de de autenticar sus
productos a través de botánicos expertos que identifican las plantas de sus propios
cultivos; de este modo, pueden proporcionar un comprobante de identidad.
Al igual que en el estudio de E. senticosus, las muestras fueron recolectadas
durante los años 2007 a 2009 con el fin de incluir la mayor variabilidad posible. En la
Tabla 4.1 se presenta un resumen de las muestras en estudio. El tratamiento también
fue similar; las raíces se utilizaron tal como fueron adquiridas, es decir no fue aplicado
ningún secado adicional en el laboratorio para evitar la modificación de sus
características originales y posibles cambios en la composición química. Las muestras
recibidas como raíces enteras o troceadas se molieron en un molinillo Turmix Mill
(Barcelona, España) y fueron posteriormente tamizadas por vibración con una criba
vibratoria RP‐15 (CISA, Barcelona, España). Las muestras recibidas en forma de polvo
se tamizaron directamente. En todos los casos, fue obtenido un polvo con un tamaño
de partícula igual o inferior a 100 m.
67
Panax ginseng
Tabla 4.1. Características de las muestras y conjuntos de espectros.
68
Panax ginseng
Tabla 4.2.Composición de las mezclas.
Modo Número/Tipo de Identidad del PG Adulterante
mezcla a Adulterante (%) b (%) b
Clasificación 1 P. quinquefolium 95 5
2 E. senticosus 95 5
(SIMCA, 3 P. notoginseng 95 5
PLS‐DA, 4 Ginger 95 5
DA) 5 P. quinquefolium 90 10
6 L. meyenii 90 10
7 A. sinensis 90 10
8 P. quinquefolium 80 20
9 W. somnifera 80 20
10 P. paniculata 80 20
Semi‐ Simulación E. senticosus 90 10
cuantificación numérica 85 15
80 20
(MCR) 75 25
70 30
60 40
Experimental E. senticosus 90 10
80 20
70 30
60 40
a
Cada mezcla se preparó por triplicado y se registró el espectro de cada réplica (exceptuando las
mezclas simuladas).
b
Porcentajes por pesada. Peso total de 3 g.
4.2.2. Análisis espectroscópico en el infrarrojo cercano.
Los espectros NIR fueron obtenidos usando un espectrómetro con
monocromador de barrido NIRSystems modelo 5000 (Foss NIRSystems, Silver Spring,
MD), equipado con un módulo RCA (Rapid Content Analyzer), una lámpara halógena
de cuarzo y un detector de sulfuro de plomo. Los espectros fueron obtenidos en modo
de reflectancia, empleando como referencia un patrón de cerámica, provista de fabrica
con el instrumento, sobre la región espectral de 1100 ‐ 2498 nm con una resolución de
2 nm. Las muestras fueron analizadas en una cubeta de muestra circular de vidrio (40
mm de diámetro y 10 mm de espesor) llena hasta el borde. Se aplicó un peso
constante de 100 g, durante aproximadamente 30 segundos, en la muestra con el fin
de obtener en la cubeta una compactación del polvo relativamente constante.
69
Panax ginseng
Cada muestra se registró por triplicado, empleando tres porciones de muestra
procesadas de forma independiente, donde cada espectro fue el promedio de 64
barridos sucesivos (obteniendo 700 datos por barrido). El control del espectrómetro y
la manipulación de los archivos espectrales se realizaron utilizando el programa Vision,
versión 2.51, de NIRSystems Foss. Los datos de reflectancia fueron almacenados como
el recíproco del logaritmo de la reflectancia, log (1 / R). Se reviso el buen
funcionamiento del instrumento todos los días de trabajo, utilizando las opciones de
diagnóstico proporcionados por el fabricante.
4.2.3. Análisis multivariante.
Los espectros sin tratar fueron exportados desde el programa Vision como
archivos NSAS para el análisis de datos. El PCA, SIMCA y PLS‐DA fueron realizados
utilizando el programa PLS‐Toolbox (v. 6.5.1; Eigenvector Research, Inc.) para uso en el
entorno computacional MATLAB (v 7.9, The MathWorks, Inc.), mientras que el DA fue
llevado a cabo con el programa SPSS (v 19.0; IBM). En la Tabla 4.1 se presentan los
espectros utilizados para construir y probar los modelos matemáticos. Con el fin de
minimizar el efecto de dispersión de la radiación, los espectros necesitan ser
pretratados; con este fin se utilizaron los pretratamientos de SNV (standard normal
variate), primera y segunda derivada [13]. Se eliminaron las principales bandas de
absorción del agua para reducir la influencia de la humedad en los espectros NIR [10].
El cálculo de MCR‐ALS fue realizado utilizando el software MATLAB y la interfaz gráfica
de usuario desarrollada por Jaumot et al. [14], que está disponible libremente en
http://www.ub.edu/mcr/web_mcr/welcome.htm.
Como es habitual, el estudio previo de las muestras se realizó mediante un PCA.
También se empleó esta técnica para el modelado de cada una de las tres clases
consideradas, P. ginseng, P. quinquefolium y E. senticosus, y que se utilizaron en el
método de clasificación SIMCA. El resto de las muestras y las mezclas de laboratorio se
utilizaron en el conjunto de prueba. Al aplicar el método SIMCA, los limites para el
espacio (T2) definido por el modelo de P. ginseng y su espacio residual (Q) fueron
70
Panax ginseng
establecidos a un nivel de confianza del 95% y las muestras con distancias dentro de
los limites fueron clasificadas como miembros de la clase.
Se empleó el DA para discriminar P. ginseng (grupo 1) de los otros miembros de
la familia Araliaceae, de E. senticosus (grupo 2), de P. quinquefolium (grupo 3) y de
plantas consideradas como ginseng; los grupos 1 a 3 se utilizaron para elaborar las
reglas de clasificación. Puesto que el DA requiere un mayor número de muestras que
de variables, se realizó previamente una reducción de variables con un PCA,
seleccionando las componentes que explican la mayor variabilidad de los datos.
En el caso del PLS‐DA, las variables categóricas fueron asignadas a las muestras
del conjunto calibración de la siguiente manera: 1 a P. ginseng y 0 para las otras
plantas (ES y PQ). Los criterios para considerar que una muestra está correctamente
clasificada se han mencionado en la sección 1.6.3.2. y su aplicación ha sido descrita en
las secciones 3.2.3 y 3.3.4.
Los modelos de calibración de PCA y PLS fueron validados empleando la
validación cruzada con el método de bloques contiguos y tres muestras por segmento,
los replicados de muestra son eliminados o introducidos juntos en el conjunto de
calibración. El número óptimo de factores para construir el modelo se determinó con
el criterio del valor mínimo de PRESS (Prediction Sum of Squares) [15]. Los estadísticos
evaluados en la construcción de los modelos de calibración incluyeron RMSEC (root
mean square error of calibration), RMSECV (root mean square error of cross validation)
y el coeficiente de determinación r2.
La comparación de los resultados obtenidos con SIMCA, PLS‐DA y DA se hizo en
términos de sensibilidad, especificidad, la tasa general de éxito en la clasificación (GSR)
y el porcentaje de mezclas clasificadas correctamente (MCC). Podemos definir estos
términos de manera análoga a la descrita en la sección 3.3.3. La sensibilidad es la
proporción de muestras que pertenecen a la clase P. ginseng que son correctamente
identificadas por el modelo matemático. La especificidad es la proporción de muestras
que no pertenecen a la clase P. ginseng (es decir, ES, PQ, PN, LM, WS, AS y PP) que son
71
Panax ginseng
correctamente identificados por el modelo como extrañas. El valor de GSR se obtiene
calculando el porcentaje global de muestras predichas que fueron correctamente
clasificadas con respecto a la clase P. ginseng. El porcentaje de mezclas clasificadas
correctamente es útil para comparar la capacidad de los modelos para discriminar
muestras adulteradas.
Para evaluar la viabilidad de aplicar el algoritmo MCR‐ALS se utilizaron dos
conjuntos de datos, una primera matriz D se construyó con espectros de mezclas
simuladas matemáticamente, las cuales fueron formadas a partir de los espectros
puros de P. ginseng y un adulterante seleccionado. La otra matriz D se construyó
registrando espectros de mezclas de plantas preparadas en el laboratorio y cuya
composición se muestra en la Tabla 4.2. A fin de facilitar el proceso de resolución,
ambas matrices se aumentaron con varios espectros de P. ginseng puro. El número
propuesto de factores se estableció en 2 y como estimaciones iniciales se utilizaron los
espectros “puros” de las plantas. Asimismo, fue evaluada la utilidad de las limitaciones
de no negatividad, closure y las restricciones de igualdad. El valor de convergencia
seleccionado fue del 0.1%.
4.3. Resultados y discusión.
4.3.1. Características de los espectros de infrarrojo cercano.
Las moléculas complejas, presentes en la matriz de las raíces de ginseng y las
plantas analizadas, exhiben múltiples vibraciones armónicas y de combinación,
haciendo que sus bandas se superpongan; las Figuras 4.1a y 4.1b presentan los
espectros registrados. Como resultado, se obtienen espectros con bandas muy amplias
y sin rasgos distintivos, características comunes en el análisis por NIR de las plantas
medicinales [16]. Al igual que para E. senticosus, las bandas de humedad fueron
excluidas en el pre‐tratamiento y la construcción de los modelos matemáticos. De
todos los pre‐tratamientos ensayados, el SNV efectuó la mejor corrección de la
dispersión de la radiación y permitió obtener los modelos más sencillos, por lo que se
aplicó en el resto del estudio.
72
Panax ginseng
4.3.2. Estudio de la similitud de las muestras.
Se realizó un PCA global empleando las muestras indicadas en la Tabla 4.1 que
con 5 componentes principales (PCs) explicaba una varianza de 98.86% con un
RMSECV de 0.302. Este valor de RMSECV y el alto porcentaje de varianza explicada
empleando pocos PCs sugiere que el modelo no es afectado de forma importante por
ninguna muestra anómala. En los gráficos de scores se observó un agrupamiento
complejo de las muestras según la especie de la planta; el gráfico de PC1 vs. PC4 fue el
mejor para examinar la forma de agrupamiento del P. ginseng y para representar la
distribución natural y el agrupamiento de las otras especies de plantas alrededor del
grupo del P. ginseng, véanse las Figuras 4.1c y 4.1d. La proximidad de las otras especies
de plantas al grupo del P. ginseng, con la excepción de las muestras de E. senticosus y
P. paniculata, indica que puede ser difícil conseguir una buena clasificación; nótese
que algunas de las mezclas están situadas junto a muestras P. ginseng y también la
proximidad de P. quinquefolium. Afortunadamente, las fronteras del grupo del P.
ginseng parecen ser claras y el grupo es compacto, sólo unas pocas muestras aparecen
a una cierta distancia del grupo; estas características harán posible discriminar las
otras especies de plantas cuando se construya el correspondiente modelo de la clase.
Así, es posible la identificación del P. ginseng frente a otras especies de plantas,
independientemente si están o no relacionadas con la familia Araliaceae.
Las muestras sospechosas fuera de la elipse de confianza del 95% fueron
examinadas mediante la revisión de sus valores de residual (Q) y de leverage (T2) y,
finalmente, se decidió conservarlas ya que se llegó a la conclusión de que obedecían el
modelo de PCA construido. La inspección de los residuales de los loadings mostró la
posibilidad de que el SNV no haya corregido completamente los efectos de la
dispersión de la radiación en longitudes de onda por encima de 2270 nm.
Al igual que todos los métodos no supervisados de clasificación, el PCA
proporciona un panorama general para explicar las pautas de las muestras estudiadas,
pero la asignación de nuevas muestras a una clase puede ser una tarea difícil con este
método, ya que no calcula una regla que defina fronteras o regiones para diferenciar
73
Panax ginseng
entre los grupos obtenidos a partir de las muestras en estudio. Por lo tanto, fueron
empleados métodos supervisados con el fin de lograr una clasificación más objetiva.
Figura 4.1. (a) Espectros de infrarrojo cercano de los miembros de la familia Araliaceae y (b)
plantas no relacionadas utilizadas como sustitutos del ginseng. (c) Gráfico de scores PC1 vs.
PC4 de un PCA global presentando la elipse de confianza al 95%. (d) Ampliación del recuadro.
4.3.3. SIMCA (Soft Independent Modeling of Class Analogy).
Se consideraron tres clases para construir el modelo SIMCA, como se describe
en la Tabla 4.1. El principal interés es estudiar los posibles errores de clasificación de
las muestras de P. ginseng en las clases PQ y ES, puesto que las muestras
pertenecientes a la familia Araliaceae tienen características similares. Además, la clase
PG debe ser capaz de discriminar las muestras adulteradas y otras especies de plantas
diferentes a las que constituyen la clase. Al construir el modelo SIMCA se necesitaron 5
PCs para definir correctamente la clase PG, 5 para la clase ES y 3 para la clase PQ,
74
Panax ginseng
obteniendo una varianza explicada > 98% y un valor de RMSECV < 0.08. Todas las
variables incluidas en la construcción del modelo SIMCA exhibieron una buena
capacidad de modelado. Ninguna muestra de P. ginseng del conjunto de predicción
mostró cercanía suficiente a la clase PQ o la clase ES para ser clasificados
erróneamente; esto permite confirmar la asignación correcta de clase entre los
miembros de la familia Araliaceae.
Tabla 4.3. Comparación de los resultados de la calcificación.
Clasificado b Sensibilidad Especificidad MCC GSR
Modelo ID n a
PG AHG (%) (%) (%) c (%) d
SIMCA 95
PG 18 18 0 100
OHs e 69 0 69 100
Mezclas 30 6 24 80
PLS‐DA 85
PG 18 18 0 100
OHs e 69 6 63 91
Mezclas 30 12 18 60
DA 80
PG 18 18 0 100
OHs e 69 9 60 87
Mezclas 30 14 16 53
a
Número de espectros en el conjunto de prueba (PS).
b
PG, P. ginseng; AHG, otro grupo de plantas.
c
Porcentaje de mezclas correctamente clasificadas como ajenas a la clase PG.
d
Tasa general de éxito en la clasificación.
e
Otras plantas, aquí se encuentran E. senticosus, P. notoginseng, L. meyenii, W. somnifera, A. sinensis,
P. paniculata y el jengibre (ginger).
La Tabla 4.3 resume el resultado al utilizar SIMCA. El valor de sensibilidad
obtenido indica que hay una probabilidad muy pequeña de obtener un falso negativo
al realizar la prueba de identidad usando el modelo construido. Además, de acuerdo
con la especificidad, las otras especies de plantas serían excluidas de la clase PG en
todos los casos. Utilizando SIMCA se obtuvo un valor de GSR bastante bueno, sólo
disminuido a causa de los espectros de las mezclas uno y cinco, ambas preparadas con
ginseng Americano (PQ), que fueron clasificadas erróneamente como P. ginseng. Este
75
Panax ginseng
error de clasificación no es inesperado debido a que estas mezclas fueron las situadas
junto al grupo del P. ginseng en la Figura 4.1d. Aunque algunas de las especies de
plantas utilizadas en la preparación de mezclas eran lo suficientemente diferentes
como para ser discriminadas por el modelo SIMCA, incluso en una cantidad del 5%,
otras especies con espectros similares al del P. ginseng, por ejemplo el P.
quinquefolium, podrían ser erróneamente identificadas en mezclas a un 10%; por lo
tanto, sólo es posible detectar con fiabilidad las muestras que contengan alrededor de
un 20% de adulterante.
4.3.4. PLS‐DA (partial least squares ‐ discriminant analysis).
Utilizando la matriz X de espectros, las clases codificadas en el vector Y fueron
descritas con tres variables latentes (LVs), presentando una varianza explicada de 94%
y 98%, respectivamente. El utilizar un número de LVs igual al número de clases sugiere
una baja correlación química en los espectros de diferentes clases, pero similitudes de
los espectros dentro de las clases; es decir, el número bajo de LVs proporciona una
idea de la buena capacidad del modelo para describir las clases propuestas. Los
estadísticos de la regresión mostraron un RMSEC de 0.128, un RMSECV de 0.182 y r2
obtenida de la validación cruzada de 0.869. Este valor de r2 puede parecer bajo; sin
embargo, durante la construcción del modelo no se detectaron muestras anómalas. Un
valor de corte de ± 0.20 se determinó empleando la ecuación 3.1 (sección 3.3.4),
considerando la línea de validación de la clase PG y el error en las predicciones. Esto
significa que todas las muestras calculadas que se han estimado dentro de los límites
establecidos por el valor de Hotelling T2 y el valor de residuales Q a un nivel de
confianza del 95% y con un valor Y de 0.80 a 1.20 serían clasificadas como
pertenecientes a la clase del PG.
Los resultados obtenidos se muestran en la Tabla 4.3. El valor de especificidad
fue de un 91% debido a muestras que dieron falso positivo, todas ellas replicados de
muestras de L. meyenii. Por otro lado, el modelo construido presenta una buena
sensibilidad ya que ninguna de las muestras de P. ginseng fue clasificada
erróneamente. Desafortunadamente, más de un tercio de los espectros de las mezclas
76
Panax ginseng
analizadas (1, 3, 5 y 6) fueron clasificadas erróneamente ya que las especies
adulterantes de esas muestras no fueron discriminadas por el modelo PLS‐DA; ver la
Tabla 4.2. De acuerdo con estos resultados, sólo es posible detectar las mezclas con
una cantidad de adulterante que esté necesariamente en torno a un 20%, ya que
fueron confundidas varias especies de plantas aparte de P. quinquefolium.
Aunque el PLS‐DA presentó un valor menor de GSR que SIMCA, principalmente
debido a una inferior capacidad para detectar mezclas y su menor especificidad, es
posible rechazar la mayoría de las muestras de otras especies y hay una probabilidad
muy pequeña de clasificar una muestra auténtica de P. ginseng como un falso
negativo.
4.3.5. DA (discriminant analysis).
Debido a las características del DA, no es posible establecer que una muestra
dada no pertenezca a una de las clases definidas previamente en el modelo; es decir,
todas las muestras a clasificar deben ser asignadas a una clase y las especies no
incluidas en el modelo serán clasificadas en alguna de ellas aunque no sea la que le
corresponde. En consecuencia, se debe determinar qué muestras podrían ser
confundidas con respecto a la clase del PG. Como ya se ha comentado en la sección
1.6.2.3, el método DA presenta la limitación de requerir más muestras que variables
para que la matriz de covarianza pueda ser invertible; consecuentemente, se llevó a
cabo un PCA con las muestras de las clases de Araliaceae previamente definidas (Tabla
4.1), con el fin de reducir el número de variables espectrales a unas pocas PCs. De esta
manera, se utilizaron como variables de entrada las primeras 10 PCs del modelo de
PCA que explican el 99.96% de la varianza. Se aplicó el método de inclusión de
variables por etapas (stepwise) a fin de incluir en el modelo discriminante las
componentes estadísticamente significativas; para tal fin, se utilizó el criterio de
maximización de la distancia de Mahalanobis, ya que con él se considera la dirección y
dispersión de los datos multivariantes [15]. Al final, fue obtenido un modelo con 9 PCs
como variables independientes; la PC3 no fue significativo y no fue incluido en el
modelo definitivo. La prueba de Box rechazó la igualdad de la covarianza para las
77
Panax ginseng
clases establecidas, de modo que, en la clasificación fueron utilizadas las matrices de
covarianza por separado; es decir, las fronteras no fueron líneas rectas.
Se obtuvieron dos funciones discriminantes canonícas (CF) y la matriz de
estructura sugirió la mayor correlación absoluta entre la variable PC1 y CF1; mientras
que el resto de las variables hicieron lo mismo con CF2, siendo la variable PC4 la más
importante. Como era de esperar, CF1 fue la principal función para la clasificación, su
correlación canónica fue de 0.998 con una varianza explicada del 93.7%. El porcentaje
de muestras correctamente clasificadas en el conjunto de calibración fue del 100%. Las
muestras del conjunto de predicción fueron proyectadas sobre el modelo de PCA y
posteriormente el modelo DA fue aplicado en los valores de score obtenidos. Los
resultados obtenidos se muestran en la Tabla 4.3. Todas las muestras auténticas de P.
ginseng fueron correctamente asignadas a su clase y la mayoría de las otras especies
fueron debidamente excluidas de la clase PG; sin embargo, varias muestras de L.
meyenii fueron asignadas erróneamente, lo que disminuyó el valor de la especificidad.
Las mezclas con 5% y 10% de adulterante fueron mal clasificadas, excluyendo la mezcla
2, la cual probablemente pudo ser fácilmente discriminada por el modelo debido a que
los espectros de E. senticosus son los más distintos a los de P. ginseng, como se
observa en los scores del PCA global. El método DA obtuvo el valor más bajo de GSR de
todos los modelos matemáticos ensayados, como resultado de la limitación en la
detección de las mezclas, fueron confundidos casi la mitad de los espectros de las
mezclas, y también por el porcentaje de especificidad obtenido.
4.3.6. Análisis semicuantitativo de mezclas.
El éxito en la aplicación del MCR‐ALS requiere que los espectros de los
componentes puros tengan baja correlación. Se seleccionó el E. senticosus para
preparar las mezclas ya que fue la especie que presentó una mayor diferencia en su
espectro con el P. ginseng, tal como fue mencionado en las secciones 4.3.2 y 4.3.5,
para poner a prueba el procedimiento de semicuantificación propuesto.
78
Panax ginseng
Como únicamente hay dos componentes en las mezclas, se utilizó un espectro
promedio de P. ginseng puro y otro espectro promedio de E. senticosus puro como
estimaciones iniciales para la resolución. En la primera etapa, se trabajó con un
conjunto de espectros de mezclas simuladas, obtenidos por ordenador a partir de los
espectros de los componentes, variando la composición de 5 a 5%, y se llegó a la
conclusión de que las limitaciones (constraints) útiles y con sentido químico fueron "no
negatividad", aplicada a los perfiles de las contribuciones (concentraciones), lo que
implica que los componentes fueron siempre positivos, y "closure", se supone que el
perfil de contribución de cada mezcla puede cumplir con un balance de masa
constante igual a la unidad, representando el 100% de los componentes de la misma.
Utilizando estas restricciones, se obtuvo la contribución de P. ginseng en cada
mezcla simulada y la diferencia entre los valores reales y los calculados por el modelo.
El promedio de los valores absolutos de estas diferencias fue de 3.64%, sugiriendo que
al añadir E. senticosus a una muestra de P. ginseng, el algoritmo no es capaz de
distinguir cambios en la concentración nominal de P. ginseng en la muestra de ± ese
valor. Por consiguiente, las mezclas preparadas en el laboratorio fueron elaboradas
presentando variaciones en la composición de P. ginseng de 10 en 10%.
Posteriormente, se concatenaron la matriz de las mezclas simuladas y la de las
mezclas preparadas en el laboratorio, junto con varios espectros de P. ginseng puro, y
se aplicó el algoritmo MCR‐ALS con las restricciones enunciadas anteriormente. La
convergencia fue alcanzada con 5 iteraciones y el modelo explicó el 99.9% de la
varianza, presentando una diferencia entre los datos iniciales y los reproducidos por
MCR‐ALS (fitting error) de 0.932.
Las Figuras 4.2a y 4.2b muestran los espectros originales y los obtenidos
después de la resolución de la mezcla, respectivamente. Se puede observar que los
perfiles espectrales resultantes del MCR‐ALS son buenas aproximaciones de los
espectros originales; sin embargo, está presente una ambigüedad en la intensidad. La
ambigüedad probablemente se debe a que los espectros originales no pudieron
someterse a restricciones.
79
Panax ginseng
(a) (b)
Figura 4.2. (a) Estimaciones iniciales empleadas para iniciar el algoritmo MCR‐ALS y (b) perfiles
obtenidos después de la resolución de las mezclas. Las líneas continuas representan al P.
ginseng y las líneas discontinuas al E. senticosus.
Se calculó el porcentaje de error únicamente a partir de los perfiles de
contribución (concentración) obtenidos de los replicados de las mezclas preparadas en
el laboratorio. Los valores obtenidos se encontraban en un intervalo de 0.36 a 8.60% y
el valor medio fue de 5.53%; lo que indica que los resultados de la contribución
deberían ser expresados utilizando un intervalo de 10% (por ejemplo, si 84.92% es la
contribución de P. ginseng obtenida en una mezcla por el algoritmo, sólo se puede
decir que el resultado se encuentra entre 80 y 90%).
De acuerdo con los resultados observados para el P. ginseng puro, se puede
considerar que una muestra no está mezclada con otra especie de planta si la
resolución proporciona un valor de contribución igual o superior al 95%. Así, todos los
resultados sugieren que el MCR‐ALS es capaz de proporcionar una estimación rápida
de los componentes en las mezclas de P. ginseng y E. senticous.
4.4. Conclusiones del capítulo.
La construcción de huellas dactilares NIR desarrollado en esta Tesis, representa
una buena y rápida alternativa a los análisis tradicionales por CLAR para la
diferenciación de P. ginseng de las otras ocho especies de plantas estudiadas.
80
Panax ginseng
Los tres métodos de clasificación aplicados, SIMCA, DA y PLS‐DA, permitieron
obtener una buena discriminación de P. ginseng, al conseguir igual valor de
sensibilidad (100%). Sin embargo, las pruebas en mezclas preparadas en el laboratorio
mostraron que SIMCA tiene una mejor capacidad para detectar las muestras
adulteradas (MCC = 80%). Además, su especificidad (100%) fue mejor que la de los
otros métodos de clasificación; todas estas características hicieron que SIMCA
consiguiera el mejor rendimiento, como indicó el valor de GSR (95%).
La espectroscopia NIR con MCR‐ALS podría ser utilizada para realizar una
determinación rápida y semicuantitativa de la composición de una mezcla, pero
teniendo en cuenta que se han de aplicar las restricciones apropiadas y que las plantas
“puras” deberán presentar espectros suficientemente diferentes para que puedan ser
resueltos por el algoritmo. El porcentaje de error promedio fue de 5.53% y mostró que
la composición de mezcla debe cambiar en cantidades de aproximadamente un 10%
con el fin de obtener buenos resultados. Las ventajas de este método incluyen el no
requerimiento de un conjunto de calibración o un método de referencia para
determinar los componentes de la mezcla. Una estrategia de trabajo podría ser utilizar
SIMCA para clasificar una muestra y, si es etiquetada como una mezcla, estimar su
composición utilizando MCR‐ALS. En el presente estudio, esta estrategia funcionó para
mezclas de P. ginseng and E. senticosus.
81
Panax ginseng
Referencias.
(1) Bonfill, M.; Casals, I.; Palazón, J.; Mallol, A.; Morales, C. Improved high performance liquid
chromatographic determination of ginsenosides in Panax ginseng‐based pharmaceuticals
using a diol column. Biomedical Chromatography 2002, 16, 68‐72.
(2) Kim, S. N.; Ha, Y. W.; Shin, H.; Son, S. H.; Wu, S. J.; Kim, Y. S. Simultaneous quantification of
14 ginsenosides in Panax ginseng C.A. Meyer (Korean red ginseng) by HPLC‐ELSD and its
application to quality control. J. Pharm. Biomed. Anal. 2007, 45, 164‐170.
(3) Woo, Y.; Kim, H.; Cho, J. Identification of Herbal Medicines Using Pattern Recognition
Techniques with Near‐Infrared Reflectance Spectra. Microchemical Journal 1999, 63, 61‐
70.
(4) Chen, P.; Luthriau, D.; Harringtonohio, P. d. B.; Harnly, J. M. Discrimination Among Panax
Species Using Spectral Fingerprinting. Journal of AOAC International 2011, 94, 1411‐1421.
(5) Yap, K. Y.; Chan, S. Y.; Lim, C. S. The reliability of traditional authentication – A case of
ginseng misfit. Food Chem. 2008, 107, 570‐575.
(6) Zhang, Y.; Chen, J.; Lei, Y.; Zhou, Q.; Sun, S.; Noda, I. Evaluation of different grades of
ginseng using Fourier‐transform infrared and two‐dimensional infrared correlation
spectroscopy. J. Mol. Struct. 2010, 974, 94‐102.
(7) Ren, G.; Chen, F. Simultaneous Quantification of Ginsenosides in American Ginseng (Panax
quinquefolium) Root Powder by Visible/Near‐Infrared Reflectance Spectroscopy. J. Agric.
Food Chem. 1999, 47, 2771‐2775.
(8) Lucio‐Gutiérrez, J. R.; Coello, J.; Maspoch, S. Application of near infrared spectral
fingerprinting and pattern recognition techniques for fast identification of Eleutherococcus
senticosus. Food Res. Int. 2011, 44, 557‐565.
(9) Blackwell, R. Adverse events involving certain Chinese herbal medicines and the response
of the profession. Journal of Chinese medicine 1996, 12.
(10) Ren, G.; Chen, F. Determination of moisture content of ginseng by near infra‐red
reflectance spectroscopy. Food Chem. 1997, 60, 433‐436.
(11) Woo, Y.; Cho, C.; Kim, H.; Yang, J.; Seong, K. Classification of cultivation area of ginseng by
near infrared spectroscopy and ICP‐AES. Microchemical Journal 2002, 73, 299‐306.
(12) Yap, K. Y.; Chan, S. Y.; Lim, C. S. Infrared‐based protocol for the identification and
categorization of ginseng and its products. Food Res. Int. 2007, 40, 643‐652.
(13) Rinnan, Å.; Nørgaard, L.; Berg, F. v. d.; Thygesen, J.; Bro, R.; Engelsen, S. B. In Chapter 2 ‐
Data Pre‐processing; Infrared Spectroscopy for Food Quality Analysis and Control;
Academic Press: San Diego, 2009; pp 29‐50.
(14) Jaumot, J.; Gargallo, R.; de Juan, A.; Tauler, R. A graphical user‐friendly interface for MCR‐
ALS: a new tool for multivariate curve resolution in MATLAB. Chemometrics Intellig. Lab.
Syst. 2005, 76, 101‐110.
(15) Brereton, R. G. Applied Chemometrics for Scientist, John Wiley & Sons, Ltd, Great Britain,
2007.
(16) Laasonen, M.; Harmia‐Pulkkinen, T.; Simard, C. L.; Michiels, E.; Rasanen, M.; Vuorela, H.
Fast identification of Echinacea purpurea dried roots using near‐infrared spectroscopy.
Anal. Chem. 2002, 74, 2493‐2499.
83
5
Valeriana officinalis.
Valeriana officinalis
5.1. Introducción.
87
Valeriana officinalis
5.1.3. Antecedentes.
88
Valeriana officinalis
89
Valeriana officinalis
90
Valeriana officinalis
BG, CA,
DE, ES,
VOF RHR 5 29 15 5 87 45 42
HR, MX,
PT, US
PI ES RHL 0 1 0 0 1 0 1
a
Identidad: VOF, V. officinalis; VIN, V. wallichii; VMX, V. edulis y PI, P. incarnata.
b
BG, Bulgaria; CA, Canadá; HR, Croacia; DE, Alemania; IN, India; MX, México; PT, Portugal; ES, España y
US, Estados Unidos.
c
Tipo de producto, RHR, raíces sin procesar; RHL, hojas sin procesar.
d
Proveedores de calidad; número de proveedores con una certificación de calidad.
e
Diferentes lotes de plantas adquiridos de varios proveedores y herboristerías en tres años .
f
Número de muestras en el conjunto de calibración (NC) o en el conjunto de prueba (NP)procedentes de
proveedores con una certificación de calidad.
g
Número de huellas dactilares aumentadas.
h
Número de huellas dactilares (a una única longitud de onda o con múltiples longitudes de onda)
empleadas en el conjunto de calibración (CS) o en el conjunto de predicción (PS)para la construcción y
evaluación de los modelos matemáticos.
i
---, No aplica.
5.2.2. Reactivos.
91
Valeriana officinalis
Para cada muestra se pesó con precisión 1.00 g del polvo y se añadieron 100 µL
de bifenilo disuelto en metanol (2 mg ml-1). Después de un mezclado manual y un
período de reposo de 10 minutos, se adicionaron 3 mL de una solución de metanol -
agua (9:1) a cada muestra. Se colocaron en un baño de ultrasonidos 15 minutos para
posteriormente centrifugarlas durante 10 min a 3500 rpm. El sobrenadante fue
transferido a un matraz aforado de 10 mL. El procedimiento se repitió dos veces más, y
los respectivos sobrenadantes fueron combinados. El volumen final se enrasó a 10 mL
con la solución de metanol – agua (9:1). Antes de ser inyectadas en el cromatógrafo,
todas las soluciones obtenidas fueron filtradas utilizando un filtro de membrana de
nylon con tamaño de poro de 0.45 µm. Los extractos fueron sometidos a análisis por
CLAR en las 12 horas siguientes de su preparación para mantener la estabilidad y la
integridad de su contenido. Se preparó un replicado de cada muestra durante tres días
no consecutivos (aunque las mezclas preparadas en el laboratorio fueron únicas),
utilizando cada día una porción de muestra procesada de forma independiente.
Los análisis por CLAR se realizaron con un sistema HPLC-DAD de Agilent serie
1100, equipado con un desgasificador de vacío G1379A, una bomba binaria G1312A,
un muestreador automático con un inyector ajustable de 100 µL de loop G1313A, un
92
Valeriana officinalis
93
Valeriana officinalis
Se llevó a cabo un PCA para decidir cuál era el método de alineación que
proporcionaba mejores resultados (muestras más agrupadas). Se utilizó el gráfico de
scores para observar las pautas de las muestras, las agrupaciones, las similitudes,
diferencias y muestras anómalas.
94
Valeriana officinalis
95
Valeriana officinalis
S1
λ1 .. . λm
TR1 TR1* .. . . TRn*
λ1 TR Interval TR Interval
(S1)T Corrección X
Extracto 1
.. . . . . λa λa Unfolding
(λa, λb, λc) de Datos
.. .
λb λb
λa λb λc
Binning* (TRi* : TRj*) λc λc S1
λm S2
Sn
TRn
N
S2 Unfolding
COW Simplex
λ1 .. . λm
TR1 TR1* .. . . TRn* t
λ1 TR Interval TR Interval
(S2)T Corrección X alineada
Extracto 2
λa λa
.. . . . .
Sn Unfolding
λ1 .. . λm Construcción de Modelos
TR1 TR1* .. . . TRn*
λ1 TR Interval TR Interval
(Sn)T Corrección
Extracto n
λa λa
.. . . . .
TRn
SIMCA
Figura 5.1. Esquema de la construcción de las huellas dactilares aumentadas. S1, S2, ..., Sn;
representan los datos cromatográficos originales en dos dimensiones (tiempo de retención
[TR] x longitudes de onda) de los diferentes extractos de plantas. X es la nueva matriz de datos
construida con huellas dactilares aumentadas. COW, N y t son el acrónimo y los símbolos para
correlation optimized warping, longitud de segmento y el parámetro slack, respectivamente. X
alineada, es la matriz de datos final que se utiliza en la construcción de los modelos matemáticos.
Las variaciones en la línea base fueron minimizadas por medio del método de
mínimos cuadrados asimétricos ponderados (WLS) utilizando un polinomio de tercer
grado; se pueden encontrar más detalles sobre el método en la sección 1.6.1.5 y en
[18]. La variabilidad en la escala entre las muestras fue minimizada normalizando cada
vector de datos; es decir, en la matriz con la línea base corregida fue normalizado cada
cromatograma, empleando la suma del cuadrado de los valores de todas las variables
para un dado vector de datos, obteniendo una matriz con vectores de longitud unidad.
La matriz corregida fue desdoblada de tal manera que los vectores de datos
para cada longitud de onda fueron colocados uno tras otro para construir un único
vector de datos con dimensiones de 1 x 4080; que es la huella dactilar aumentada.
Finalmente, las huellas dactilares aumentadas de todas las muestras se ordenaron en
96
Valeriana officinalis
Los valores de la longitud del segmento (N) y el grado de flexibilidad (t) fueron
determinados por medio de un diseño simplex, realizado dentro de un espacio de
optimización definido: longitud del segmento de 25 a 250; flexibilidad de 2 a 20. Estos
valores fueron elegidos de acuerdo con las anchuras de los picos y los desplazamientos
observados en los cromatogramas. El número de puntos de inicio en la red de
búsqueda se ajustó a 3, el número máximo de pasos de optimización a 25 y la fracción
de la máxima desviación del centro en la alineación COW al 15%.
97
Valeriana officinalis
98
Valeriana officinalis
99
Valeriana officinalis
(a) (d)
*
*
Minutos Minutos
(b) (e)
*
*
Minutos Minutos
(c) (f)
* *
Minutos Minutos
(g)
Minutos
100
Valeriana officinalis
101
Valeriana officinalis
(A) (B)
226 nm 226 nm
Minutos Minutos
254 nm 254 nm
Minutos Minutos
280 nm 280 nm
Minutos Minutos
326 nm 326 nm
Minutos Minutos
Figura 5.3. Cromatogramas de una muestra de V. officinalis a las longitudes de onda utilizadas
en la construcción de las huellas dactilares aumentadas. (A) Antes de los pretratamientos y (B)
después de la combinación de datos, corrección de línea base y normalización; N.I. se refiere a
valores normalizados de intensidad.
102
Valeriana officinalis
(a) (d)
(b) (e)
(c) (f)
(g) (h)
Figura 5.4. Comparación de las huellas dactilares aumentadas de (a) V. officinalis, VOF; (b) V.
edulis, VMX; (c) V. wallichii, VIN; (d) mezcla VOF - VIN; (e) mezcla VOF - VMX; (f) mezcla VOF -
P. incarnata, mezclas preparadas en proporción 9:1; (g) sección de las huellas dactilares
aumentadas de tres muestras de VOF antes de aplicar correlation optimized warping y (h) las
mismas muestras después de la alineación. N. I., valores normalizados de intensidad.
103
Valeriana officinalis
104
Valeriana officinalis
Alineación de los
12 92.16 0.63
triplicados de muestra
a
Para la construcción del modelo PCA se realizó el centrado de los datos y la validación
cruzada, empleando 30 divisiones aleatorias para los subconjuntos y 5 iteraciones; se
incluyeron las 142 huellas dactilares aumentadas.
b
Número de componentes principales usadas en el modelo PCA, seleccionadas con el
criterio del mínimo PRESS.
c
Varianza explicada acumulada.
d
Raíz del error cuadrático medio de la validación cruzada.
105
Valeriana officinalis
Scores on PC 3 (14.16%)
0.5
-0.5
-1
1
0.5 0.5
0 0
-0.5 -0.5
-1 -1
Scores on PC 2 (17.14%) Scores on PC 1 (28.02%)
p
1.5
b
1
Scores on PC 2 (17.14%)
0.5
-0.5
-1
-1.5 -1 -0.5 0 0.5 1
Scorespon PC 1 (28.02%)
c 1
0.5
Scores on PC 3 (14.16%)
-0.5
-1
-1.5
-1.5 -1 -0.5 0 0.5 1
Scores on PC 1 (28.02%)
Figura 5.5. ( ) V. officinalis; (+) Otras plantas. (a) Gráfico 3D de los scores del PCA global de las
huellas dactilares aumentadas después de la alineación. (b) Gráfico 2D de los scores en PC1 vs.
PC2 y (c) PC1 vs. PC3. Aquí, "otras plantas" se refiere a V. wallichii, V. edulis, P. incarnata y las
mezclas. Los triplicados sospechosos de muestras de V. officinalis han sido señalados con un
círculo.
106
Valeriana officinalis
Con el fin de comprobar las ventajas de utilizar varias longitudes de onda, los
resultados obtenidos por el procedimiento propuesto fueron comparados con los
obtenidos por la aplicación del mismo tratamiento de datos pero a cromatogramas
registrados a una sola longitud de onda (226 nm). En la Tabla 5.3 se muestra el
comportamiento de cada método de clasificación en los dos casos.
107
Valeriana officinalis
SIMCA 97
Huellas dactilares aumentadas
VOF 36 34 2 94
OHs e 31 0 31 100
Mezclas 9 0 9 100
PLS-DA 100
VOF 36 36 0 100
OHs e 31 0 31 100
Mezclas 9 0 9 100
Longitud de onda única (226 nm)
SIMCA 90
VOF 36 36 0 100
OHs e 31 0 31 100
Mezclas 9 8 1 11
PLS-DA 97
VOF 36 36 0 100
OHs e 31 0 31 100
Mezclas 9 2 7 78
a
Número de huellas dactilares aumentadas o número de huellas dactilares convencionales empleadas
en la predicción.
b
VOF, V. officinalis; AHG, otro grupo de plantas.
c
Porcentaje de mezclas correctamente clasificadas como ajenas a la clase VOF.
d
Tasa general de éxito en la clasificación.
e
Otras plantas, aquí se incluye V. wallichii, V. edulis, P. incarnata y las dos muestras sospechosas
descritas en la sección 5.3.3.
108
Valeriana officinalis
109
Valeriana officinalis
Referencias.
(1) Circosta, C.; De Pasquale, R.; Samperi, S.; Pino, A.; Occhiuto, F. Biological and analytical
characterization of two extracts from Valeriana officinalis. J. Ethnopharmacol. 2007, 112,
361-367.
(2) Navarrete, A.; Avula, B.; Choi, Y. W.; Khan, I. A. Chemical fingerprinting of valeriana species:
simultaneous determination of valerenic acids, flavonoids, and phenylpropanoids using
liquid chromatography with ultraviolet detection. J. AOAC Int. 2006, 89, 8-15.
(3) Bos, R.; Woerdenbag, H. J.; Pras, N. Determination of valepotriates. Journal of
Chromatography A 2002, 967, 131-146.
(4) Joshi, V. C.; Navarrete, A.; Khan, I. A. Authentication of Valeriana procera Kunth and
comparative account of five Valeriana species. J. AOAC Int. 2005, 88, 1621-1625.
(5) Hattesohl, M.; Feistel, B.; Sievers, H.; Lehnfeld, R.; Hegger, M.; Winterhoff, H. Extracts of
Valeriana officinalis L. s.l. show anxiolytic and antidepressant effects but neither sedative
nor myorelaxant properties. Phytomedicine 2008, 15, 2-15.
(6) Dejaegher, B.; Alaerts, G.; Matthijs, N. Methodology to develop liquid chromatographic
fingerprints for the quality control of herbal medicines. Acta Chromatographica 2010, 22,
237-258.
(7) Jiang, Y.; David, B.; Tu, P.; Barbin, Y. Recent analytical approaches in quality control of
traditional Chinese medicines—A review. Anal. Chim. Acta 2010, 657, 9-18.
(8) Liang, Y.; Xie, P.; Chan, K. Quality control of herbal medicines. Journal of Chromatography B
2004, 812, 53-70.
(9) Yan, S.; Xin, W.; Luo, G.; Wang, Y.; Cheng, Y. An approach to develop two-dimensional
fingerprint for the quality control of Qingkailing injection by high-performance liquid
chromatography with diode array detection. Journal of Chromatography A 2005, 1090,
90-97.
(10) Fan, X.; Cheng, Y.; Ye, Z.; Lin, R.; Qian, Z. Multiple chromatographic fingerprinting and its
application to the quality control of herbal medicines. Anal. Chim. Acta 2006, 555, 217-
224.
(11) Ni, Y.; Lai, Y.; Brandes, S.; Kokot, S. Multi-wavelength HPLC fingerprints from complex
substances: An exploratory chemometrics study of the Cassia seed example. Anal. Chim.
Acta 2009, 647, 149-158.
(12) Li, B.; Hu, Y.; Liang, Y.; Xie, P.; Du, Y. Quality evaluation of fingerprints of herbal medicine
with chromatographic data. Anal. Chim. Acta 2004, 514, 69-77.
(13) Hendriks, M. M. W. B.; Cruz-Juarez, L.; Bont, D. D.; Hall, R. D. Preprocessing and
exploratory analysis of chromatographic profiles of plant extracts. Anal. Chim. Acta 2005,
545, 53-64.
(14) Skov, T.; van den Berg, F.; Tomasi, G.; Bro, R. Automated alignment of chromatographic
data. Journal of Chemometrics 2006, 20, 484-497.
(15) Tomasi, G.; van den Berg, F.; Andersson, C. Correlation optimized warping and dynamic
time warping as preprocessing methods for chromatographic data. Journal of
Chemometrics 2004, 18, 231-241.
(16) Brereton, R. G. Applied Chemometrics for Scientist, John Wiley & Sons, Ltd, Great Britain,
2007.
111
Valeriana officinalis
(17) Lau, C.; Chan, C.; Chau, F.; Mok, D. K. Rapid analysis of Radix puerariae by near-infrared
spectroscopy. Journal of Chromatography A 2009, 1216, 2130-2135.
(18) Daszykowski, M.; Walczak, B. Use and abuse of chemometrics in chromatography. TrAC
Trends in Analytical Chemistry 2006, 25, 1081-1096.
(19) Bos, R.; Woerdenbag, H. J.; Hendriks, H.; Zwaving, J. H.; De Smet, P. A. G. M.; Tittel, G.;
Wikström, H. V.; Scheffer, J. J. C. Analytical Aspects of Phytotherapeutic Valerian
Preparations. Phytochemical Analysis 1996, 7- 143-151.
(20) Gao, X. Q.; Björk, L. Valerenic acid derivatives and valepotriates among individuals,
varieties and species of Valeriana. Fitoterapia 2000, 71, 19-24.
112
6
Turnera diffusa.
Turnera diffusa
6.1. Introducción.
Esta planta fue seleccionada porque las organizaciones (EMA, FDA, etc.) todavía
tienen que recomendar una metodología analítica definitiva para su control de calidad
y porque se ha demostrado que muchos de los productos que dicen contener T.
difussa en el mercado mexicano contienen en realidad otras especies, de acuerdo a los
trabajos realizados a partir de huellas dactilares obtenidas por TLC y CLAR-DAD [1,7,8].
115
Turnera diffusa
6.1.3. Antecedentes.
116
Turnera diffusa
Con el fin de incluir en las muestras tantas fuentes de variabilidad como sea
posible, independientemente del origen geográfico específico, se recolectaron
cuarenta muestras de Turnera diffusa en diferentes regiones de México entre
diciembre de 2005 y enero de 2009; las muestras fueron autenticadas y fue obtenido
un comprobante de los especímenes depositados en el herbario de la Facultad de
Ciencias Biológicas, Universidad Autónoma de Nuevo León (México). Las muestras de
damiana se almacenaron protegidas de la luz intensa y de la humedad a temperatura
de laboratorio (27 °C aprox.) y se dejaron secar.
6.2.2. Reactivos.
El metanol grado HPLC (MeOH) fue adquirido a Fisher Scientific (Fair Lawn, NJ,
EE.UU.). El agua desionizada se obtuvo de Laboratorios de Monterrey S.A. de C.V.
117
Turnera diffusa
Las partes aéreas de las plantas secas (hojas y tallos) fueron trituradas y luego
pasadas a través de un tamiz de 40 mesh. Cada muestra en polvo (1.00 g) se pesó con
precisión y se extrajo tres veces con 5 mL de una solución de etanol-agua 9:1 (v / v) en
cada vez, a 27 ° C, mediante un mezclado en vórtice durante 3 min y las respectivas
soluciones fueron combinadas. El extracto final se filtró a través de un filtro de papel
Whatman No. 40 y se evaporó hasta sequedad a presión reducida empleando un
evaporador rotatorio a 37 ± 2 °C. Antes del uso, se disolvieron 15 mg del extracto de la
muestra, en 1 mL de MeOH y se filtró a través de un acrodisco de nylon de 0.45 μm
(Waters Corporation).
Los análisis por CLAR se realizaron con un sistema Waters Alliance 2695,
equipado con un detector UV-Vis de diodos en línea 2996, un inyector automático, un
compartimiento de columna con temperatura controlada, un desgasificador de vacío y
un ordenador equipado con el programa de control y tratamiento de datos Empower.
La actividad de captación de radicales libres de los extractos de damiana se obtuvo
usando un espectrofotómetro UV-Vis Beckman DU-7500.
La separación se consiguió utilizando una columna C18 AccQ Tag de 3.9 x 150
mm con 4 µm de tamaño de partícula (Waters Corporation) utilizada a 30 °C. La fase
móvil consistió en (A) TFA al 0.1% en agua y (B) MeOH. Antes del uso, los componentes
118
Turnera diffusa
A− B
Actividad captadora del radical=
(%) ×100 (6.1)
A
119
Turnera diffusa
expresando la actividad como EC50. Las actividades antioxidantes de las muestras y los
respectivos cromatogramas fueron obtenidos simultáneamente, para evitar posibles
variaciones en los resultados de la prueba del DPPH, debido al tiempo de
almacenamiento de los extractos.
Absorbancia
517 nm
Figura 6.1. El radical estable DPPH (color violeta) capta un átomo de hidrógeno del
antioxidante, formando DPPH-H (color amarillo).
Se utilizaron los datos de un estudio realizado por Garza-Juárez et al. [11]. Los
datos CLAR-DAD de cuarenta muestras de damiana fueron exportados del programa
Empower en formato ASCII e importados a MATLAB 7.9 (The MathWorks, Inc.); que fue
utilizado para el manejo de las matrices cromatográficas y para realizar el escalado.
Utilizando el programa PLS-Toolbox 6.2 (Eigenvector Research), se realizó la
combinación de datos adyacentes, la corrección de la línea base, el desdoblamiento de
la matriz de datos y la construcción de los modelos matemáticos.
120
Turnera diffusa
121
Turnera diffusa
122
Turnera diffusa
123
Turnera diffusa
Figura 6.3. Cromatogramas de una muestra de T. diffusa a las longitudes de onda empleadas
en la construcción de la huella dactilar aumentada.; (a) antes del pretratamiento de datos y (b)
después de la combinación de datos, la corrección de línea base y el escalado. A.U.
corresponde a unidades de absorbancia y Arb. units indica unidades arbitrarias. (c) Aspecto
típico de una huella dactilar aumentada de T. diffusa.
124
Turnera diffusa
La Fig. 6.3a muestra las variaciones presentadas por los cromatogramas de una
muestra de T. diffusa a las longitudes de onda seleccionadas para construir las huellas
dactilares aumentadas. La más evidente de estas variaciones fue el cambio en la
pendiente de la línea base; que también fue evidente en el cromatograma 3D de la Fig.
6.2b. Aparece una ligera pendiente a valores negativos a 238, 254 y 345 nm y una
mayor tendencia a valores negativos a 216 nm. En tales condiciones, no era viable
desdoblar la matriz cromatográfica para construir el vector de la huella dactilar
aumentada, de modo que, los datos tuvieron que ser corregidos. Se eliminó la señal de
fondo por medio de WLS utilizando un polinomio de tercer grado. Los principios del
método WLS han sido expuestos en la sección 1.6.1.5 y su aplicación descrita en el
Capítulo 5; se pueden hallar más detalles sobre el método en [16]. La variabilidad en la
escala entre las muestras de damiana se minimizó aplicando para cada variable un
rango de escala de tal manera que, en los vectores con la línea base corregida, el valor
más alto fuera +1 y el más bajo 0. La Fig. 6.3b muestra los resultados de la aplicación
de los pretratamientos a los vectores que forman la matriz cromatográfica. La
combinación de los datos mantiene la información cromatográfica, es decir, no afecta
a las características del cromatograma, y reduce el número de datos de la matriz en la
dimensión del tiempo de retención. La corrección de la línea base eliminó con éxito las
tendencias mostradas por la señal de fondo de los cromatogramas, mientras que al
llevar a la unidad la escala de las huellas dactilares aumentadas permitió mantener las
proporciones de intensidad entre las cuatro longitudes de onda utilizadas para
construir la huella dactilar aumentada, evitando así discontinuidades en los valores de
absorbancia cuando las cuatro longitudes de onda fueron desplegadas.
125
Turnera diffusa
6.3.2.3. Alineación.
El gráfico de scores del PCA realizado antes de la alineación (Fig. 6.4c) muestra
dos grupos principales de muestras separadas por la PC1; el grupo en valores negativos
de score en PC1 está también dividió en dos subgrupos. El análisis de los loadings de
este modelo sugirió que el gráfico de scores observado se debe principalmente a los
cambios del tiempo de retención, ya que un gráfico de los loadings presentó un
aspecto distorsionado y exhibió formas similares a las obtenidas cuando se calcula una
derivada; Fig. 6.4e.
126
Turnera diffusa
Figura 6.4. (a) Sección de varias huellas dactilares aumentadas antes de COW y (b) las mismas
muestras después de la alineación. (c) y (d) Gráficos de score de PC1 vs. PC2 de un PCA global
antes y después de la alineación, respectivamente. (e) y (f) Gráficos de loadings, antes y
después de efectuar COW. (g) Representación de los valores de score de PC1 vs. la actividad
antioxidante (EC50) para cada muestra antes de la alineación y (h) después de efectuarla.
127
Turnera diffusa
Con el fin de averiguar si existe algún tipo de relación entre las componentes
principales y la actividad antioxidante, se representaron gráficamente los scores de
cada componente principal calculado por el PCA frente a la actividad antioxidante. La
proyección de las muestras en el eje PC1 está relacionada con los valores de EC50; al
representar los scores de la PC1 vs. la actividad antioxidante, después de la alineación,
fue evidente una relación lineal, véase la Fig. 6.4h. Sin embargo, el mismo gráfico antes
de la alineación no muestra ninguna relación aparente; Fig. 6.4g. No hubo ninguna
relación evidente entre los otros componentes principales y los valores de EC50.
128
Turnera diffusa
La Figura 6.5 muestra el gráfico de los valores de EC50 medidos frente a los
valores de EC50 calculados, incluyendo los conjuntos de calibración y de predicción, con
una pendiente de 0.972 (s = 0.022) y una ordenada en el origen de 0.88 (s = 0.94),
indicando que los valores calculados son coincidentes con los medidos.
90
80
70
60
EC50 Predicted
50
40
30
20
10
10 20 30 40 50 60 70 80 90
EC50 Measured
Figura 6.5. ( ) Calibración; ( ) Valor calculado. Representación de los valores de referencia vs.
los valores calculados de la actividad antioxidante (EC50) de cada muestra; se presenta la línea
de regresión.
∑( y − y )
2
calc exp
=% RSEP ×100 (6.2)
∑y 2
exp
donde ycalc es el valor de EC50 calculado por PLSR, yexp el valor de actividad encontrado
con el ensayo del DPPH; la suma se extiende a todas las muestras de predicción [18]. El
valor de RSEP obtenido utilizando las huellas dactilares aumentadas fue 7.8%, mientras
que el valor calculado a partir de los datos publicados en la referencia [11], utilizando
cromatogramas a 254 nm, fue 20.5%.
129
Turnera diffusa
130
Turnera diffusa
Figura 6.6. (a) Gráfico de los loadings en LV1 de las variables cromatograficas utilizadas. (b)
importancia de las variables en la proyección (VIP) para EC50; se consideraron importantes
para el modelo las variables con un valor superior a 5. (c) En los cromatogramas que integran
una huella dactilar aumentada de una muestra de T. diffusa, se señalan con un asterisco los
picos relevantes para la predicción del valor de EC50.
131
Turnera diffusa
132
Turnera diffusa
Referencias.
133
Turnera diffusa
(14) Tomasi, G.; van den Berg, F.; Andersson, C. Correlation optimized warping and dynamic
time warping as preprocessing methods for chromatographic data. Journal of
Chemometrics 2004, 18, 231-241.
(15) Mia, H. In Robust Calibration; Practical Guide To Chemometrics, Second Edition; CRC
Press: 2006; pp 167-216.
(16) Daszykowski, M.; Walczak, B. Use and abuse of chemometrics in chromatography. TrAC
Trends in Analytical Chemistry 2006, 25, 1081-1096.
(17) Eigenvector Documentation, Using Cross-Validation,
http://wiki.eigenvector.com/index.php?title=Using_Cross-Validation, con acceso en Junio
de 2012.
(18) Otto, M.; Wegscheider, W. Spectrophotometric multicomponent analysis applied to trace
metal determinations. Anal. Chem. 1985, 57, 63-69.
134
7
Conclusiones Generales.
Conclusiones Generales
Se han desarrollado y validado métodos para el control de calidad de cuatro
plantas medicinales con amplio uso comercial, para las cuales existen informes de
confusiones, adulteraciones o presentación de reacciones adversas en los
consumidores.
Además de los criterios empleados tradicionalmente para comparar los
resultados de los modelos de clasificación, los cuales se limitan a indicar el número de
muestras clasificadas de forma correcta o incorrecta, se han utilizado otros que
permiten obtener mayor información cuando se analizan los resultados. Se han
establecido criterios de medición claros para la comparación de la efectividad de los
diferentes modelos de clasificación construidos. En particular, la tasa general de éxito
en la clasificación, al ser un parámetro que evalúa la efectividad global de los modelos,
es un criterio sumamente útil.
Se han ensayado los modelos de clasificación propuestos con mezclas formadas
por el producto de interés y diferentes proporciones y tipos de adulterantes,
consiguiendo obtener información sobre la capacidad de detección de adulteraciones
de los distintos métodos utilizados y la proporción mínima de adulterante
discriminada. Esto representa un avance frente a la forma convencional de emplear los
métodos de clasificación, donde regularmente se acota el estudio a la diferenciación
entre especies.
La espectroscopia NIR ha demostrado ser una técnica útil para realizar la
identificación de las plantas medicinales. En el desarrollo de un método de clasificación
con esta espectroscopia se deben incluir muestras que sean representativas del
material herbal a analizar y que aporten variabilidad a los modelos matemáticos, de
esta manera se pueden obtener buenas predicciones de las muestras desconocidas.
Para las plantas medicinales analizadas con esta metodología (E. senticosus y P.
ginseng), las bandas espectrales procedentes del agua, no aportan una variabilidad útil
para la construcción de los modelos de clasificación, por lo que esta información debe
ser removida para obtener modelos con un resultado satisfactorio. El porcentaje de
137
Conclusiones Generales
adulterante detectado en el descubrimiento de muestras adulteradas fue dependiente
tanto de la especie de planta presente en la mezcla como del modelo de clasificación
utilizado. Para las dos especies estudiadas con espectroscopia NIR, DA proporciona una
capacidad de detección de adulteraciones menor que empleando SIMCA o PLS‐DA.
La cromatografía de líquidos de alta resolución acoplada a un detector de
diodos es una herramienta muy versátil para el control de calidad de las plantas
medicinales, ya que proporciona más información (cromatogramas y espectros) que la
espectroscopia de infrarrojo cercano (sólo espectros). Aprovechando esta
característica de CLAR, fue posible incrementar la información de las huellas dactilares
combinando cromatogramas registrados a diferentes longitudes de onda. El enfoque
de múltiples longitudes de onda representa un incremento en la información
proporcionada por la variabilidad química de la muestra, debido al incremento en el
número de picos y a la minimización de la variabilidad no informativa de los datos. Por
ello, es una buena alternativa para mejorar los resultados tanto de una clasificación
compleja, como para la predicción de la actividad biológica, tal como fue observado
para los casos de V. officinalis y T. diffusa. Para obtener buenos resultados, ya sea
usando múltiples longitudes de onda como a una única longitud de onda, es
imperativo corregir las variaciones presentadas de un análisis a otro mediante la
aplicación de pretratmientos. En el caso de la alineación mediante COW, la correcta
selección de los parámetros (vector de referencia, longitud de segmento y grado de
flexibilidad) es indispensable para evitar afectar las características de los
cromatogramas, previniendo la introducción de artefactos matemáticos.
La aplicación de quimiometría es fundamental para potenciar las herramientas
de control de calidad de las plantas medicinales. La técnica quimiométrica a usar
depende no sólo del propósito para el cual fue estructurado el algoritmo, también
depende del material herbal sometido a análisis. Este hecho quedo reflejado en la
clasificación del P. ginseng; para esta raíz medicinal, el mejor método para controlar su
calidad fue SIMCA, mientras que para E. senticosus y V. officinalis la técnica más
adecuada fue PLS‐DA. Los diferentes pretratamientos disponibles y la posibilidad de
editar las matrices de datos potencian la calidad y robustez de los resultados
138
Conclusiones Generales
obtenidos, tal como fue observado con la importante mejora en la predicción de la
actividad antioxidante (EC50) de T. diffusa cuando fueron empleados los
pretratamientos adecuados de los datos y múltiples longitudes de onda en la
construcción del vector usado como huella dactilar cromatográfica.
139
8
Perspectivas.
Perspectivas
Este trabajo abre la posibilidad de desarrollar una estrategia para realizar el
control de calidad total de los productos a base de plantas medicinales. El mismo perfil
cromatográfico o espectroscópico empleado para lograr la identificación de la especie
correspondiente, puede ser utilizado en la predicción de sus propiedades terapéuticas.
Sin embargo, para lograr esta aplicación es necesario desarrollar métodos que
permitan medir objetivamente la propiedad de interés; lo cual no siempre resulta
sencillo, en especial en las determinaciones in vivo. En el caso de las propiedades que
puedan ser evaluadas in vitro, debe realizarse un exhaustivo estudio fitoquímico con el
fin de poder relacionar el perfil químico (componentes específicos) con la propiedad
medicinal de interés; este es el caso de T. diffusa. Esta forma múltiple de aplicar las
huellas dactilares, permitiría asegurar la llegada al usuario de un producto que no sólo
es seguro, al recibir la planta correcta, sino también eficaz, ya que su actividad
terapéutica ha sido evaluada. Asimismo, estas estrategias pueden ser aplicadas en la
detección de señales analíticas relacionadas con una acción sinérgica o antagonista de
la actividad biológica en estudio presentada por los múltiples constituyentes de un
extracto; por ejemplo, picos específicos en una huella dactilar cromatográfica.
En esta tesis se utilizaron múltiples longitudes de onda para la construcción de
un vector cromatográfico que fue empleado como huella dactilar aumentada;
obteniendo buenos resultados. No obstante, el uso simultáneo de la información de
los cromatogramas y los espectros contenida en una matriz de datos en tres
dimensiones, es un área de oportunidad para el desarrollo de métodos de control de
calidad de productos fitoterapéuticos a través de métodos quimiométricos
multidimensionales.
La continuación de esta línea de investigación se enfrenta al reto de la
identificación de especies de plantas con perfiles químicos aún más semejantes que los
encontrados en esta Tesis, que probablemente necesiten de técnicas quimiométricas
de clasificación más avanzadas como máquinas de soporte vectorial (SVM, support
vector machine), redes neuronales y otros.
143
Anexo.
Anexos
Los trabajos realizados en esta tesis han dado lugar a los siguientes artículos:
1. Application of near infrared spectral fingerprinting and pattern recognition
techniques for fast identification of Eleutherococcus senticosus.
J. Ricardo Lucio‐Gutiérrez, J. Coello, S. Maspoch.
Departament de Química, Universitat Autònoma de Barcelona, E‐08193
Bellaterra, Barcelona, Spain.
Food Research International 44 (2011) 557–565.
2. Enhanced chromatographic fingerprinting of herb materials by multi‐
wavelength selection and chemometrics.
J. Ricardo Lucio‐Gutiérrez, J. Coello, S. Maspoch.
Departament de Química, Universitat Autònoma de Barcelona, E‐08193
Bellaterra, Barcelona, Spain.
Analytica Chimica Acta 710 (2012) 40– 49.
3. Multi‐wavelength high‐performance liquid chromatographic fingerprints and
chemometrics to predict the antioxidant activity of Turnera diffusa as part of its
quality control.
J. Ricardo Lucio‐Gutiérreza, Aurora Garza‐Juárezb, J. Coelloa, S. Maspocha, M.L.
Salazar‐Cavazosb, Ricardo Salazar‐Arandab, Noemi Waksman de Torresb.
a
Departament de Química, Universitat Autònoma de Barcelona, E‐08193
Bellaterra, Barcelona, Spain.
b
Departamento de Química Analítica, Facultad de Medicina, Universidad
Autónoma de Nuevo León, C.P. 64460, Monterrey, Nuevo León, Mexico.
Journal of Chromatography A, 1235 (2012) 68– 76.
4. Expeditious identification and semi‐quantification of Panax ginseng using near
infrared spectral fingerprints and multivariate analysis.
J. Ricardo Lucio‐Gutiérrez, J. Coello, S. Maspoch.
Departament de Química, Universitat Autònoma de Barcelona, E‐08193
Bellaterra, Barcelona, Spain.
(Enviado).
147