Planejamento de Misturas e Visualizacao

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 8

http://dx.doi.org/10.21577/0100-4042.20170750 Quim. Nova, Vol. 44, No.

7, 874-881, 2021

PLANEJAMENTO DE MISTURAS E VISUALIZAÇÃO DA REGIÃO ÓTIMA COM PLANILHAS NO EXCEL: UM


Nota Técnica

TUTORIAL†

Felipe Ferri Hilárioa, Jeyne Pricylla Castroa, Tomas Edson Barrosb e Edenir Rodrigues Pereira-Filhoa,b,*,
a
Departamento de Química, Universidade Federal de São Carlos, 13565-905 São Carlos – SP, Brasil
b
Departamento de Matemática, Universidade Federal de São Carlos, 13565-905 São Carlos – SP, Brasil

Recebido em 03/02/2021; aceito em 18/03/2021; publicado na web em 14/04/2021

MIXTURE DESIGN AND OPTIMUM REGION VISUALIZATION WITH SPREADSHEETS AT EXCEL: A TUTORIAL. This
tutorial shows how to perform the data treatment for mixture design with two and multiple responses. Two data sets from the literature
were used to exemplify the calculations. A template in Excel was proposed to prepare contour plot and response surface to visualize
the optimum region of the mixture, which usually is made with commercial computational programs. The desirability function was
used in example 2 (optimization of 5 responses simultaneously), and a code also available for download was proposed. Besides, 21
videos were prepared to show all the details for the readers and, it is available on YouTube. With this tutorial, it is possible to learn in
a practical fashion how to handle the data from mixture design and, the authors hope to contribute with the researchers in this area.

Keywords: Octave; mixture design; analysis of variance; regression model; template mixtures; partial derivatives.

INTRODUÇÃO desses estudos, bem como o conjunto de dados neles publicados,


foi gentilmente cedida pela Editora da Sociedade Brasileira de
O planejamento de misturas é bastante empregado em otimizações Química (PubliSBQ). Tais artigos foram selecionados por utilizarem
nas quais é fixa a relação entre as variáveis.1 Um exemplo típico é a planejamento de misturas objetivando a resolução de diferentes
otimização da composição da fase móvel em um método de separação problemas analíticos.
cromatográfico.2 Nesse tipo de planejamento, os níveis das variáveis
não podem ser alterados de forma independente e sempre é mantida Exemplo 1
uma relação entre as mesmas. A literatura científica apresenta diversos No primeiro exemplo foi utilizado o trabalho publicado por
textos excelentes sobre este tipo de planejamento.3-7 Entretanto, a Damasceno et al.,9 no qual os autores utilizaram um planejamento
visualização da superfície de resposta e gráfico de contorno está de misturas do tipo simplex centroide para visualizar a relação do
restrita a alguns programas computacionais pagos e específicos. chumbo presente em descarte de material eletrônico (placas de
Dessa forma, o objetivo deste tutorial é mostrar a aplicação de circuito impresso) com diferentes tipos de solos. Nesse caso, cada
uma planilha no Microsoft Excel para a visualização do gráfico de pseudocomponente foi avaliado em 6 níveis. A Tabela 1 mostra em
contorno e superfície de resposta. Além disso, é empregado o Solver detalhes o planejamento experimental utilizado pelos autores com
(Microsoft Excel) para o cálculo da melhor condição de trabalho. Os três variáveis, OM (v1 - matéria orgânica), IO (v2 - óxido de ferro) e
cálculos para obtenção do modelo de regressão podem ser efetuados KA (v3 - caulinita), além de duas respostas que serão estudadas neste
em programa livre (Octave) e todos os procedimentos para execução tutorial, F2 (concentração de Pb extraído na fração orgânica) e F3
dos cálculos já foram descritos no tutorial anterior publicado na (concentração de Pb extraído na fração residual). No experimento
Química Nova.8 Um dos objetivos deste tutorial é também apresentar 1, por exemplo, da Tabela 1 temos uma mistura composta por 80 g
uma análise criteriosa e com rigor matemático sobre a identificação (codificado em 1) de matéria orgânica (OM) e 10 g de cada um dos
da região ótima de um dado modelo. demais componentes: óxido de ferro (IO, codificado em 0) e caulinita
Portanto, com este tutorial é possível apresentar ao público (KA, codificado em 0).
interessado uma alternativa viável e de fácil acesso para a utilização
de planejamento fatorial no contexto do planejamento de misturas. Exemplo 2
Além da descrição dos conjuntos de dados e cálculos efetuados, foram Para o exemplo 2, foi utilizado o trabalho publicado por Estevão et
preparados vídeos explicativos que estão disponíveis no Canal do al.10 e o objetivo foi abordar um estudo com múltiplas respostas. Nesse
prof. Edenir Pereira Filho no YouTube (https://www.youtube.com/c/ caso, os autores otimizaram um procedimento de extração utilizando
EdenirPereiraFilho, ver Playlist 15). a técnica de microextração líquido-líquido dispersivo em solvente
binário para a determinação de pesticidas em amostras de água
PARTE EXPERIMENTAL natural. Na parte experimental foram realizados dois planejamentos
de misturas com três componentes. O primeiro planejamento abordou
Descrição dos conjuntos de dados empregados uma faixa muito ampla da composição da mistura dos componentes
extratores, sendo necessário um segundo com uma faixa mais restrita.
Para exemplificar as ferramentas deste tutorial, foram selecionados Nesse tutorial abordamos apenas o segundo planejamento.
dois conjuntos de dados a partir de trabalhos publicados no periódico A mistura foi realizada com dois extratores (diclorometano, DCM
Journal of the Brazilian Chemical Society (JBCS). A utilização e clorofórmio, CLF) e um solvente dispersor (acetonitrila, ACN). O
objetivo foi obter a melhor relação entre os três componentes que
*e-mail: [email protected] proporcionasse recuperações adequadas (da ordem de 100%) dos

Esse trabalho é dedicado à memória do Prof. Dr. Ronei Jesus Poppi seguintes pesticidas nas amostras de água natural: Diuron (DIU),
Vol. 44, No. 7 Planejamento de misturas e visualização da região ótima com planilhas no excel 875

Tabela 1. Planejamento de misturas simplex centroid usado para verificar a influência das variáveis v1 a v3 nas respostas F2 e F3 (Exemplo 1)

OM (v1) IO (v2) KA (v3) Concentração de Pb (mg kg-1)


Experimentos
Codificado Real (g) Codificado Real (g) Codificado Real (g) Fração Orgânica (F2) Fração Residual (F3)
1 1 80 0 10 0 10 1931±259 2799±1114
2 0 10 1 80 0 10 2034±208 2818±428
3 0 10 0 10 1 80 138±78 692±154
4 1/2 45 1/2 45 0 10 1521±114 2146±371
5 0 10 1/2 45 1/2 45 1081±255 1691±85
6 1/2 45 0 10 1/2 45 1012±220 1007±233
7 1/3 33,3 1/3 33,3 1/3 33,3 1058±55 1309±98
8 2/3 56,67 1/6 21,66 1/6 21,66 1765±278 1592±157
9 1/6 21,66 2/3 56,67 1/6 21,66 1578±75 1750±88
10 1/6 21,66 1/6 21,66 1/6 54,67 777±189 840±401

teflubenzuron (TFB), atrazine (ATZ), desisopropylatrazine (DIA)


e desethylatrazine (DEA). Como se trata de múltiplas respostas
(nesse caso, 5), foi abordada neste trabalho a utilização do cálculo
da desejabilidade,11 diferente da abordagem original dos autores.
A função de desejabilidade foi proposta por Derringer e Suich em
198012 e tem como objetivo encontrar uma condição de compromisso
onde todas as respostas estejam dentro de uma região aceita como
desejável. Dessa forma, as respostas originais são codificadas entre Figura 1. Equações para o cálculo da desejabilidade quando o objetivo é
0 (condição indesejável) e 1 (condição desejável). Para esse cálculo, (a) maximizar e (b) minimizar
foi criada uma rotina computacional chamada “mydes2” (ver detalhes
no Material Suplementar). Segundo os autores, foram realizadas 3 réplicas em cada nível
experimental, entretanto, são mostrados apenas o valor médio e
Rotinas computacionais utilizadas desvio padrão obtido.
Para avaliar como os pseudocomponentes interferiram nas
Uma rotina computacional chamada “mydes2” foi preparada respostas avaliadas utilizou-se a rotina regression2, a qual foi proposta
para a realização do cálculo de desejabilidade no programa livre por Pereira e Pereira-Filho8 e tem a finalidade de calcular um modelo
Octave, independentemente do alvo de cada resposta (maximizar de regressão a partir de 4 dados de entrada (inputs): as matrizes X e
ou minimizar). Como input é necessário fornecer dois vetores/ Y, a soma quadrática do erro puro (pure error sum of squares - SSPE)
matrizes: um deles é o conjunto de dados (respostas) que devem ser e seu respectivo grau de liberdade (degree of freedom - DF). A linha
codificadas (matriz X) e o outro contém as condições (matriz Cond) de comando para a utilização da rotina regression2 é:
para a realização do cálculo. Para Cond, é necessário fornecer o
valor mínimo da resposta (posicionada na primeira linha), o valor [Mod_par,Coef,Pred]=regression2(X,Y,SSPE,DF);
máximo (segunda linha), o alvo (terceira linha) e o peso (quarta
linha). O alvo é o objetivo de cada resposta. No caso do exemplo 2, Na parte direita da linha de comando pode-se observar os inputs.
a resposta monitorada foi a recuperação dos analitos, sendo assim o A matriz X dá origem aos coeficientes de regressão (Coef) a serem
alvo foi igual a 100%. E o peso é quanto uma resposta influenciará calculados e possui m linhas e n colunas, onde as linhas correspondem
no modelo final. Assim, pode-se colocar diferentes pesos para as aos experimentos e as colunas aos coeficientes de regressão que serão
respostas. Respostas que apresentaram modelos individuais melhor calculados, essa matriz pode ser vista em detalhes na Tabela 2. Os
ajustados13 podem receber um peso maior que aquelas respostas que coeficientes calculados para ambas as respostas avaliadas foram:
apresentaram modelos com falta de ajuste. Como output, a rotina b1, b2, b3, b12, b13, b23, b123. Os três primeiros coeficientes, b1, b2 e b3,
irá fornecer dois resultados: a desejabilidade individual (di) de cada são obtidos a partir dos níveis codificados das variáveis v1, v2 e v3,
resposta e a desejabilidade global (D), ou seja, a média geométrica mostrados na Tabela 1, o coeficiente b12 é obtido pela multiplicação da
de todas as desejabilidades individuais. Com isso, pode-se calcular coluna correspondente ao coeficiente b1 pela coluna correspondente ao
apenas um modelo de regressão que englobe todas as respostas coeficiente b2. Os demais coeficientes são obtidos de forma análoga.
utilizando a D. A rotina está disponível no Material Suplementar e, A matriz Y corresponde aos resultados obtidos em cada experimento
para os cálculos, utilizaram-se as equações mostradas na Figura 1. realizado, dessa forma será composta por m linhas e n colunas, onde
as linhas correspondem aos experimentos e as colunas, as respostas
RESULTADOS E DISCUSSÃO monitoradas (F2 e F3, Tabela 1). SSPE corresponde a soma quadrática
do erro puro obtida a partir das réplicas, porém, nesse caso não foi
Exemplo 1 possível o cálculo desse parâmetro devido à ausência desses valores,
sendo considerado 0. Na utilização da rotina regression2 é calculado
No primeiro exemplo estudado os autores monitoraram como as um modelo para cada resposta. Dessa forma, recomenda-se o
diferentes proporções de matéria orgânica (v1), óxido de ferro (v2) desmembramento da matriz Y em n vetores (as n respostas avaliadas).
e caulinita (v3) influenciam na absorção de Pb por uma amostra de A parte esquerda da linha de comando corresponde aos outputs
solo. As concentrações de Pb utilizadas são aquelas que podem ser (saídas) obtidos após o tratamento dos dados pela rotina regression2.
encontradas devido ao descarte inadequado de material eletrônico. Mod_par corresponde a tabela ANOVA (Analysis of Variance)
876 Hilário et al. Quim. Nova

Tabela 2. Matriz X utilizada para os cálculos dos modelos de regressão para as respostas F2 e F3 (Exemplo 1)

Matriz X com os coeficientes utilizados na proposição do modelo


Experimentos
b1 b2 b3 b12 b13 b23 b123
1 1,00 0,00 0,00 0,00 0,00 0,00 0,00
2 0,00 1,00 0,00 0,00 0,00 0,00 0,00
3 0,00 0,00 1,00 0,00 0,00 0,00 0,00
4 0,50 0,50 0,00 0,25 0,00 0,00 0,00
5 0,00 0,50 0,50 0,00 0,00 0,25 0,00
6 0,50 0,00 0,50 0,00 0,25 0,00 0,00
7 0,33 0,33 0,33 0,11 0,11 0,11 0,03
8 0,67 0,16 0,16 0,11 0,11 0,03 0,02
9 0,16 0,67 0,16 0,11 0,03 0,11 0,02
10 0,16 0,16 0,67 0,03 0,11 0,11 0,02

considerando 95% de confiança, Coef aos coeficientes obtidos com experimento com as mesmas condições, não sendo possível o cálculo
seus respectivos intervalos de confiança e Pred corresponde aos de SSPE e DF.
valores previstos para cada experimento. Pereira e Pereira-Filho8 A Figura 2, a Tabela 3 e a Equação 1 mostram os resultados
fornecem uma explicação detalhada da rotina utilizada. obtidos após o refinamento do modelo para a resposta F2. E a Figura 3,
O primeiro passo foi calcular um modelo de regressão para Tabela 4 e Equação 2 descrevem os resultados para a resposta F3.
cada resposta a fim de verificar quais coeficientes de regressão são
significativos, isso é, valores maiores que seus respectivos intervalos F2 = 1874±328v1 + 1903±328v2 (1)
de confiança. O Material Suplementar mostra as tabelas Anova
para as respostas F2 (Tabela 1S) e F3 (Tabela 2S). Além disso, as F3 = 2804±396v1 + 2726±535v2 + 695±353v3 – 3133±1831v1v2
informações dos modelos são também mostradas na forma de figuras –3340±1831v1v3 (2)
(Figuras 1S e 2S). Para a resposta F2 apenas os coeficientes b1 e b2
foram significativos (Figura 1S), já para a resposta F3, b1, b2, b3, b12 Nas Equação 1 e 2, v1, v2 e v3 são relativos à matéria orgânica,
e b13 foram válidos (Figura 2S). Todas as avaliações foram feitas ao óxido de ferro e caulinita, respectivamente. Ambas as equações
nível de confiança de 95%. descrevem uma superfície de resposta com as três variáveis
A rotina regression2 foi aplicada novamente para ambas as interrelacionadas. O ponto “ótimo” da superfície descrita pela equação
respostas utilizando somente os coeficientes válidos. Mesmo com representa as proporções de v1, v2 e v3 em que as respostas encontram
a exclusão dos coeficientes não significativos para cada uma das seus valores “ótimos”, ou seja, região onde se observa maior fração
respostas, não foram identificadas réplicas, isso é, mais de um de massa (concentração) de Pb nas frações orgânica (F2) e residual

Figura 2. Teste F para a média quadrática de regressão (MQR) e média quadrática de resíduo (MQres) (a), variação explicada (R2) e explicável (R2max) (b),
coeficientes de regressão (c), gráfico dos valores experimental versus previsto (d), previsto versus o resíduo e histograma dos resíduos (e), para os cálculos
da resposta F2 após o refinamento do modelo
Vol. 44, No. 7 Planejamento de misturas e visualização da região ótima com planilhas no excel 877

Tabela 3. Tabela Anova para o modelo recalculado da resposta F2 com os coeficientes válidos (Exemplo 1)

Soma quadrática (SQ) Graus de liberdade Média quadrática (MQ) F calculado F tabelado
Regressão (Reg) 3,58.106 1 3,58.106 97,87 5,32
5 4
Resíduo (res) 2,98.10 8 3,73.10
Total (T) 3,88.106 9 4,31.105
Erro puro (EP) 0 0 0
5
Falta de ajuste (Faj) 2,98.10 8 3,73.104

Figura 3. Teste F para MQR e MQres (a), variação explicada (R2) e explicável (R2max) (b), coeficientes de regressão (c), gráfico dos valores experimental
versus previsto (d), previsto versus o resíduo e histograma dos resíduos (e), para os cálculos da resposta F3 após o refinamento do modelo

Tabela 4. Tabela Anova para o modelo recalculado da resposta F3 com os coeficientes válidos (Exemplo 1)

Soma quadrática (SQ) Graus de liberdade Média quadrática (MQ) F calculado F tabelado
Regressão (Reg) 4,94.106 4 1,23.106 56,03 5,19
5 4
Resíduo (res) 1,10.10 5 2,20.10
Total (T) 5,05.106 9 5,61.105
Erro puro (EP) 0 0 0
5
Falta de ajuste (Faj) 1,10.10 5 2,20.104

(F3), respectivamente. Os modelos obtidos foram analisados em um


template preparado no Excel, que tem como finalidade a obtenção
de um gráfico de contorno a partir dos valores dos coeficientes
obtidos em um modelo de regressão. As Figuras 4a e 4b mostram
os gráficos de contorno obtidos para F2 e F3, respectivamente.
Analisando os gráficos obtidos é possível observar as proporções das
pseudocomponentes que resultam em maior teor de Pb, em vermelho,
e as proporções que resultam em menor teor de Pb, em verde.
Além do template descrito também foi utilizado a ferramenta
do Solver no Excel para avaliar os modelos obtidos. Uma descrição
detalhada deste recurso e sua utilização podem ser encontrados
no tutorial anterior8 e na Playlist de número 7 que descreve o uso
do Solver (https://www.youtube.com/playlist?list=PL4CuftF4l_
fB7LRMzFBmw59FrigmAb0hy). As proporções que resultaram em Figura 4. Gráficos de contorno obtidos para o modelo final da resposta F2 (a),
maior teor de Pb na F2 do solo são: 10% de matéria orgânica (v1), e para o modelo final da resposta F3 (b)
878 Hilário et al. Quim. Nova

80% de óxido de ferro (v2) e 10% de caulinita (v3). No caso da F3, a e observar quais são mais influenciadas pelas variáveis testadas.8
melhor condição exige que a v1 esteja no nível máximo. Como no artigo original não foram fornecidos os valores das
Para melhor entendimento do processo de tratamento de dados réplicas, não foi possível calcular o valor da soma quadrática do
descrito neste trabalho foi elaborada uma lista de vídeos explicativos erro puro. Os pesos foram atribuídos de acordo com o resultado
de livre acesso publicados no YouTube (https://www.youtube.com/ da razão entre a média quadrática de regressão (MQR) e a média
playlist?list=PL4CuftF4l_fDBW0qIJ1gXZneN1Krgw5z_). quadrática do resíduo (MQres). Quanto maior essa razão, melhor
é a regressão do modelo. De acordo com os resultados, DIA e ATZ
Exemplo 2 obtiveram razões na faixa de 2,2; DEA e DIU na faixa de 1,7 e TFB
na faixa de 0,9. Portanto, três diferentes pesos (s, Figura 1) foram
Na Tabela 5, tem-se o planejamento de misturas utilizado pelos atribuídos: 3 (DIA e ATZ), 2 (DEA e DIU) e 1 (TFB).
autores com três variáveis (CLF, DCM e ACN), onde as proporções O segundo passo foi recalcular as desejabilidades individuais
das condições escolhidas variaram de 0 a 1 quando convertidas em com os devidos pesos para cada uma das respostas e assim obter
pseudocomponentes. As codificações de cada uma das variáveis são a desejabilidade global (D), a qual foi utilizada para calcular um
mostradas, sendo que a soma entre elas é 1. As respostas monitoradas modelo de regressão englobando todas as respostas simultaneamente.
são apresentadas na forma de recuperação dos cinco pesticidas A matriz X (coeficientes cúbicos) e o vetor y (desejabilidade global,
determinados. D) são mostrados na Tabela 6.
O primeiro passo foi calcular a desejabilidade individual para O modelo de regressão é calculado pela rotina “regression2”
cada uma das respostas utilizando a rotina “mydes2” e construir disponibilizada em Pereira e Pereira-Filho,8 a partir do qual é
a matriz X com os coeficientes cúbicos (b1, b2, b3, b12, b13, b23 e possível calcular e avaliar a Tabela Anova. Após o cálculo, apenas
b123) que se deseja calcular. Neste caso, o alvo para o cálculo da dois coeficientes foram significativos: b12 e b13. Assim, o modelo foi
desejabilidade foi 100% por se tratar de recuperações de cada um recalculado apenas com os coeficientes válidos, onde quatro réplicas
dos pesticidas. Fez-se um modelo de regressão utilizando a rotina foram identificadas permitindo obter a soma quadrática do erro puro.
regression2 para cada uma das desejabilidades individuais com Na Tabela 3S, tem-se a tabela Anova para o modelo recalculado e na
o objetivo de atribuir diferentes pesos a cada uma das respostas Figura 3S (ver ambos no Material Suplementar) tem-se os valores

Tabela 5. Planejamento de misturas com três variáveis e cinco respostas monitoradas (Exemplo 2)
CLF DCM ACN Respostas (Recuperação, %)
Experimentos Soma
Real Codificada Real Cod Real Cod DIA DEA ATZ DIU TFB
1 70 1,000 0 0,000 30 0,000 1 44,6 69,6 81,1 85,0 56,7
2 50 0,500 20 0,500 30 0,000 1 46,6 71,2 87,6 90,7 60,6
3 30 0,000 40 1,000 30 0,000 1 43,5 65,6 78,5 80,8 53,4
4 30 0,000 20 0,500 50 0,500 1 46,1 69,3 86,8 89,8 58,1
5 30 0,000 0 0,000 70 1,000 1 39,8 62,5 86,1 90,7 57,3
6 50 0,500 0 0,000 50 0,500 1 46,3 70,4 91,1 93,4 61,3
7 60 0,750 5 0,125 35 0,125 1 47,1 72,3 88,3 90,3 63,8
8 35 0,125 30 0,750 35 0,125 1 44,9 68,4 83,1 85,2 61,6
9 35 0,125 5 0,125 60 0,750 1 42,7 65,9 86,2 88,4 58,2
10 50 0,500 10 0,250 40 0,250 1 48,5 74,3 91,9 95,8 61,1
11 40 0,250 20 0,500 40 0,250 1 41,9 62,8 77,7 80,3 54,7
12 40 0,250 10 0,250 50 0,500 1 48,8 74,0 92,7 97,2 61,1
13 35 0,125 17,5 0,438 47,5 0,438 1 45,4 69,4 87,1 90,6 58,8
14 47,5 0,438 17,5 0,438 35 0,125 1 47,2 72,0 89,2 91,2 73,9
15 47,5 0,438 5 0,125 47,5 0,438 1 48,1 73,4 92,3 96,1 74,1

Tabela 6. Matriz X e vetor y para a realização do modelo de regressão global (Exemplo 2)


Matriz X (coeficientes cúbicos) Vetor y
Experimentos
b1 b2 b3 b12 b13 b23 b123 D global
1 1,00 0,00 0,00 0,00 0,00 0,00 0,00 0,01
2 0,50 0,50 0,00 0,25 0,00 0,00 0,00 0,05
3 0,00 1,00 0,00 0,00 0,00 0,00 0,00 0,00
4 0,00 0,50 0,50 0,00 0,00 0,25 0,00 0,04
5 0,00 0,00 1,00 0,00 0,00 0,00 0,00 0,00
6 0,50 0,00 0,50 0,00 0,25 0,00 0,00 0,06
7 0,75 0,13 0,13 0,09 0,09 0,02 0,01 0,06
8 0,13 0,75 0,13 0,09 0,02 0,09 0,01 0,02
9 0,13 0,13 0,75 0,02 0,09 0,09 0,01 0,02
10 0,50 0,25 0,25 0,13 0,13 0,06 0,03 0,10
11 0,25 0,50 0,25 0,13 0,06 0,13 0,03 0,00
12 0,25 0,25 0,50 0,06 0,13 0,13 0,03 0,10
13 0,13 0,44 0,44 0,05 0,05 0,19 0,02 0,04
14 0,44 0,44 0,13 0,19 0,05 0,05 0,02 0,07
15 0,44 0,13 0,44 0,05 0,19 0,05 0,02 0,11
Vol. 44, No. 7 Planejamento de misturas e visualização da região ótima com planilhas no excel 879

da razão do teste Fcalculado e Ftabelado para a falta de ajuste (a) e para a


regressão (b), além da variância explicada do modelo (c).
Ao analisar o resultado da razão do primeiro teste F calculado
(MQFaj/MQEP) e Ftabelado, tem-se que o Fcalculado é menor que o Ftabelado,
em que os dois se confundem, portanto, o modelo não apresenta falta
de ajuste (razão menor que 1, Figura 3Sa). Além da falta de ajuste,
é necessário verificar a regressão do modelo, sendo que, nesse caso,
a razão entre o Fcalculado (MQReg/MQres) e o Ftabelado está na faixa de
4,5 (Figura 3Sb), ou seja, a regressão é maior que o resíduo. Esse
aspecto reflete que o modelo está adequado, porém, a situação ideal
é que a razão dos valores de F fosse acima de dez.14 Os parâmetros
utilizados para os cálculos do teste F são encontrados na Tabela Anova
(Tabela 3S). A variância explicada do modelo está na faixa de 0,6
(Figura 3Sc), o que pode afirmar que o modelo não é excelente, mas Figura 5. Gráfico de contorno do modelo cúbico com dois coeficientes sig-
por outro lado é possível utiliza-lo para identificar uma condição nificativos (Equação 3)
de compromisso que poderá apresentar valores de recuperação
adequados para todos os analitos. Assim, o modelo final foi: a Equação 3 com os devidos coeficientes significativos para cada nível
e cada resposta, como pode ser observado no exemplo (Equação 4)
D = 0,22v1v2 + 0,38v1v3 (3) para o pesticida DIA:

em que v1, v2 e v3 são CLF, DCM e ACN, respectivamente. D é a dDIA = 0,15 × 0,5 × 0 + 0,35 × 0,5 × 0,5 = 0,09 (4)
resposta (no caso, a desejabilidade global). Nota-se que apenas os
coeficientes quadráticos foram significativos. Lembrando que v1 = 0,5; v2 = 0 e v3 = 0,5. A recuperação prevista
Na Figura 5, tem-se o gráfico de contorno com os coeficientes (y) foi calculada de acordo com a equação da Figura 1a. Nesse caso,
significativos, no qual observa-se uma região de ótimo na coloração tem-se a di prevista e o novo y será a resposta prevista em termos
vermelha da figura, resultando em 0,5 das variáveis 1 (CLF) e 3 (ACN) de recuperação. Ao observar a resposta do artigo (Tabela 7), tem-se
e 0 da variável 2 (DCM), ou seja, uma mistura “ideal” seria 50% de valores muito semelhantes com os resultados obtidos no maior nível
CLF e 50% de ACN, e 0% de DCM. A condição identificada pelos (coeficiente mais o intervalo de confiança). Vale ressaltar que ambos
autores do trabalho foi: 47,5% de CLF e 47,5% de ACN, e 5% de os trabalhos utilizaram abordagens diferentes e com isso os resultados
DCM, ou seja, mesmo com diferentes abordagens para o tratamento podem ser considerados equivalentes.
de dados, os resultados foram praticamente os mesmos. O gráfico
foi feito com o template de misturas no Excel disponibilizado neste Encontrando a região de ótimo usando ferramentas de cálculo
tutorial. diferencial
Na Tabela 7, tem-se o resultado das respostas previstas para
cada um dos pesticidas, onde empregou-se o modelo global com os A identificação da região ótima de trabalho de determinado
coeficientes b12 e b13. Assim, utilizou-se os valores desses coeficientes modelo não é uma tarefa fácil e pode trazer dificuldades consideráveis
(b12 e b13) dos modelos individuais calculados no início do tratamento de acordo com os coeficientes válidos do modelo. Para o caso da
dos dados para encontrar a di (desejabilidade individual) de cada um Equação 1, por exemplo, a região em que há a máxima retenção de
dos pesticidas em todos os níveis (coeficiente ± intervalo de confiança) Pb está na aresta em que a variável 2 (óxido de ferro) é máxima (1,0).
e consequentemente, a resposta prevista. Para a di prevista, utilizou-se Nesse ponto, a fração de massa prevista para o Pb é de 1903 mg kg-1.

Tabela 7. Respostas previstas para cada um dos pesticidas, tendo os coeficientes ± intervalo de confiança e a resposta obtida pelos autores do Exemplo 2

Coeficientes DIA DEA ATZ DIU TFB


Respostas para: coeficientes menos o intervalo de confiança
b12 -0,01 -0,07 0,56 0,38 0,14
b13 0,19 0,25 0,85 0,53 0,10
di prevista 0,05 0,06 0,21 0,13 0,03
Recuperação prevista 42,65 64,87 82,46 82,91 54,60
Respostas para: coeficientes
b12 0,15 0,34 1,36 1,41 0,72
b13 0,35 0,66 1,65 1,56 0,69
di prevista 0,09 0,16 0,41 0,39 0,17
Recuperação prevista 45,03 68,64 86,92 88,00 61,40
Respostas para: coeficientes mais o intervalo de confiança
b12 0,31 0,74 2,16 2,44 1,31
b13 0,51 1,06 2,45 2,60 1,27
di prevista 0,13 0,26 0,61 0,65 0,32
Recuperação prevista 47,41 72,42 91,38 93,09 68,21
Resposta obtida pelos autores do artigo 49,40 73,20 95,10 94,70 74,90
880 Hilário et al. Quim. Nova

Essa constatação corrobora com a aplicação do Solver do Microsoft mostrado na Equação 3, precisamos determinar o ponto de máximo
Excel®. absoluto da função
Para o caso do modelo obtido para a resposta F3 (Equação 2),
podemos calcular as derivadas parciais em função das variáveis v1 e D(v1,v2,v3) = 0,22v1v2 + 0,38v1v3 sendo que v1+v2+v3 = 1.
v2 e substituir a v3 por 1-v1-v2:
Chamando v1 = x, v2 = y e v3 = z temos,
f3(v1,v2) = F3(v1,v2,1-v1-v2) = 2804v1 + 2726v2 + 695(1-v1-v2) –
3133v1v2 - 3340(1-v1-v2) (5) D(x,y,z) = 0,22xy + 0,38xz e x+y+z = 1

As derivadas parciais são: Isso é equivalente à:

∂f3/∂v1(v1,v2) = 6680v1 + 207v2 – 1231 (6) d(x,y) = D(x,y,1-x-y) = -0,38x2 – 0,16xy + 0,38x
∂f3/∂v2(v1,v2) = 207v1 + 2031 (7) com x ≥ 0, y ≥ 0 e x+y ≤ 1

(v1,v2) é o ponto crítico de f3 ⇔ ∂f3/∂v1(v1,v2) = 0 e ∂f3/∂v2(v1,v2) = 0. O ponto de máximo da função d ocorre entre os pontos críticos de
d no interior de T = {(x,y): x ≥ 0, y ≥ 0 e x+y ≤ 1} e os pontos críticos
e (8) do bordo de T, ou seja, b(T) = {(x,y): x = 0 ou y = 0 ou x+y = 1}.
• Pontos críticos no interior de T
(x,y) é ponto crítico de d ⇔ ∂d/∂x(x,y) = -0,76x – 0,16y + 0,38 = 0 e
⇔ v1 = –9.81 e v2 = 322.57 ⇔ (v1,v2) = (–9,81; 322,57)
∂d/∂y(x,y) = -0,16x = 0
Entretanto, esse ponto está fora do domínio T={(v1,v2): v1 ≥ 0, ⇔ (x,y) = (0, 2,38)
v2 ≥ 0 e v1 + v2 ≤ 1} da função f3. Portanto, novamente aqui, f3 não
possui pontos críticos no interior de T. Como o ponto (0, 2,38) não pertence ao conjunto T (e, portanto,
O domínio de F3 é a região plana delimitada pelo triângulo não pertence ao interior desse conjunto), temos que d não possui
equilátero com vértices (1,0,0), (0,1,0) e (0,0,1), mostrado na Figura candidatos a ponto de máximo absoluto no interior de T.
4S (Material Suplementar). • Pontos críticos no b(T)
O domínio T de f3 é a região plana delimitada pelo triângulo 1) x = 0
retângulo com vértices (0,0), (1,0) e (0,1), como mostra a Figura 5S Nesse caso, analisamos os pontos de máximo da função
(Material Suplementar). f1:[0,1]→[0,1], definida por f1(y) = d(0,y) = 0. Como essa é uma
Notamos que o bordo de T é dado pela união dos segmentos função constante, todos os pontos (0,y) são candidatos a ponto de
a, b e c (dados em vermelho, azul e verde, respectivamente, ver máximo de d, ou seja, todos os pontos (0, y, 1-y) com 0 ≤ y ≤ 1 são
Figura 5S). candidatos a ponto de máximo de D.
Precisamos analisar os candidatos a ponto de máximo de f3 no
bordo de T. 2) y = 0
1) Em a = {(v1,v2) ∈ T: v1 ≥ 0, v2 ≥ 0 e v1+v2 = 1} Nesse caso, analisamos os pontos de máximo da função
Nesse caso, analisamos os pontos de máximo da função f2:[0,1]→[0,1], definida por f2(x) = d(x,0) = 0,38(x-x2), a qual tem um
g1:[0,1]→[0,1], definida por g1(v1) = f3(v1,1-v1) = 3133v12 – 3055v1 + único ponto crítico x = 1/2 ∈ (0,1). Assim, nesse caso, os candidatos
2726, a qual tem um único ponto crítico v1 = 235/482 ~ 0,49 ∈ (0,1). a ponto de máximo de D são, (½ , 0 , ½ ), (0,0,1) e (1,0,0).
Assim, nesse caso, os candidatos a ponto de máximo de F3 são, (0,49,
0,51, 0), (0,1,0) e (1,0,0). 3) x+y = 1
Nesse caso, analisamos os pontos de máximo da função
2) Em b = {(0, v2) ∈ T: 0 ≤ v2 ≤ 1} f3:[0,1]→[0,1], definida por f3(x) = d(x,1-x) = 0,22(x-x2), a qual
Nesse caso, analisamos os pontos de máximo da função tem um único ponto crítico x = 1/2 ∈ (0,1). Assim, nesse caso, os
g2:[0,1]→[0,1], definida por g2(v2) = f3(0,v2) = 2031v2 + 695, a qual candidatos a ponto de máximo de D são (½, ½, 0), (0,1,0) e (1,0,0).
não possui pontos críticos. Logo, nesse caso, os candidatos a ponto Agora testamos todos os candidatos:
de máximo de F3 são (0,0,1) e (0,1,0). D (0, y, 1-y) = D (0, 0, 1) = D(0, 1, 0) = 0
D (½, 0, ½) = 0,095
3) Em c = {(v1,0) ∈ T: 0 ≤ v1 ≤ 1} D (½, ½, 0) = 0,055
Nesse caso, analisamos os pontos de máximo da função D (1,0,0) = 0
g3:[0,1]→[0,1], definida por g3(v1) = f3(v1,0) = 3340v12 -1231v1 +695, Logo, o ponto de máximo procurado é (½, 0, ½). Assim, as
a qual tem um único ponto crítico x = 1231/6680 ~ 0,18 ∈ (0,1). variáveis v1 (CLF) e v3 (ACN) devem ser 50% de cada.
Assim, nesse caso, os candidatos a ponto de máximo de F3 são, (0,18,
0, 0,82), (0,0,1) e (1,0,0). CONCLUSÕES
Agora testamos todos os candidatos:
F3 (0,49, 0,51, 0) = 1981 Com este tutorial é possível aprender de forma didática como
F3 (0,18, 0, 0,82) = 582 realizar o tratamento de dados de um planejamento de misturas
F3 (1, 0, 0) = 2804 para duas e múltiplas respostas. Também foi elaborado um template
F3 (0, 1, 0) = 2726 no Excel para a construção de gráfico de contorno e superfície de
F3(0, 0, 1) = 695 resposta com os resultados dos modelos de regressão de misturas,
Logo, o ponto de máximo procurado é (1, 0, 0), ou seja, a variável os quais são disponíveis apenas em programas computacionais
1 (v1 = Matéria Orgânica) no nível alto (1). pagos e restritos. O uso do Solver também foi exemplificado neste
Para o caso do exemplo 2, no qual o modelo obtido é aquele tutorial, sendo uma ferramenta gratuita que pode ser utilizada no
Vol. 44, No. 7 Planejamento de misturas e visualização da região ótima com planilhas no excel 881

Excel. Além disso, uma rotina computacional foi proposta para o coeficientes de regressão (d), gráfico dos valores experimental
cálculo das desejabilidades. versus previsto (e), previsto versus o resíduo e histograma dos
resíduos (f) para os cálculos da resposta F2 (Exemplo 1).
Tabela 8. Lista dos vídeos preparados com os dois exemplos ilustrados
- Figura 2S. Teste F para MQR e MQr (a), teste F para a MQfaj
neste tutorial
e MQEP (b) variação explicada (R2) e explicável (R2max) (c),
ID do vídeo Descrição coeficientes de regressão (d), gráfico dos valores experimental
Vídeo 1 Introdução + Planejamento de misturas com um exemplo versus previsto (e), previsto versus o resíduo e histograma dos
didático (preparando um suco) resíduos (f) para os cálculos da resposta F3 (Exemplo 1).
Vídeo 2 Exemplo didático – Preparo da matriz de dados - Figura 3S. Teste F para MQR e MQr (b), teste F para a MQfaj e
Vídeo 3 Exemplo didático – Obtendo um modelo empírico MQEP (a) variação explicada (R2) (c) para os cálculos da resposta
Vídeo 4 Exemplo didático – Refinando o modelo D (Exemplo 2).
Vídeo 5 Exemplo didático – Visualizando a melhor condição de trabalho - Figura 4S. Região plana delimitada pelo triângulo equilátero
Vídeo 6 Exemplo 1 (duas respostas, F2 e F3) – Preparo da matriz de com vértices (1,0,0), (0,1,0) e (0,0,1) que contém o domínio de F3.
dados - Figura 5S. Domínio T de f3 delimitado pelo triângulo retângulo
Vídeo 7 Exemplo 1 – Cálculo do modelo de regressão para F2 com vértices (0,0), (1,0) e (0,1).
Vídeo 8 Exemplo 1 – Refinando o modelo de regressão para F2
Vídeo 9 Exemplo 1 – Obtenção do gráfico de contorno para F2 Todo o conteúdo se encontra em http://quimicanova.sbq.org.br,
Vídeo 10 Exemplo 1 – Uso do solver para obter a condição “ótima” em formato PDF, com acesso livre.
para F2
Vídeo 11 Exemplo 1 - Cálculo do modelo de regressão para F3
AGRADECIMENTOS
Vídeo 12 Exemplo 1 - Refinando o modelo de regressão para F3
Vídeo 13 Exemplo 1 - Obtenção do gráfico de contorno para F3 Os autores são gratos à Fundação de Amparo à Pesquisa do Estado
Vídeo 14 Exemplo 1 - Obtenção do gráfico de contorno para F3 e uso de São Paulo (FAPESP, processos 2016/17221-8 e 2019/24223-5) e
do Solver
ao Conselho Nacional de Desenvolvimento Científico e Tecnológico
Vídeo 15 Exemplo 2 (múltiplas respostas) – Preparo da matriz de dados
(CNPq, processos 302719/2020-2). Os autores expressam gratidão à
Vídeo 16 Exemplo 2 – Codificando as respostas utilizando desejabilidade
PubliSBQ por permitir o uso dos exemplos em caráter ilustrativo neste
e construção da matriz X
tutorial. O presente trabalho foi realizado com apoio da Coordenação
Vídeo 17 Exemplo 2 – Cálculo do modelo de regressão para a primeira
resposta codificada de Aperfeiçoamento de Pessoal de Nível Superior - Brasil (CAPES)
Vídeo 18 Exemplo 2 – Cálculo dos modelos de regressão para as demais - Código de Financiamento 001.
respostas codificadas
Vídeo 19 Exemplo 2 – Obtenção do peso das respostas codificadas, REFERÊNCIAS
cálculo da desejabilidade com os pesos e obtenção do modelo
de regressão global (D global) 1. Leardi, R.; Anal. Chim. Acta 2009, 652, 161.
Vídeo 20 Exemplo 2 – Refinando o modelo de regressão global e obten- 2. Sahu, P. K.; Ramisetti, N. R.; Cecchi, T.; Swain, S.; Patro, C. S.; Panda,
ção do gráfico de contorno com o template de misturas no Excel J.; J. Pharm. Biomed. Anal. 2018, 147, 590
Vídeo 21 Exemplo 2 – Cálculos da di e da recuperação prevista para cada 3. Coscione, A. R.; De Andrade, J. C.; May, G. M.; Quim. Nova 2005, 28,
resposta. Comparação dos resultados com o artigo de referência 1116.
4. Novaes, C. G.; Yamaki, R. T.; de Paula, V. F.; do Nascimento Júnior, B.
A Tabela 8 mostra uma lista com os vídeos elaborados B.; Barreto, J. A.; Valasques, G. S.; Bezerra, M. A.; Rev. Virtual Quim.
para a construção deste tutorial. Os vídeos são curtos e 2017, 9, 1184.
mostram o passo a passo até a resposta final. No link a seguir 5. Novaes, C. G.; Yamaki, R. T.; de Paula, V. F.; do Nascimento Júnior, B.
é possível acessar a Playlist 15, criada no canal do professor B.; Barreto, J. A.; Valasques, G. S.; Bezerra, M. A.; Rev. Virtual Quim.
Edenir Pereira Filho no YouTube: https://www.youtube.com/ 2018, 10.
playlist?list=PL4CuftF4l_fDBW0qIJ1gXZneN1Krgw5z_ 6. Bezerra, M. A.; Ferreira, S. L. C.; Novaes, C. G.; dos Santos, A. M. P.;
A s r o t i n a s ( “ r eg r e s s i o n 2 ” , “ t e m p l a t e _ m i s t u r a s ” e Valasques, G. S.; Cerqueira, U. M. F.; Alves, J. P. S.; Talanta 2019, 194,
“mydes2”) utilizadas neste trabalho estão disponíveis para 941.
download em: https://www.dropbox.com/sh/aiuvutcknbch5te/ 7. Candioti, L. V.; Zan, M. M.; Cámara, M. S.; Goicoechea, H. C.; Talanta,
AAC-6Bef2WUsJZ-LJP2imh_Ea?dl=0 2014, 124, 123.
8. Pereira, F. M. V.; Pereira-Filho, E. R.; Quim. Nova 2018, 41, 1061.
MATERIAL SUPLEMENTAR 9. Damasceno, A. I. C.; Reis, C.; Reis, E. L.; Bellato, C. R.; Oliveira, A.
F.; J. Braz. Chem. Soc. 2016, 27, 877.
O Material Suplementar apresenta os seguintes itens: 10. Estevão, P. L. S.; Peralta-Zamora, P.; Nagata, N.; J. Braz. Chem. Soc.
- Rotina computacional “mydes2” 2018, 29, 2104.
- Tabela 1S. Tabela Anova para o modelo calculado da resposta F2 11. Costa, N. R.; Lourenço, J.; Pereira, Z. L.; Chemometr. Intell Lab. Syst.
(Exemplo 1). 2011, 107, 234.
- Tabela 2S. Tabela Anova para o modelo calculado da resposta F3 12. Derringer, G.; Suich, R.; J. Qual. Technol. 1980, 12, 214.
(Exemplo 1). 13. Myers, R. H.; Montgomery, D. C.; Anderson-Cook, C. M.; Response
- Tabela 3S. Tabela Anova do modelo calculado para a resposta D surface methodology process and product optimization using designed
(Exemplo 2). experiments, Wiley: Hoboken, 2009.
- Figura 1S. Teste F para MQR e MQr (a), teste F para a MQfaj 14. Barros Neto, B.; Scarminio, I. S.; Bruns, R. E.; Como fazer
e MQEP (b) variação explicada (R2) e explicável (R2max) (c), experimentos, Bookman: Porto Alegre, 2010.

This is an open-access article distributed under the terms of the Creative Commons Attribution License.

Você também pode gostar