Aula 4
Aula 4
Aula 4
AULA 4
CONTEXTUALIZANDO
2
Diante desse problema complexo, emergem diversas áreas de estudo que
buscam compreender o funcionamento da mente humana em prol de criar
sistemas que resolvam determinados problemas tais como os humanos
resolvem. No decorrer desta aula, abordaremos como a ciência cognitiva e as
redes neurais, técnica de IA que mais se aproxima do funcionamento da mente
humana, trabalham para resolver problemas complexos.
3
Mesmo com os diversos avanços na ciência quanto aos estudos da
cognição, ainda não se tem uma teoria da mente suficientemente precisa que
possa ser expressa em linguagem de máquina, simulando com perfeição o
comportamento humano. Caso os comportamentos de entrada/saída e
sincronização do programa coincidirem com os comportamentos humanos
correspondentes, isso será a evidência de que algumas das rotinas do programa
também funcionam de maneira similar nos seres humanos (Norvig; Russell,
2014).
Nesse sentido, Allen Newell e Herbert Simon desenvolveram o GPS, o
“Resolvedor Geral de Problemas” (do inglês, General Problem Solver). Eles não
se contentaram em apenas fazer um programa resolver problemas de forma
correta. Sua maior preocupação era comparar os passos de suas etapas de
raciocínio aos passos de indivíduos humanos resolvendo os mesmos problemas
(Newell; Simon, 1961).
Dada a complexidade, a ciência cognitiva abrange diversas disciplinas
acadêmicas, incluindo filosofia, psicologia, neurociência, linguística, IA e robótica
(Gudivada, 2016). Portanto, o campo é interdisciplinar e reúne vários modelos
computacionais da IA e técnicas experimentais da psicologia em busca de
modelar teorias precisas e verificáveis a respeito dos processos de
funcionamento da mente humana.
Com isso, surge a teoria do conexionismo. Este, por sua vez, é
considerado um conjunto de técnicas, também de diferentes áreas de estudo,
como IA, ciências cognitivas, psicologia cognitiva, neurociências e filosofia da
mente, no qual objetivam modelar fenômenos de comportamento e da mente
(Gudivada, 2016). Existem várias técnicas de conexionismo, das quais as mais
comuns usam modelos de redes neurais, como vimos anteriormente.
No início da IA, alguns autores argumentavam que, se um algoritmo
realizasse bem uma tarefa, poderia ser considerado um bom modelo de
desempenho humano. Eles também acreditavam que o inverso seria uma
verdade. Isso gerou uma série de confusão entre as abordagens de IA. Já os
autores modernos dividem em duas abordagens distintas. Assim, um bom
algoritmo nem sempre será um bom modelo de desempenho humano e
vice-versa (Norvig; Russell, 2014).
4
Essa distinção permitiu que tanto a IA quanto a ciência cognitiva
crescessem com uma maior agilidade. Os dois campos continuam a influenciar
de forma positiva um ao outro, especialmente na “visão computacional, que
incorpora evidências neurofisiológicas em modelos computacionais” (Norvig;
Russell, 2014, p. 27).
Aristóteles, filósofo da Grécia Antiga, foi um dos pioneiros na tentativa de
sistematizar o “pensamento correto”, isto é, os “processos de raciocínio
irrefutáveis”. Seus silogismos propiciaram determinados padrões que serviram
de base para estruturas de argumentos que resultam em conclusões corretas ao
receberem premissas corretas. Por exemplo: “O cavalo é um animal; todos os
animais são mamíferos; então, o cavalo é um mamífero”. Esse estudo deu início
ao campo de pesquisa conhecido como lógica (Norvig; Russell, 2014).
Os estudos de lógica do século XIX conceberam uma notação precisa
para declarações de diversos itens do mundo e suas relações, utilizando
notações aritméticas básicas para que os computadores pudessem calcular. Por
volta de 1965, já havia programas que conseguiam resolver qualquer problema
solucionável descrito em notação lógica. Porém, se não houvesse solução
lógica, o programa ficaria preso num laço infinito (Norvig; Russell, 2014).
Para Norvig e Russell (2014) essa abordagem enfrenta dois obstáculos
principais:
5
atividade”. Espera-se que um agente computacional aja de modo autônomo,
perceba seu ambiente e consiga se adaptar a possíveis mudanças,
características estas similares aos dos agentes humanos. Portanto, um agente
racional tem o objetivo de encontrar o melhor resultado e mesmo que exista
alguma incerteza apresente o resultado mais adequado (Norvig; Russell, 2014).
A realização de inferências corretas faz parte das características de um
agente racional, pois um dos modos de operar racionalmente é raciocinar de
modo lógico em busca de uma solução baseada em uma premissa dada e depois
agir de acordo com essa conclusão. Todavia, nem toda inferência assertiva pode
representar toda a racionalidade envolvida no processo, pois pode envolver mais
sentidos, tal como o reflexo de se afastar de algo quente ou proteger os olhos
numa determinada situação. Nesse sentido, a representação do conhecimento
e raciocínio permitem que os agentes obtenham decisões assertivas (Norvig;
Russell, 2014).
6
entrada recebida por cada neurônio da rede. O funcionamento dessas redes é
inspirado em uma estrutura física concebida pela natureza: o cérebro humano
(Braga, 2000).
7
incapazes de igualar a capacidade cognitiva do cérebro, sua flexibilidade,
robustez e eficiência energética (Prieto et al., 2016).
Do ponto de vista da engenharia de sistemas, uma rede neural é
considerada uma “caixa-preta”, pois imita um comportamento e não uma
estrutura e pode reproduzir qualquer função. Ao estudar a estrutura da rede, ela
não fornece nenhuma informação útil sobre o sistema que está sendo modelado.
A organização física do sistema original não é considerada. Em vez disso, uma
estrutura neural muito flexível com uma qualidade comprovada de resolução de
problemas é usada (Prieto et al., 2016).
Até agora, no que diz respeito às estatísticas convencionais, a rede neural
pode ser considerada um modelo não identificável no sentido de que várias redes
com topologias e parâmetros variados podem produzir os mesmos resultados.
Muitos dos tópicos pensados anteriormente no campo de RNAs hoje estão
consolidados. Eles provaram ser muito competitivos na resolução de problemas
do mundo real em comparação com métodos tradicionais de análise de dados,
geralmente baseados em modelagem estatística explícita (Gudivada, 2016).
O conceito de redes neurais germinou independentemente, mas com o
tempo, novos contextos e disciplinas surgiram, cobrindo objetivos mais amplos
que naturalmente incluem redes neurais. De fato, técnicas de RNAs combinam-
se naturalmente com outras, formando um conjunto de procedimentos
computacionais com uma sólida base teórica e uma eficiência inquestionável na
resolução de problemas reais em vários campos do processamento de
informações.
Como resultado, hoje em dia as RNAs não são mais consideradas um
campo de pesquisa independente. Elas se tornaram parte integrante de novos
contextos e disciplinas como Neurociência Computacional, Computação
Neromórfica, Neuroengenharia, Computação Natural, Inteligência
Computacional, Soft Computing, Aprendizado de Máquina e Neuroinformática.
(Prieto et al., 2016).
8
processamento neural. O núcleo de quase todos os algoritmos de aprendizado
profundo é a retropropagação, usada para o treinamento a rede (Balduzzi, 2015),
como vimos anteriormente.
Além disso, não há linguagem comum para descrever e analisar
algoritmos de aprendizado profundo, possibilitando diversas abordagens. As
redes de aprendizagem profunda têm tido bastante sucesso em resolver
diversos problemas de classificação. Nesses casos, as dificuldades implicam em
fornecer conjuntos de dados confiáveis para o treinamento em que as redes
possam encontrar padrões similares para as categorias e assim obter sucesso
no processo de classificação.
Apesar de grandes avanços, Hawkins et al. (2016) argumentam que as
redes neurais não funcionam replicando na íntegra todos os padrões cerebrais
conhecidos e, portanto, não refletem verdadeiramente o funcionamento do
cérebro. Portanto, do ponto de vista da neurociência, pode-se afirmar que os
sistemas baseados em arquiteturas conexionistas também carecem de
generalidade na solução de problemas da maneira que o cérebro humano
trabalha.
9
5) Na geração de imagens médicas (por exemplo, tecnologia para
reconhecimento do câncer em imagens que está sendo desenvolvida e
testada nos EUA em parceira com a Google).
10
processamento sequencial padrão). O desenvolvimento de hardware é a
chave para o futuro das redes neurais e grande potencial de agregação
de valor.
11
computação cognitiva se baseia em modelos de redes neurais e modelos
estatísticos e probabilísticos de aprendizado em profundidade (Deep Learning),
como já vimos (IBM, 2018).
Os avanços recentes na disciplina de computação — tais como
“computadores de alto desempenho, chips neuromórficos, neurocams, Big Data,
aprendizado de máquina, modelagem preditiva, processamento de linguagem
natural e computação em nuvem” (Gudivada, 2016, p. 4) — estão auxiliando os
avanços nas ciências cognitivas e nas disciplinas de computação cognitiva.
Dada a origem interdisciplinar da ciência cognitiva e da ciência de dados, existem
várias perspectivas sobre elas moldadas por diversas aplicações de rápida
evolução com o uso de diversas tecnologias (Gudivada, 2016).
As arquiteturas cognitivas modelam o desempenho humano em múltiplas
funções cognitivas e tarefas. Estas arquiteturas computacionais especificam a
estrutura e as funções dos sistemas cognitivos, bem como a forma como elas
interagem entre si (Gudivada, 2016).
As teorias da ciência cognitiva fornecem estruturas para descrever vários
modelos de cognição humana, incluindo como a informação é representada e
processada pelo cérebro. O cérebro humano talvez seja o sistema mais
complexo em termos de estrutura e função. Os processos mentais do cérebro
abrangem um amplo espectro, tais como “percepção visual e auditiva, atenção,
memória, imagens, resolução de problemas e compreensão da linguagem
natural” (Gudivada, 2016, p. 7).
Os filósofos colocam questões amplas sobre a natureza da mente e a
relação entre a mente e os processos de pensamento. Eles também discutem
hipóteses para explicar a mente e seus processos mentais. O principal método
de investigação dos filósofos é o raciocínio dedutivo e indutivo. Os psicólogos
cognitivos projetam experimentos e os executam sob condições controladas
para validar hipóteses e desenvolver teorias cognitivas (Neisser, 2014).
Os estudos da psicologia cognitiva visam descobrir como o pensamento
funciona. Tais estudos abrangem, por exemplo, como especialistas resolvem
problemas em comparação com iniciantes, quão curta é a memória de curto
prazo e por que as pessoas mais incompetentes são as menos conscientes de
sua própria incompetência (Gudivada, 2016).
12
A disciplina da psicologia evolucionista explica os processos mentais
humanos usando a teoria da seleção. Mais especificamente, ela usa princípios
evolutivos para explicar adaptações psicológicas, como mudanças em nosso
pensamento para melhorar nossa sobrevivência. Os neurocientistas empregam
instrumentos de engenharia e métodos científicos para medir a atividade
cerebral em resposta a estímulos externos (Mcclelland; Ralph, 2015).
Por exemplo, técnicas de ressonância magnética funcional, tomografia de
emissão de pósitrons e tomografia computadorizada axial são usadas para
identificar regiões cerebrais específicas associadas a várias tarefas cognitivas.
Uma neurocam é uma câmera montada na cabeça que monitora as ondas
cerebrais. Quando pessoa que usa esse dispositivo olha para algo que causa
um pico na atividade cerebral, a atividade é registrada automaticamente. Esse
aparato é utilizando apenas em laboratórios de pesquisa (Gudivada, 2016).
A computação cognitiva emprega as teorias, métodos e ferramentas da
disciplina de computação para modelar tarefas cognitivas. Os meios para
representar e armazenar informações em um computador têm pouca ou
nenhuma semelhança com o cérebro humano (Gudivada, 2016).
As tecnologias que viabilizam os sistemas de computação cognitiva
incluem “IA, aprendizado de máquina, visão computacional, robótica,
reconhecimento e entendimento de idiomas escritos e falados, recuperação de
informações, Big Data, Internet das Coisas (IoT) e computação em nuvem”
(Gudivada, 2016, p. 6).
Os sistemas de computação cognitiva são fundamentalmente diferentes
dos sistemas de computação tradicionais. Os sistemas cognitivos são
adaptáveis, aprendem e evoluem ao longo do tempo e incorporam o contexto à
computação. Eles sentem seu ambiente, pensam e agem de forma autônoma e
lidam com informações incertas, ambíguas e incompletas.
O sistema Deep Blue, da IBM, que derrotou o campeão mundial de xadrez
Garry Kasparov em 1997, não é considerado um sistema de computação
cognitiva, pois usou uma pesquisa exaustiva no planejamento de seus
movimentos. Por outro lado, o IBM Watson, de 2011, é um sistema de
computação cognitiva. Ele usa “profundo entendimento da linguagem natural,
incorpora informações contextuais em sua tomada de decisão e raciocina com
13
dados incompletos e incertos”. Ele executa raciocínio espacial e temporal e pode
reconhecer padrões em texto em linguagem natural (Gudivada, 2016, p. 7).
Com rápidos avanços na ciência cognitiva e na ciência de dados, os
aplicativos de computação atuais incorporam graus variados de recursos
cognitivos. Por exemplo, as capacidades cognitivas permitem que carros
autônomos aprendam com experiências passadas e usem informações
contextuais para tomar decisões em tempo real. Já assistentes cognitivos, como
o Google Now, preveem e sugerem as próximas ações dependentes do contexto
(Gudivada, 2016).
Para traduzir o conteúdo das páginas da web para diferentes idiomas, as
tecnologias cognitivas alcançaram níveis de precisão sem precedentes. Avanços
transformadores no reconhecimento de fala e no entendimento do idioma são
usados para tarefas de tradução e compreensão de fala em tempo real, e já
temos equipamentos à venda com essa tecnologia embarcada. A IoT cognitiva
e as tecnologias de Big Data são usadas em cidades inteligentes para melhorar
a segurança pública e a eficiência das operações de infraestrutura (Wu et al.,
2014).
14
Todavia, a quantidade de dados gerados exige um alto poder de
processamento para que esses padrões sejam identificados. Por isso, ainda há
a necessidade de evolução de hardware e popularização dos processadores
quânticos.
Ainda há resistência quanto ao uso de soluções cognitivas pelas
organizações, que muitas vezes pode estar associada às experiências do
passado. Podemos tomar como exemplo os assistentes de telefonia que exibiam
dificuldade na compreensão das solicitações e também limitação no conjunto de
respostas (IBM, 2018). Sendo assim, essa é uma das barreiras que a
computação cognitiva tem de lidar, junto às limitações de hardware e à evolução
de tecnologias comentadas no parágrafo anterior.
No entanto, diante dos imensos avanços nas tecnologias cognitivas,
principalmente nas áreas de reconhecimento de voz e imagem, essas barreiras
estão caindo. Segundo a IBM (2018), em diversos casos, incluindo Brasil e
América Latina, gestores das organizações têm buscado soluções de IA que os
ajudem a solucionar problemas específicos a fim de obter vantagem competitiva
e redução de trabalhadores em funções que podem ser automatizadas (IBM,
2018).
O fato é que a computação cognitiva se apresenta como uma tecnologia
com um grande poder para as organizações que estão dispostas a aprender e a
compreender seu uso e extrair benefícios para a organização.
Para Feldman (2019), podemos esperar que a computação cognitiva
ainda possa executar as seguintes tarefas com um alto índice de assertividade:
15
congregar a tecnologia às necessidades do cotidiano das organizações e das
pessoas, torna-se possível criar novas tendências e com isso inovar, o que é um
agente propulsor dos negócios.
Portanto, devemos estar preparados para as tecnologias futuras e
necessitamos compreender como elas podem modificar nossa sociedade,
economia e o modo como as organizações atuam. A destruição criativa, como
disse Joseph Schumpeter, continua ativa e faz com que organizações e setores
consolidados busquem e criem aberturas para novos modelos de negócio com
a propulsão das tecnologias da computação cognitiva que podem transformar
estas organizações e setores.
TROCANDO IDEIAS
No decorrer desta aula, vimos sobre a ciência cognitiva e sua relação com
os modelos de redes neurais da IA. Aprendemos também sobre o Deep
Learning, que está sendo amplamente utilizado em soluções de IA para resolver
problemas de dados domínios. Visto que já temos a compreensão do
funcionamento da Deep Learning, faça uma busca na web para identificar quais
são os seus aspectos preponderantes — tanto positivos quanto negativos —
quando comparada à Machine Learning. Usando o fórum, compartilhe com seus
colegas esses aspectos, verifique os apontamentos dos colegas e diga se
concorda ou não, evidenciando o porquê.
NA PRÁTICA
16
c) O processo de aprendizagem de uma Rede Neural é uma “caixa aberta”
que os pesquisadores podem identificar como ocorre cada uma das
etapas do raciocínio. _________________________________________
__________________________________________________________
d) A ciência cognitiva é uma área de estudo disciplinar, isto é não depende
e nem se correlaciona com nenhuma outra área para realizar seus
estudos e evoluir. ____________________________________________
__________________________________________________________
e) O Watson da IBM é um sistema de computação cognitiva. ___________
__________________________________________________________
2) Identifique na web duas aplicações que usam a Deep Learning para
melhorar a vida das pessoas e use a wiki para descrever essa aplicação,
indicando a área e o contexto pelo qual ela foi desenvolvida, seus
objetivos e quais são as contribuições para as pessoas desta aplicação.
FINALIZANDO
17
Na sequência, discutimos sobre os impactos da computação cognitiva nas
organizações e como esta é uma ferramenta que pode transformar o modo que
trabalhamos hoje, auxiliando as organizações a inovarem e terem vantagem
competitiva sob as demais. No entanto, tanto as Redes Neurais quanto a
computação cognitiva ainda possuem um árduo caminho para trilhar até
atingirem seus objetivos, que vêm desde a criação da IA, na busca de realizar
raciocínio lógico para solução de problemas complexos tal como o ser humano.
18
REFERÊNCIAS
19
NEWELL, A; SIMON, H. A. GPS, a program that simulates human thought.
RAND CORP SANTA MONICA CALIF, 1961.
20