Imagem de processamento quântico com inteligência artificial - Adobe Stock
Decodificar
pensamentos a partir de registros do cérebro
Neurociência já consegue reconstruir imagens mentais com
ajuda da inteligência artificial, mas mistério da subjetividade permanece
A
notícia de que um "novo modelo de IA consegue reproduzir o que você está
pensando com 80% de acurácia", como
reportado pela Revista Fortune, espalhou-se rapidamente e causou furor. Não
foi a primeira vez.
Desde
2011, pipocam
notícias de representações mentais reconstruídas a partir de registros
de atividade cerebral decodificada por algoritmos, o que não é bom sinal para
quem está atrás de uma fantasia de controle mental para chamar de sua.
A
diferença é que as reconstituições tornaram-se fidedignas. Um feito e tanto.
Mas, será que podemos chamá-las, indiscriminadamente, de reproduções do
pensamento? O estudo reportado envolveu sujeitos (3) vendo fotografias em uma
tela, enquanto mensurações indiretas da atividade cerebral eram efetuadas.
Ou
seja, a tarefa foi inteiramente pautada pela observação, sem qualquer
tratamento cognitivo subsequente. Por outro lado, será que a percepção separa-se
completamente do ato de pensar? Até que ponto quem vê apenas observa, e não
reflete?
Essas
são algumas das perguntas que vêm à tona, conforme as neurociências da
reconstrução das experiências mentais progridem. Antes de respondê-las e passar
para um tópico interessante sobre a natureza do funcionamento da mente, que
esse tipo de estudo ajuda a desvendar, vale a pena conhecer um pouco sobre a
capacidade de ver (sensorial) e a de enxergar (afetivo-cognitiva).
Por
trás da reconstrução de cenas visualizadas: princípios cerebrais
A
visão é organizada de maneira majoritariamente hierárquica. Conforme os
impulsos nervosos atingem diferentes instâncias, as computações neurais ganham
maior complexidade. A retina, que converte os fótons em impulsos nervosos, possui
fotorreceptores específicos para discriminar luz e cor.
Estes
sinais passam por núcleos organizacionais, como o geniculado do tálamo, e
chegam às áreas primárias do córtex occipital, que ocupa uma porção grande do
nosso cérebro, quase que exclusivamente dedicada ao processamento visual.
Ali,
a orientação de linhas, profundidade e cor são computadas, num pingue e pongue
com a decodificação das formas, movimento, volumetria e outros aspectos
determinantes da percepção.
Os
subprodutos são transmitidos para áreas dedicadas à imediaticidade responsiva,
responsáveis pela nossa capacidade de refrear o movimento quando detectamos uma
cobra, antes mesmo de entendermos claramente isso; e para áreas que dão sentido
cultural, biográfico e subjetivo ao estímulo, por meio de associações com
experiências pregressas, determinação do seu tom afetivo, correlação com
palavras e assim por diante (acesse
aqui para conhecer mais).
As
computações neurais que dão sentido às imagens mentais não apenas acrescentam
algo aos códigos neurais que recebem, como emitem projeções em direção às áreas
primárias do córtex occipital, influenciando a seleção do que enxergamos e a
maneira como o fazemos. Neste sentido, atuam como sensores de relevância no
escrutínio informacional do mundo exterior.
A
visão não se reduz a um processo de decodificação de estímulos, sendo também
uma dinâmica decisória e de preenchimento de lacunas na formação de unidades
coesas, ou gestalts. Esta é a base neurológica da tese de que o mundo percebido
é influenciado por nossas aspirações e desejos, reconhecidos e inconscientes.
Vemos como somos; enxergamos como suportamos.
Quando
os olhos não estão mais sendo estimulados, é comum que as representações
mentais formadas mantenham-se ativadas. Elas entram em uma fase que chamamos de
memória recente, a qual tem menos a ver com o que faz um HD, ou mesmo com o
cache de um PC, do que com atenção sustentada, atividade que aceita pouco
paralelismo e gasta muita energia.
O domínio
representacional em que isso se dá é a consciência, que neste sentido
se manifesta como um campo de priorização de fenômenos gerados pelo próprio
cérebro, mesmo nas situações em que identificamos, de maneira inconteste, tais
ocorrências com o mundo exterior.
Com
muita boa vontade, dá para chamar estas representações identificadas de maneira
direta com o mundo exterior de pensamentos e, por consequência, sua
decodificação de leitura destes.
Com
menos boa vontade, tal fronteira pode ser estabelecida pelas imagens mentais
que surgem à consciência sem estimulação sensorial direta ou, ainda mais
rigorosamente, pelas dinâmicas mentais que sintetizam ideias dispersas ou
promovem a expansão das possibilidades de entendimento de maneira exploratória.
Filmes e não fotos.
O
pensamento visual não é uma categoria do tipo tudo ou nada, mas um domínio
contínuo, que começa na percepção, avança um pouco quando mantemos na memória
uma imagem que não mais possui um duplo estimulando nossas retinas, dá um salto
nos casos de reconstrução de imagens mentais livres e ganha contornos plenos
quando essas coisas todas são inseridas em dinâmicas que alteram o grau de
desordem mental de maneira propositiva.
Com
isso, dá para retomar as perguntas da introdução: aquele que observa, em certo
nível, pensa, já que seleciona e ativamente preenche suas representações do
mundo exterior. Por outro lado, adotando uma metáfora espacial, isso acontece
bem pertinho da porta de entrada do mundo do pensamento.
Em
suas câmaras principais, este está comprometido com o trânsito das
representações mentais, as quais sequer costumam ser puramente visuais, ainda
que isso seja possível. A Fortune foi infeliz na sua caracterização do feito,
que não é bem leitura do pensamento, exceto para se tentar vender mais algumas
assinaturas da revista.
Leituras
de mentalizações usam medidas indiretas das mesmas
A
reconstrução de representações visuais induzidas experimentalmente divide-se
nos seguintes tipos: recriação daquilo que as pessoas estão vendo em tela; de
imagens mentais sustentadas após o término da fase de exposição; de
representações imaginárias da vigília, ou de sonhos. Trânsitos cognitivos, com
aplicação de processos lógicos formais ou heurísticas, seguem fora de alcance.
O
estudo que está fazendo sucesso atualmente, como descrito, é do primeiro tipo e
utiliza chapas de ressonância magnética em disposição ‘funcional’ (RMf). O
princípio é simples: enquanto robôs possuem baterias centrais que distribuem a
energia para todas as partes, o cérebro consome energia localmente para
processar informações.
Isso
é feito pelas mitocôndrias, que transformam glicose + oxigênio, em água +
energia. Esta é a respiração. Portanto, enquanto nosso sistema cognitivo inicia
o tratamento de informações, nosso sistema vascular aumenta o aporte de sangue
oxigenado nas áreas cerebrais relacionadas para que haja energia. A RMf é um
registro do trânsito do sangue oxigenado nas áreas ativadas por estes processos
mentais.
Dado
que as porções primárias do córtex occipital dedicam-se a informações
elementares, como linhas, formas e cores, o problema a ser resolvido é de
reconhecimento de padrões envolvendo este tipo de coisa e não, por exemplo,
impacto afetivo ou associações, como seria o caso se estivéssemos no domínio da
reconstrução de traumas psicológicos ou repressões.
O
procedimento envolve a criação de modelos preditivos, customizados, do papel
dos pixels da ressonância, conhecidos como voxels, e a subsequente extrapolação
para novas imagens.
A
customização é necessária porque cada cérebro possui as suas especificidades.
Assim, os participantes são expostos a milhares de imagens para que a IA
extraia estes padrões: linhas, formas, cores etc. No experimento em questão,
cada sujeito passou mais de 40 horas no scanner, distribuídas por vários dias.
A ressonância não produz radiação ionizante, não trazendo riscos.
Vencida
esta etapa, é preciso reconstruir a imagem, a partir das correlações entre os
voxels das neuroimagens e os pixels das fotos. É aí que mora o desafio: mesmo
nas partes mais básicas do córtex occipital, o processamento não é linear, o
que impede a elaboração de dicionários individualizados de voxels, com
correspondências em pixels fotográficos.
A
solução inovadora é usar o stable difusion, IA de produção de imagens que se
tornou uma verdadeira febre, para a reconstrução das imagens (mais
sobre os procedimentos experimentais aqui). O insight tem a ver com a ideia
de converter as neuroimagens em prompts (solicitações) para o algoritmo, que
então executa a reconstrução, usando um conhecido método de adição e remoção
sequenciada de ruídos, que mascaram/desmascaram a imagem, descrito aqui.
A
taxa de sucesso passa de 80%, o que é bem impressionante, considerando que cada
voxel recobre centenas de milhões de neurônios e o aporte sanguíneo é muito mais
lento do que a produção mental, não estando em nada sincronizado com a
experiência visual. O mesmo pode ser feito com ondas cerebrais (EEG). Isto é
vantajoso por um lado, já que a correlação temporal torna-se mais afinada, mas
desvantajoso por outro, dado que o oposto ocorre espacialmente.
Decodificando
representações mentais livres por meio de registros cerebrais
Uma
conclusão experimental que vem à tona quando cotejamos a reconstrução de
imagens observadas com a de imagens mentais livremente imaginadas é que a
atividade cerebral tende a ser atenuada neste segundo caso.
Isso
faz todo o sentido, uma vez que, em termos evolucionários, memória e imaginação
estão a serviço da otimização da relação com o mundo exterior, a qual precisa
estar mais diretamente acoplada ao comportamento. A importância dessa
perspectiva para a filosofia da mente e para a compreensão das psicoses não
deve ser menosprezada.
Ao
mesmo tempo, as áreas do cérebro envolvidas na atribuição de sentido, isto é,
categorização, associação com memórias, injeção de tom afetivo e afins,
tornam-se essenciais à decodificação imaginária, não sendo tão essencial à
recriação de estímulos observados —eis outra conclusão de valor inestimável
para quem se interessa pelo funcionamento da mente.
Partindo
desses pressupostos, um manuscrito, que ainda não saiu em uma revista
científica, traz um experimento voltado à decodificação de figuras imaginadas
(10 imagens naturais e 15 figuras) e afirma ter tido sucesso no processo.
Infelizmente,
o texto não inclui um descritivo detalhado do procedimento usado para estimular
a imaginação das imagens, nem tampouco a taxa de sucesso do procedimento. A
maioria das tentativas anteriores fracassou (sucesso < 30%).
Uma
exceção parcial foi descrita em um estudo envolvendo o uso de registros de fMRI
para identificar imagens alucinadas durante a transição da vigília para o sono,
"leitura dos sonhos", na linha da Fortune.
Este
estudo restringiu-se ao tagueamento verbal dos sonhos (e.g., sonho com cadeira,
pessoa, gato) e obteve 60% de sucesso, em alguns casos. Nada mal. Reconstruções
de miolos de sonhos permanecem no domínio da ficção, possivelmente, por pouco
tempo.
Até
que ponto as coisas que imaginamos passam em nosso cérebro como um filminho?
A
questão mais profunda que essa linha de pesquisas traz é se as experiências
mentais duplicam a realidade que conhecemos através de imagens, filmes e, mais
amplamente, das nossas inferências sobre o mundo exterior, ou se o cérebro
funciona de maneira diferente.
Séculos
de especulações levaram-nos a assumir que este segundo é o caso, ao passo que a
reconstrução de conteúdos mentalizados parece indicar o primeiro.
Será
que, ao fim e ao cabo, iremos descobrir que a realidade imaginada,
e mesmo sonhada, estende-se em um contínuo representacional com a ficção e os
documentários? Será que, no futuro, sonhos serão como stock video,
disponíveis por R$ 29,90, para quem quiser comprá-los para assistir em casa ou
mesmo usá-los em suas produções criativas?
A
verdade parece se situar no meio do caminho. A capacidade de decodificação
sugere que representações mentais não são etéreas ou inacessíveis e tudo indica
que em breve seremos capazes de extrair trechos ininterruptos do cérebro, tanto
na forma de trânsitos de pensamentos, quanto de miolos de sonhos.
Porém,
a ideia de que estas produções mentais terão a linearidade e a explicabilidade
intrínseca das narrativas socializadas contrasta com o que conhecemos a partir
de relatos literários e clínicos. O equívoco elementar sob o mecanicismo da
hipótese de que a mente passa filminhos é ignorar um século de evidências
acumuladas que apontam o contrário.
Representações
mentais tendem a funcionar mais como marcadores de sentidos do que como
histórias contadas para uma audiência que desconhece o seu enredo. Estes
marcadores tanto combinam imagens, cenas, frases, sons e mais, quanto geram
formas híbridas de representação, sem paralelos no mundo compartilhado.
As
neurociências estão prestes a transitar para esta fase em que discutiremos
temas como sonhos, imaginação e metáforas de relevância pessoal com essas
coisas todas projetadas em vídeo, ou melhor, em VR.
O
que não dá para esperar é que se tornem menos misteriosas do ponto de vista
subjetivo, já que há algo de intrinsecamente incomunicável nas representações
mentais de cada um. Assim é a condição humana.
Neurocientista, professor livre-docente da Unifesp
(Universidade Federal de São Paulo) e sócio do Instituto Locomotiva e da WeMind