^
A
A
A

Como o cérebro entende que há algo a aprender

 
Alexey Kryvenko, Revisor Médico
Última revisão: 23.08.2025
 
Fact-checked
х

Todo o conteúdo do iLive é medicamente revisado ou verificado pelos fatos para garantir o máximo de precisão factual possível.

Temos diretrizes rigorosas de fornecimento e vinculamos apenas sites de mídia respeitáveis, instituições de pesquisa acadêmica e, sempre que possível, estudos médicos revisados por pares. Observe que os números entre parênteses ([1], [2], etc.) são links clicáveis para esses estudos.

Se você achar que algum dos nossos conteúdos é impreciso, desatualizado ou questionável, selecione-o e pressione Ctrl + Enter.

21 August 2025, 10:23

Um artigo de neurobiólogos da Carnegie Mellon foi publicado no Cell Reports, que explica um dos fatos mais mundanos, porém misteriosos, sobre o aprendizado: por que o cérebro "imprime" plasticidade quando um estímulo realmente prevê algo (uma recompensa) e não o faz quando não há conexão. Os autores mostraram que, durante o aprendizado por bigodes em camundongos, os interneurônios da somatostatina (SST) no córtex somatossensorial enfraquecem gradualmente seu efeito inibitório sobre os neurônios piramidais nas camadas superficiais - e somente se o estímulo estiver associado a uma recompensa. Se o estímulo e a recompensa forem separados no tempo (não houver contingência), a inibição não muda. Assim, o cérebro "entende" que há algo a aprender e transfere localmente a rede para um estado de plasticidade facilitada.

Contexto do estudo

O cérebro não aprende continuamente, mas em "pedaços": janelas de plasticidade se abrem quando um novo sinal sensorial de fato prevê algo — um resultado, uma recompensa, uma consequência importante. No córtex, essa "torneira" de aprendizado é amplamente acionada pela rede inibitória de interneurônios. Suas diferentes classes desempenham funções distintas: as células PV "comprimem" rapidamente a descarga das pirâmides, as células VIP frequentemente inibem outros neurônios inibitórios e os interneurônios SST têm como alvo os dendritos distais das pirâmides e, assim, regulam quais entradas (sensoriais, de cima para baixo, associativas) têm a chance de passar e se consolidar. Se os SSTs seguram o "volante" com muita força, os mapas corticais se mantêm estáveis; se eles se soltam, a rede se torna mais suscetível à reestruturação.

Modelos clássicos de aprendizagem preveem que a contingência (uma ligação rígida entre estímulo e recompensa) é a chave para o início da plasticidade. Neuromoduladores (acetilcolina, norepinefrina, dopamina) transmitem uma "pontuação de saliência" e um sinal de erro de predição para o córtex, mas ainda precisam de um interruptor local no nível do microcircuito: quem exatamente e em que lugar do córtex "libera o freio" para que os dendritos dos neurônios piramidais possam integrar combinações úteis de entradas? Evidências dos últimos anos sugerem que as células SST frequentemente assumem esse papel, pois regulam a atividade dos dendritos ramificados – o local onde o contexto, a atenção e o próprio traço sensorial são formados.

O sistema sensório-motor dos bigodes do rato é uma plataforma conveniente para testar isso: é bem mapeado em camadas, é fácil de associar com reforço e suas mudanças plásticas são detectadas de forma confiável pela eletrofisiologia. Sabe-se que, ao assimilar associações, o córtex alterna entre o modo de "filtragem estrita" e o modo de "despressurização seletiva" — a excitabilidade dendrítica aumenta, as sinapses são fortalecidas e o reconhecimento de diferenças sutis melhora. Mas uma questão crítica permanece: por que isso acontece apenas quando o estímulo realmente prevê uma recompensa, e qual nó no microcircuito permite tal troca?

A resposta é importante não apenas para a neurociência básica. Na reabilitação após um AVC, no treinamento auditivo e visual, no ensino de habilidades, construímos intuitivamente lições em torno do feedback oportuno e do "significado" das ações. Compreender como exatamente o circuito SST ao longo das camadas do córtex abre (ou não) uma janela de plasticidade na presença (ou ausência) de contingência nos aproxima de protocolos direcionados: quando vale a pena fortalecer a desinibição e quando, ao contrário, manter a estabilidade dos mapas para não "abalar" a rede.

Como isso foi testado?

Os pesquisadores treinaram camundongos para fazer uma associação sensorial de toque de bigode → recompensa e, em seguida, registraram a inibição sináptica de interneurônios SST para células piramidais em diferentes camadas em fatias cerebrais. Essa "ponte" entre a tarefa comportamental e a fisiologia celular nos permite separar o fato da aprendizagem da atividade de fundo da rede. Os principais grupos de controle receberam um protocolo "desacoplado" (estímulos e recompensas sem conexão): não ocorreu enfraquecimento da inibição SST, ou seja, os neurônios SST são sensíveis precisamente à contingência estímulo-recompensa. Além disso, os autores usaram a supressão quimiogenética de SST fora do contexto de treinamento e fenocopiaram a depressão observada em contatos SST de saída, uma indicação direta do papel causal dessas células no desencadeamento da "janela de plasticidade".

Principais resultados

  • "Desbloqueio" localizado de cima: uma diminuição a longo prazo na inibição da SST foi detectada em neurônios piramidais das camadas superficiais, enquanto nenhum efeito semelhante foi observado nas camadas profundas. Isso indica especificidade da desinibição no córtex para cada camada e alvo.
  • A contingência é decisiva: quando o estímulo e a recompensa são “desvinculados”, não há mudanças plásticas - a rede não é transferida para o modo de aprendizagem “em vão”.
  • Causa, não correlação: a redução artificial da atividade do SST fora do treinamento reproduz o enfraquecimento das saídas inibitórias para as pirâmides (fenocópia do efeito), indicando que os neurônios do SST são suficientes para desencadear a desinibição.

Por que isso é importante?

Nos últimos anos, muito se tem sugerido que a plasticidade cortical frequentemente começa com uma breve "despressurização" da inibição – particularmente via células de parvalbumina e somatostatina. O novo trabalho vai um passo além: mostra uma regra para desencadear essa despressurização. Não é qualquer estímulo que "libera os freios", mas apenas aqueles que fazem sentido (prevêem uma recompensa). Isso é econômico: o cérebro não reescreve sinapses sem razão e preserva detalhes onde eles são úteis para o comportamento. Para as teorias da aprendizagem, isso significa que o circuito SST atua como um detector causal e uma "porta de entrada" para a plasticidade nas camadas superficiais onde convergem as entradas sensoriais e associativas.

O que isso diz aos praticantes (e o que não diz)

- Educação e reabilitação:

  • As "janelas" de plasticidade nos mapas corticais sensoriais parecem depender da significância do conteúdo - é preciso haver uma conexão explícita estímulo→resultado, não apenas repetição.
  • Treinamentos em que a recompensa (ou feedback) é vinculada ao estímulo/ação têm maior probabilidade de serem eficazes em desencadear mudanças.

- Neuromodulação e farmacologia:

  • Atingir o circuito SST é um alvo potencial para melhorar o aprendizado após um acidente vascular cerebral ou em distúrbios perceptivos; no entanto, esta ainda é uma hipótese pré-clínica.
  • É importante ressaltar que a especificidade da camada do efeito sugere que intervenções “amplas” (estimulação/sedação geral) podem obscurecer mudanças benéficas.

Como esses dados se encaixam no campo?

O trabalho dá continuidade à linha de pesquisa da equipe, onde anteriormente descreveram mudanças específicas de camada e tipo na inibição durante o aprendizado e enfatizaram o papel especial dos interneurônios SST no ajuste das entradas para os neurônios piramidais. Aqui, uma variável crítica é adicionada – a contingência: a rede "solta os freios" apenas na presença de uma conexão causal estímulo→recompensa. Isso ajuda a reconciliar contradições anteriores na literatura, onde a desinibição às vezes era observada e às vezes não: a questão pode não estar no método, mas em se havia algo a aprender.

Restrições

Isto é o córtex sensorial do camundongo e a eletrofisiologia de cortes acentuados; a transferência para a aprendizagem declarativa de longo prazo em humanos requer cautela. Observamos uma depressão de longo prazo (mas não ao longo da vida) das saídas de SST; por quanto tempo isso persiste na rede viva e como exatamente se relaciona com o comportamento além da tarefa de bigode é uma questão em aberto. Finalmente, existem múltiplas classes de neurônios inibitórios no córtex; trabalhos atuais destacam a SST, mas o equilíbrio entre as classes (PV, VIP, etc.) em diferentes tipos de aprendizagem ainda precisa ser descrito.

Para onde ir em seguida (o que é lógico verificar)

  • "Janelas" temporais: largura e dinâmica da "janela de plasticidade" dependente de SST em diferentes taxas de aprendizagem e tipos de reforço.
  • Generalização para outras modalidades: córtex visual/auditivo, aprendizagem motora, circuitos pré-frontais de tomada de decisão.
  • Neuromarcadores em humanos: indicadores não invasivos de desinibição (por exemplo, paradigmas TMS, assinaturas MEG) em tarefas com contingência evidente e ausente.

Fonte do estudo: Park E., Kuljis DA, Swindell RA, Ray A., Zhu M., Christian JA, Barth AL Neurônios de somatostatina detectam contingências de estímulo-recompensa para reduzir a inibição neocortical durante o aprendizado. Cell Reports 44(5):115606. DOI: 10.1016/j.celrep.2025.115606

You are reporting a typo in the following text:
Simply click the "Send typo report" button to complete the report. You can also include a comment.