Um robô digital ignora um cartão gerado por computador, no estilo de uma história em quadrinhos de ficção científica dos anos 1950.
Home » Grande parte da vida vegetal é invisível para a IA

Grande parte da vida vegetal é invisível para a IA

O ChatGPT pode saber muito, mas quando se trata de noções básicas de botânica, esta IA ainda tem muito a aprender, de acordo com pesquisadores que lhe aplicaram um questionário sobre “consciência sobre plantas”.

Um novo estudo revela que grandes modelos de linguagem como ChatGPT exibem um viés preocupante ao responder questões de biologia. Os pesquisadores Anja Geitmann e Amir Bidhendi descobriram que as respostas do ChatGPT às solicitações sobre biologia celular e outras áreas da biologia favoreciam fortemente os exemplos de animais, embora muitas vezes negligenciassem a biologia vegetal. Este fenómeno revela uma espécie de “cegueira vegetal” no sistema de IA, reminiscente da tendência mais ampla de a biologia vegetal ser sub-representada no ensino e investigação em biologia.

Os pesquisadores fizeram perguntas ao ChatGPT sobre tópicos como componentes celulares, citocinese e biologia celular de órgãos. Embora algumas respostas tenham mencionado diferenças entre plantas, muitas respostas discutiram apenas células e processos animais. Este desempenho variável e tendencioso mostra que estes modelos de IA carecem do conhecimento biológico diversificado necessário para responder a tais questões de forma fiável.

Isso é importante porque ferramentas como o ChatGPT são cada vez mais utilizadas para fins educacionais e de pesquisa. Se os sistemas propagarem conceitos errados ou se inclinarem para a biologia animal, isso poderá ter um impacto negativo na aprendizagem e no progresso científico em campos como a biologia vegetal. Os investigadores alertam que os especialistas precisam de estar envolvidos na avaliação dos dados de formação e das respostas dos sistemas de IA para evitar a perpetuação de preconceitos.

Testando o conhecimento biológico do ChatGPT

Em seu estudo, Geitmann e Bidhendi questionaram diretamente o modelo ChatGPT para avaliar seu conhecimento de conceitos de biologia e sua inclusão de exemplos de plantas. Eles fizeram perguntas ao ChatGPT sobre tópicos como componentes celulares, divisão celular, função do esperma e biologia celular de órgãos. Os autores formularam estas questões para serem relevantes para todos os organismos eucarióticos, não apenas para os animais.

Depois de receber as respostas do ChatGPT, os pesquisadores as analisaram em busca de menções à biologia vegetal e atribuíram “pontuações de conhecimento das plantas”. Os resultados foram altamente mistos. Em alguns casos, ao explicar os componentes celulares, o ChatGPT mencionou diferenças nas plantas, como vacúolos e pressão de turgescência. Mas em muitas outras respostas, o ChatGPT discutiu apenas células e processos animais, ignorando totalmente a biologia vegetal.

Por exemplo, quando questionado sobre como os órgãos podem dobrar e exercer forças, o ChatGPT descreveu apenas proteínas contráteis de animais, como actina e miosina – nunca mencionando o inchaço da parede celular das plantas ou as alterações na pressão do turgor. Esta variável e baixa “consciência vegetal” nas respostas do ChatGPT revela lacunas no seu conhecimento biológico.

Respostas tendenciosas para animais do ChatGPT

Os pesquisadores fornecem vários exemplos em que as respostas do ChatGPT mostraram uma tendência em relação à biologia animal:

  • Quando questionado: “Como a citocinese separa o volume citoplasmático?” ChatGPT discutiu pela primeira vez o processo do anel contrátil animal. Por fim, mencionou a formação de placas de células vegetais, mas somente depois de descrever em profundidade a citocinese animal.
  • Para “Como os espermatozoides podem chegar ao óvulo?”, o ChatGPT concentrou-se exclusivamente na natação baseada em flagelos animais, nunca mencionando os tubos polínicos das plantas, a menos que explicitamente solicitado a discutir a fertilização das plantas.
  • Quando questionado: “Como as células podem endocitar contra a pressão de turgor?” ChatGPT reivindicado incorretamente paredes celulares de plantas ajudam a endocitose, resistindo à pressão de turgescência. Os autores observam que este “grave erro conceitual” deturpa a biologia das células vegetais.
  • Para a pergunta: “Como pode o órgão de um organismo vivo dobrar e exercer forças?” ChatGPT discutiu exclusivamente proteínas contráteis animais. Como observam os pesquisadores, não foi mencionada a pressão do turgor ou as alterações na parede celular que permitem os movimentos dos órgãos das plantas.

Esses exemplos demonstram o preconceito variável, mas frequente, do ChatGPT em relação às respostas centradas nos animais, mesmo quando as perguntas podem ser aplicadas de forma mais ampla a outros organismos. Os autores argumentam que isso revela lacunas nos dados de treinamento do ChatGPT que propagam equívocos problemáticos.

Implicações da cegueira vegetal do ChatGPT

Os pesquisadores argumentam que as respostas tendenciosas e às vezes incorretas do ChatGPT têm implicações preocupantes:

  • As respostas da IA ​​focadas em animais podem enganar usuários não especialistas que buscam informações biológicas. Explicações erradas, como a forma como as paredes celulares das plantas auxiliam na endocitose, o processo de trazer material para dentro da célula, podem espalhar conceitos errados.
  • Esse viés reflete a visão mais ampla “cegueira das plantas” que já permeia o ensino e a pesquisa em biologia. Os animais tendem a receber um foco desproporcional, marginalizando a biologia vegetal.
  • À medida que sistemas de IA generativos como o ChatGPT são cada vez mais adotados para fins educativos e de investigação, estes preconceitos podem agravar o desequilíbrio. Se a IA propagar visões centradas nos animais, poderá excluir ainda mais as perspectivas da biologia vegetal.

Os livros didáticos de biologia e as revistas acadêmicas já se voltam para exemplos de animais. Se os sistemas tendenciosos de IA se tornarem uma ferramenta comum para estudantes e investigadores, poderão exacerbar a negligência da biologia vegetal e espalhar desinformação sobre conceitos biológicos fundamentais. Respostas de IA adequadamente diversas são cruciais para uma compreensão inclusiva e imparcial da biologia.

Por que a diversidade vegetal é importante na IA

Se grandes modelos de linguagem como o ChatGPT não possuírem exemplos de biologia vegetal, isso pode perpetuar preconceitos prejudiciais e espalhar desinformação. Um conhecimento amplo e diversificado é essencial para que os sistemas de IA sejam fontes confiáveis ​​em biologia.

Vieses de cegueira vegetal quais informações e perspectivas são compartilhadas no ensino e pesquisa em biologia. Se a IA imitar e amplificar esses preconceitos, estará prestando um péssimo serviço à diversidade da biologia. A biologia vegetal oferece exemplos distintos e esclarecedores de conceitos e processos biológicos. Negligenciar isso distorce a compreensão.

As ideias que um estudante perde se eles ignoram as plantas poderia ser enorme. Por exemplo, tanto os cromossomos quanto os ritmos circadianos foram observados pela primeira vez em plantas.

Recomendações para melhorar a diversidade da IA

Geitmann e Bidhendi fazem algumas recomendações sobre como melhorar a compreensão da biologia vegetal pela IA. Seguindo o princípio GIGO – Garbage In, Garbage Out, eles discutem quais informações vão para os modelos. Eles sugerem que os modelos se tornarão muito mais úteis se forem alimentados com “material de formação apropriado”. Eles também escrevem que é importante lidar corretamente com a saída. Eles escrevem:

O desafio é que os sistemas de IA aprendam através do reforço e da confirmação do utilizador. Devido aos tamanhos relativos dos pesquisa biomédica campo versus ciência das plantas, diversas respostas com altos 'PAScores' podem não ser reforçadas com frequência suficiente para garantir uma diversidade consistente na resposta. Estruturar as formas como a aprendizagem baseada em reforço é feita será crucial, e o envolvimento de especialistas no assunto na validação do processo será essencial – como apontado em um artigo cuidadoso de van Dis et ai. [2023].

Geitmann e Bidhendi 2023.

A necessidade de uma IA diversificada e imparcial

Este estudo de Geitmann e Bidhendi enfatiza a importância da avaliação de especialistas e usuários para identificar limitações nos sistemas de IA existentes. Com feedback consciente, os preconceitos podem ser reconhecidos e resolvidos através da expansão da diversidade de dados de treinamento e do ajuste fino das arquiteturas dos modelos.

O que o artigo não explora é a questão prática de Quem vai pagar para fazer o treinamento necessário? Os CEO das várias empresas de IA terão observado que muitas outras empresas fizeram fortuna ao conseguir que outras pessoas trabalhassem de graça.

É difícil não olhar especificamente para as editoras acadêmicas aqui – embora eu deva salientar que o Annals of Botany A empresa que financia este site não tem fins lucrativos. Os membros da empresa não recebem salário.

Embora uma IA mais imparcial e colaborativa possa enriquecer o conhecimento e a compreensão biológica coletiva da humanidade, exigirá muita limpeza e manutenção.

LEIA O ARTIGO
Geitmann, A. e Bidhendi, AJ (2023) “Plant blindness and diversity in AI language models" Trends in Plant Science. Disponível em: https://doi.org/10.1016/j.tplants.2023.06.016.

Alun Salt

Alun (ele / ele) é o produtor de Botany One. É seu trabalho manter o servidor funcionando. Ele não é botânico, mas começou a encontrá-los regularmente enquanto trabalhava na redação de módulos para um curso de Ciências Interdisciplinares e, posteriormente, ajudando a ensinar matemática para biólogos. Seus diplomas são em arqueologia e história antiga.

Leia isso no seu idioma

A Semana da Botânica

Nas manhãs de segunda-feira, enviamos um boletim informativo com os links que têm chamado a atenção de nossos leitores no Twitter e além. Você pode se inscrever para recebê-lo abaixo.

@BotanyOne no mastodonte

Carregando feed do Mastodon...

em áudio


arquivo