Um estudo pioneiro usando inteligência artificial (IA) demonstrou uma nova abordagem para investigar a relação entre o tamanho da folha e o clima em diferentes espécies de plantas. A pesquisa, conduzida por Wilde e colegas e publicada no American Journal of Botany, Usa aprendizado de máquina para analisar grandes quantidades de dados de coleções de herbário digitalizadas. Este método inovador pode oferecer insights sem precedentes sobre como as plantas se adaptam aos seus ambientes.
As coleções de herbário são bibliotecas de espécimes de plantas preservadas, muitas vezes datadas de séculos atrás. Eles são um tesouro de informações biológicas, mas sua escala e complexidade tradicionalmente os tornam difíceis de analisar. O aprendizado de máquina, um ramo da IA, pode automatizar o processo de medição, aumentando drasticamente os dados disponíveis para estudo.
A equipe de pesquisa usou um tipo de IA conhecido como Redes Neurais Convolucionais (CNNs), que são particularmente hábeis na análise de imagens. Eles treinaram essas CNNs para identificar e medir folhas em imagens de espécimes de plantas de dois gêneros: sizígio, um grupo de plantas com flores da família da murta, e Ficus, mais comumente conhecido como figos.

“Neste estudo, queríamos encontrar e contar os pixels nas folhas, como medida de área, largura e comprimento. Começamos com folhas simples, com margens suaves, como uma prova de conceito, mas gostaríamos muito de estender isso para formas de folhas mais complexas”, disseram os autores em um e-mail.
A equipe treinou duas versões do modelo CNN, uma com uma seleção aleatória de imagens e outra com imagens selecionadas pelo usuário. O desempenho desses modelos foi então testado usando um conjunto de imagens de validação. Posteriormente, os modelos validados foram aplicados a mais de 3,800 espécimes digitalizados do Herbário Nacional de New South Wales, Austrália.
“Esses espécimes foram todos fotografados recentemente em uma grande iniciativa de digitalização. Isso significa que as fotos foram tiradas em condições uniformes, com equipamentos semelhantes, configurados de forma constante, portanto, bem padronizadas. Iniciativas semelhantes de digitalização estão em andamento em Herbaria em todo o mundo, então em breve será possível aplicar métodos semelhantes a um grande número de fotos (com ajustes de resolução, etc)”, disseram os autores
Os resultados foram promissores. A abordagem de treinamento selecionada pelo usuário foi mais eficaz, encontrando mais folhas e uma gama mais ampla de tamanhos de folhas do que o modelo treinado aleatoriamente. Isso indica que um grau de envolvimento humano especializado pode melhorar a eficiência da IA em tarefas tão complexas.
“O modelo human-in-the-loop foi particularmente útil aqui, onde queríamos minimizar a quantidade de dados de treinamento necessária para gerar um modelo robusto. Se no futuro permanecermos limitados pelos dados de treinamento, pode haver um papel para essas abordagens. Se, por outro lado, os esforços globais para treinar modelos resultarem em grandes bibliotecas de dados de treinamento, talvez o volume substitua os benefícios da seletividade humana”, disseram os autores.
Quando se trata da ligação entre o tamanho da folha e o clima, os modelos da CNN confirmaram que, em diferentes espécies, folhas maiores estavam associadas a climas mais quentes e úmidos, consistente com estudos anteriores. No entanto, a relação não era tão clara dentro de espécies individuais, sugerindo que outros fatores, como variação genética e histórico populacional, poderiam influenciar o tamanho da folha.
“Vemos que, se nos movermos de um ponto no sudeste da Austrália para um ponto mais quente no nordeste da Austrália, em média, o tamanho de um sizígio folha fica maior. Isso parece ser principalmente porque existem espécies com folhas maiores no norte. Se olharmos para as folhas de uma única espécie amplamente distribuída nos mesmos dois locais, em média, descobrimos que as folhas têm aproximadamente o mesmo tamanho”, disseram os autores em seu e-mail.
“A explicação provavelmente está relacionada à história ou processos evolutivos, dentro das espécies. Por exemplo, dentro de uma espécie, populações muito distantes provavelmente ainda estão conectadas por fluxo gênico. Isso pode ser indireto, por exemplo, por meio de movimentos relativamente curtos de pólen entre populações próximas, ao longo de gerações. Isso significa que os alelos genéticos que influenciam o tamanho da folha provavelmente estão sendo compartilhados entre as populações, homogeneizando os tamanhos das folhas entre as populações.
“Se a seleção favorecesse folhas maiores no norte, o benefício associado de folhas maiores teria que ser bastante forte para superar o efeito do fluxo gênico. Também é possível que algumas espécies amplamente distribuídas tenham sofrido expansão populacional recente, o que também levaria a populações com valores de características semelhantes em grandes áreas geográficas. Portanto, ambos os processos evolutivos (por exemplo, fluxo de pólen) e histórias (por exemplo, expansão populacional) podem levar a diferentes ligações observadas entre característica e clima dentro das espécies”.
Se você está acompanhando as notícias sobre IA, os resultados podem ser interessantes, mas o método pode ser opaco. É essencial não só que você saiba das coisas, mas também que saiba como você sabe coisas. Este é um problema que Wilde e seus colegas abordam em seu artigo.
“Modelos complexos de aprendizado de máquina (redes neurais, etc.) são menos facilmente compreendidos do que os modelos estatísticos que têm sido difundidos nas ciências biológicas e vegetais até agora. No entanto, estamos chegando a um ponto em que há uma base sólida para usá-los e nos beneficiar de seu enorme poder inferencial de maneiras confiáveis e robustas”, disseram os autores em seu e-mail.
“Essa base para o bom uso do ML se baseia nos processos de validação e teste do modelo. Isso envolve pegar dados (imagens) que não são usados para treinar um modelo e adicionar rótulos a esses dados dos recursos que um modelo bem treinado deve encontrar. Podemos então perguntar, quantitativamente, quão bem um modelo funciona quando os dados são mostrados. Ele encontra todas as folhas que estavam lá para serem encontradas? Consegue evitar chamar de folhas coisas que não eram folhas? Onde encontra corretamente uma folha, chega a uma estimativa precisa de seu tamanho, em termos de pixels? Se um modelo de aprendizado de máquina pode funcionar bem em relação a essas questões, para um conjunto suficientemente grande e representativo de dados de treinamento, ficamos confiantes no modelo.”
Depois de ter um método robusto de medição, você também pode expandir o que mede. “Também usamos modelos de aprendizado de máquina para encontrar uma variedade de outras estruturas em espécimes de herbário, incluindo brotos, frutas e flores – então definitivamente há muito espaço para estender a outras estruturas”, dizem os autores em seu e-mail. Também há esperança de poder expandir o tipo de medição que você pode fazer, dizem. “Pensamos em usar o aprendizado de máquina para fazer medições de campo de outras características foliares mal representadas por espécimes preservados, mas esse é um trabalho ainda em desenvolvimento!”
LEIA O ARTIGO
Wilde, BC, Bragg, JG e Cornwell, W. (2023) “Analisando relações característica-clima dentro e entre táxons usando aprendizado de máquina e espécimes de herbário" American Journal of Botany, pág. e16167. Disponível em: https://doi.org/10.1002/ajb2.16167.