A digitalização de imagens e informações de espécimes de herbário está ampliando seu uso e constituindo um importante recurso para estudos fenotípicos e fenológicos. A partir da primavera de 2020, um repositório de chaves, iDigBio, tem mais de 19 milhões de espécimes digitalizados. Imagens anotadas de alta qualidade podem ser usadas para treinar algoritmos de aprendizado de máquina para automatizar determinadas tarefas baseadas em imagens digitais, economizando tempo no futuro. No entanto, a anotação inicial requer um alto investimento de horas-homem, e muitas vezes é feita por voluntários. Por esse motivo, é importante encontrar as formas mais fáceis e eficientes de permitir que os voluntários concluam suas tarefas.

Em um novo artigo publicado em Aplicações em Ciências Vegetais' Machine Learning in Plant Biology edição especial, autor principal Laura Brenskelle e colegas usaram um conjunto de dados pré-anotados de alta qualidade contendo 3000 espécies cada uma Prunus or Acer espécimes para testar a precisão das anotações dos voluntários de características fenológicas em duas condições diferentes.

Na primeira, os pontuadores compareceram pessoalmente e receberam um treinamento de 15 minutos, além de um manual com ilustrações e exemplos. Na segunda, os artilheiros utilizaram a plataforma online Notas da Natureza e receberam o manual de instruções sem treinamento adicional. Na segunda configuração, um espécime exigia três anotações e era atribuído à anotação acordada por dois avaliadores. Os autores então investigaram a influência de fatores como características e táxons sendo pontuados, bem como a experiência botânica, nível de carreira acadêmica e velocidade dos pontuadores individuais.

Exemplos de Prunus (esquerda) e Acer (à direita) espécimes incluídos nos estudos. Fonte Brenskel et al. 2020.

Surpreendentemente, os resultados mostraram que a perícia botânica, o nível de carreira e a velocidade não foram fatores importantes na precisão dos marcadores. Em vez disso, a precisão era governada pelas características e táxons sendo pontuados, se a pessoa pontuada pessoalmente ou online, e o próprio indivíduo... algumas pessoas eram apenas mais precisas, independentemente de outros fatores. No geral, aqueles que apareceram pessoalmente foram significativamente mais precisos, embora ambos os grupos tenham se saído razoavelmente bem. “Acreditamos que há dois fatores principais que podem ter contribuído para o pequeno atraso na precisão da anotação on-line – treinamento e qualidade da imagem”, explica Brenskelle, que enfatiza os livretos de treinamento abrangentes e a capacidade de ampliar os detalhes de uma imagem. Ela também observa que a pontuação triplicada melhorou a precisão online em três por cento. “Essa é outra maneira de melhorar a precisão das anotações on-line, embora exija três vezes a quantidade de anotações concluídas.”

Embora as características avaliadas neste estudo tenham sido diretas, Brenskelle está confiante de que os voluntários podem ser efetivamente treinados para tarefas de anotação mais complexas. “[As] características neste estudo foram anotações de presença/ausência relativamente simples. Existem inúmeras tarefas de anotação mais complexas nas quais posso imaginar que os pesquisadores estariam interessados, especialmente para a fenologia da planta. Acho que, com treinamento voluntário adequado, nossa abordagem geral funcionaria para características mais complexas”, diz ela. “Acho que o maior desafio que você enfrentaria com características mais complexas seria ter imagens que mostrassem um nível apropriado de detalhes para as coisas que você está pedindo aos voluntários para pontuar. Além desse desafio, acho que se você desenvolvesse manuais de treinamento com exemplos visuais, isso permitiria aos voluntários pontuar características mais complexas.”