Avanços na computação e fenotipagem de alto rendimento levaram a aumentos maciços na disponibilidade de dados. Os cientistas estão aproveitando esses dados para prever novos resultados, como a resposta de uma cultura ao ser plantada em um local diferente ou no mesmo local com um clima diferente.
De acordo com um novo artigo de pesquisa do Dr. Carlos Messina da Corteva Agriscience e colegas, novas abordagens de modelagem devem ser exploradas para explorar esse tesouro de dados. Este artigo apresenta várias abordagens de modelagem híbrida para obter previsões precisas e interpretáveis.
Os autores usaram um modelo de sistema existente, CROPGRO, para prever os estágios fenológicos em novos ambientes usando um grande conjunto de dados intercontinentais registrando o tempo dos estágios de desenvolvimento da soja. Eles descobriram que o modelo existente falhou em generalizar bem em todos os ambientes e maturidades porque simplesmente usou uma série temporal de temperaturas diárias e fotoperíodo (por exemplo, graus-dia) para determinar o dia do calendário de um evento de desenvolvimento. “Embora os modelos de sistemas funcionem bem sob condições específicas, eles não são suficientemente generalizáveis para apoiar decisões agronômicas e de reprodução em uma variedade de condições ambientais e maturidades relativas contínuas”, explica o Dr. Ryan McCormick, principal autor do estudo.

Os autores realizaram várias abordagens para melhorar o CROPGRO.
Primeiro, eles usaram uma estratégia de otimização multimodelo altamente paralelizada para reajustar o CROPGRO. Usando um algoritmo evolutivo, 36 parâmetros foram explorados para identificar a equifinalidade e famílias de parâmetros com comportamento semelhante. O vetor de parâmetros com o ajuste ótimo encontrado no final de qualquer rodada de evolução foi mantido e usado como o conjunto de parâmetros otimizados para análises subsequentes usando o CROPGRO. O modelo reajustado (“CROPGRO otimizado”) teve melhor desempenho após o processo de reajuste em comparação com a versão anterior.
Em seguida, os autores desenvolveram modelos de aprendizado de máquina usando redes neurais. Treinados com entradas de temperatura diária mínima, temperatura diária máxima, radiação solar, fotoperíodo e maturidade relativa, esses modelos previram com precisão os estágios diários de desenvolvimento. A inclusão de previsões “otimizadas pelo CROPGRO” como recursos no modelo de rede melhorou a precisão de suas previsões, indicando que o aprendizado de máquina pode ser aprimorado com a inclusão de recursos de engenharia especializada de modelos baseados em conhecimento.
A coleção de 20 modelos baseados em conhecimento e orientados a dados foi então combinada para melhorar ainda mais a previsão. Os autores combinaram os modelos com a previsão de cada modelo individual igualmente ponderada na previsão final do conjunto. Eles também usaram superaprendizagem, que ponderou os modelos de acordo com seu desempenho. O superaprendiz superou o conjunto simples de modelos, mas foi semelhante ao “CROPGRO otimizado” (veja a figura).
Messina e McCormick concordam que “este trabalho demonstra que os modelos de máquinas não substituem os modelos desenvolvidos com base no conhecimento científico, mas a fusão de ambas as abordagens, os modelos baseados na ciência podem resolver, pelo menos em parte, o problema da subdeterminação dos modelos de máquinas, podem levar a melhores previsões e a descobrir novos conhecimentos.
A comunidade do Sistema de Apoio à Decisão para Transferência de Agrotecnologia (DSSAT) está empenhada em promover o desenvolvimento de todos os modelos DSSAT e ferramentas de software como projetos de código aberto. O código DSSAT Cropping System Model (CSM), incluindo CROPGRO, é totalmente aberto e acessível em https://github.com/DSSAT/dssat-csm-os
