Os modelos de plantas precisam de dados de alta qualidade para calibração e validação. Espera-se que as técnicas de aprendizado de máquina tenham um papel proeminente no fornecimento de dados de fenotipagem baseados em imagens de alta qualidade no futuro. No entanto, o aprendizado de máquina geralmente requer conjuntos de dados grandes e diversos para aprender modelos generalizáveis e os conjuntos de dados disponíveis geralmente são pequenos e os custos associados à geração de novos dados são altos. Ubbens e coautores resolver este problema usando dados de plantas sintéticas.

Os autores demonstram que os modelos de aprendizado de máquina podem ser aumentados usando dados de treinamento derivados de imagens renderizadas de plantas sintéticas. A combinação de imagens de plantas reais com sintéticas como dados de treinamento reduziu o erro de contagem absoluto médio em comparação com o uso apenas de imagens de plantas reais. Além disso, modelos completamente treinados apenas em rosetas sintéticas foram aplicados com sucesso para contar folhas em rosetas reais.
Imagens renderizadas de rosetas de Arabidopsis foram geradas por computador a partir de um modelo descritivo usando sistemas L que reproduziram os estágios iniciais de desenvolvimento do broto da planta com base em observações e medições diretas.
O modelo de aprendizado de máquina usado neste estudo foi uma plataforma para fenotipagem de plantas baseada em imagens chamada Deep Plant Phenomics, que implementa redes neurais convolucionais profundas para fenotipagem de plantas, para contar folhas (Ubbens e Stavness, 2017).
Com os avanços feitos neste estudo, a próxima aplicação pode ser a modelagem de parcelas inteiras de culturas. “Um lote simulado de plantas poderia possibilitar o treinamento de algoritmos para detectar características biologicamente significativas, como tempo de floração ou resposta ao estresse com um número reduzido de imagens reais (anotadas) de culturas”.
