Os modelos de aprendizagem profunda revolucionaram a modelagem de plantas ao automatizar a extração de características e características das plantas a partir de imagens. Esses dados de alto rendimento permitem que os pesquisadores analisem características complexas das plantas, como padrões de crescimento e suscetibilidade a doenças, com mais eficiência.

Os modelos de aprendizagem profunda devem ser treinados usando imagens diversas para desenvolver representações robustas e generalizadas. No entanto, obter este tipo de dados é um processo demorado e que consome muitos recursos. Além da realização de experimentos, envolve a coleta meticulosa de volumes substanciais de imagens de alta qualidade, que precisam ser segmentadas e armazenadas de forma adequada. Além disso, as imagens devem ser anotadas, onde informações específicas sobre os objetos, regiões ou atributos nelas representados são adicionadas a cada arquivo. Esta etapa é crucial para permitir que os algoritmos compreendam e aprendam com os dados de forma eficaz.

Para superar a escassez de dados de treinamento, os pesquisadores exploraram o uso da geração de dados sintéticos, que envolve a criação de imagens artificiais de plantas que imitam dados do mundo real. Os dados sintéticos podem ajudar no treinamento de modelos de aprendizagem profunda de forma mais eficaz, fornecendo conjuntos de dados grandes e diversos.

Um novo artigo publicado em in silico Plantas de Dirk Helmrich, estudante de doutorado na Forschungszentrum Jülich e na Universidade da Islândia, e colegas apresenta uma estrutura chamada Synavis que gera dados sintéticos de plantas e se conecta e se comunica diretamente com estruturas de treinamento de aprendizagem profunda.

Uma figura explicando como as plantas são simuladas no CPlantBox na parte superior. Primeiro, a parametrização do modelo utiliza parâmetros de medições diretas. Em seguida, o modelo simula uma imagem 2D de uma planta. Por último, a planta é reconstruída com geometria para criar uma imagem 3D. Na parte inferior estão exemplos de ambientes fotorrealistas renderizados usando Unreal Engine. São imagens de um campo com ambiente chuvoso, matinal, nebuloso ou ensolarado.
Plantas individuais são simuladas no CPlantBox usando dados medidos. Sua arquitetura é definida por informações topológicas e geométricas no CPlantBox. O Unreal Engine usa esses dados para produzir renderizações fotorrealistas das plantas em um ambiente virtual e é capaz de aumentar os dados da cena.

Synavis é composto por dois componentes: um Modelo Funcional-Estrutural de Planta (FSPM) e Unreal Engine.

Os FSPMs simulam a morfologia vegetal realista, imitando várias dinâmicas de desenvolvimento das plantas sob condições ambientais específicas. O FSPM CPlantBoxGenericName é usado para gerar dados estruturais de plantas semelhantes a gráficos usando algoritmos. Um módulo de visualização é então usado para produzir plantas 3D a partir dos dados do CPlantBox.

Em seguida, Unreal Engine, um mecanismo gráfico capaz de renderização fotorrealística, é usado para gerar representações visuais das plantas em um ambiente virtual. O Unreal Engine possui a capacidade de aumentar os dados da cena, incluindo posição da planta, densidade, idade e iluminação, gerando assim uma variedade de variações de imagem.

Uma visão geral em vídeo do Synavis criada por Dirk Helmrich.

Os autores testaram a validade dos dados gerados usando o Synavis, comparando-os com dados do mundo real de um experimento realizado anteriormente. Para criar dados simulados, o CPlantBox foi configurado para replicar virtualmente o experimento. As imagens do experimento foram inseridas no CPlantBox e as geometrias simuladas das plantas individuais foram inseridas no UE e ampliadas para a escala de campo. Eles então compararam as medidas do comprimento da lâmina foliar das plantas reais do experimento e das plantas simuladas. As medidas obtidas nas imagens sintéticas estavam intimamente relacionadas com as do experimento real.

As imagens resultantes podem ser diretamente integradas a um modelo de aprendizagem profunda para fins de treinamento usando Synavis. Durante o treinamento, o modelo aprende a reconhecer padrões, recursos e relacionamentos nas imagens. Ao expor o modelo a uma ampla gama de variações de imagem, torna-se capaz de generalizar e compreender as estruturas e características subjacentes dos dados visuais.

“Acreditamos que os dados sintéticos podem ser extremamente úteis para combater a escassez de dados. Com Synavis, desenvolvemos um conjunto de ferramentas que conecta estruturas individualmente muito poderosas. Mais importante ainda, queríamos criar uma maneira de verificar até que ponto podemos realmente replicar os dados, de uma forma que seja mais prática – submetendo nossas imagens virtuais a pipelines típicos de análise de dados e verificando se chegamos com sucesso onde começamos, ”explicou Helmrich.

Uma figura com três painéis. À direita está uma imagem 3D de uma planta sintética. No centro está uma imagem semelhante a uma imagem do mundo real de uma planta. À direita está uma comparação dos comprimentos das folhas entre as imagens sintéticas e os dados experimentais. A figura mostra que os dados seguem as mesmas tendências, mas que os valores dos dados sintéticos são um pouco mais baixos.
Comparação do pipeline de extração de parâmetros entre dados sintéticos e do mundo real e dados resultantes.

Esta não é a primeira estrutura deste tipo, mas tem diversas vantagens sobre outras abordagens. “A Synavis conecta estruturas fornecendo uma plataforma para comunicação entre si. O acoplamento é muito simples, padronizado e também não requer armazenamento de dados. A simulação, o mundo virtual sendo renderizado e os conjuntos de ferramentas de aprendizagem profunda existem simultaneamente. Se o modelo prever corretamente uma vez e errar outra vez, você poderá interpolar entre esses estados, sempre com um ambiente virtual coeso entre eles”, concluiu Helmrich.

LEIA O ARTIGO:

Dirk Norbert Helmrich, Felix Maximilian Bauer, Mona Giraud, Andrea Schnepf, Jens Henrik Göbbert, Hanno Scharr, Ebba Þora Hvannberg, Morris Riedel, Um pipeline escalável para criar conjuntos de dados sintéticos a partir de modelos funcionais-estruturais de plantas para aprendizado profundo, in silico Plants, Volume 6, Edição 1, 2024, diad022, https://doi.org/10.1093/insilicoplants/diad022


O código usado em Helmrich et. al. (2023) é de código aberto e está disponível sob o Sinavis e SynavisUE repositórios com um exemplo disponível em Exemplo SynavisUE. O código oficial do CPlantBox pode ser encontrado em na página GitHub do instituto. O branch associado a este artigo foi bifurcado para esta página.