Erik Amézquita, estudante de doutorado no departamento de Matemática Computacional, Ciências e Engenharia da Michigan State University, é o principal autor de um artigo publicado na in silico Plantas que apresentam uma nova técnica para analisar formas em plantas.

A Análise Topológica de Dados (ATD) é uma disciplina matemática emergente que surge da noção de que todos os dados são formas e todas as formas são dados. Com a ATD, a forma de diversos objetos pode ser caracterizada usando representações matemáticas abstratas baseadas na topologia algébrica. A abordagem da ATD não depende da existência de pontos de referência homólogos – características semelhantes devido à ancestralidade comum – nem se restringe a objetos de uma orientação ou dimensão específica. A ATD oferece, portanto, uma estrutura robusta, abrangente, comparável e quantificável para medir a forma de uma diversidade de entradas. Uma das muitas ferramentas de ATD disponíveis é a Transformação Característica de Euler (TCE), que mede como a topologia intrínseca – especificamente a característica de Euler – de um objeto muda à medida que ele é fatiado em todos os limiares e direções possíveis.

A escolha do uso da ECT decorre de dois motivos importantes. A primeira é que o cálculo de ECT para uma semente pequena leva apenas alguns segundos, o que é importante ao lidar com um grande volume de dados. A segunda razão é que cortar uma semente tudo possível As direções garantem matematicamente a codificação de tudo o que há para saber sobre a forma, o suficiente para reconstruir a forma original a partir do zero.

“A ressalva é que, na verdade, há um número infinito de direções para calcular. No entanto, mesmo tomando cerca de 150 direções, parece que codificamos informações morfológicas suficientes para produzir resultados empolgantes”, explica Erik Amézquita, um matemático de formação agora transformado em biólogo vegetal.

Os autores compararam a eficácia do uso de descritores de forma tradicionais, descritores de forma topológica ou uma combinação de ambos para caracterizar e identificar sementes de diferentes acessos de cevada.

Figura 1: Panícula 3D depois que a densidade é normalizada, o ar e outros detritos são removidos e as arestas são podadas.

Primeiro, eles coletaram panículas de 28 acessos com diversas morfologias de espigas e origens geográficas. Em seguida, eles digitalizaram essas panículas (aglomerados de sementes), em lotes de três ou quatro panículas cada, usando tomografia computadorizada (TC) de raios-X (Fig. 1). Essas varreduras foram posteriormente processadas digitalmente para isolar mais de três mil sementes de cevada individuais das panículas. Finalmente, cada semente foi alinhada e orientada de acordo com seus três principais componentes principais.

Os autores passaram então a quantificar a forma dos grãos de cevada. Eles primeiro mediram 11 diferentes descritores de forma tradicional, como comprimento, largura, altura, área de superfície e volume para cada semente (Fig. 2).

Figura 2. As sementes foram alinhadas de acordo com seus componentes principais, e os descritores de forma tradicionais foram medidos.

Em seguida, os descritores de forma topológica foram medidos com o ECT. Para calcular o ECT, primeiro as sementes foram cortadas em uma direção fixa em 16 fatias de igual espessura. Em seguida, as sementes foram reconstruídas adicionando uma fatia de cada vez e as mudanças na característica de Euler foram registradas (Fig. 3). Este corte, reconstrução fatia por fatia e rastreamento característico de Euler foi realizado para 158 direções diferentes no total. O procedimento ECT produziu mais de 2500 fatias diferentes, correspondendo a mais de 2500 descritores de forma topológica para cada semente. Para evitar distorções causadas por trabalhar com dados em altas dimensões – conhecida como a maldição da dimensionalidade – foi necessária uma redução de dimensionalidade.

Figura 3. Cada semente foi “cortada” em 32 fatias de cima para baixo. À medida que as fatias são adicionadas, um número associado à topologia é calculado.

Para estudar a adequação de todos os descritores de forma, um computador foi encarregado de caracterizar e prever os 28 acessos de sementes de cevada usando apenas informações de morfologia do grão. O computador, uma máquina de vetores de suporte, usava três tipos de treinamento. Primeiro, a máquina usava exclusivamente descritores de forma tradicionais. Em seguida, a máquina foi treinada apenas com descritores de forma topológica. Finalmente, a máquina usou ambas as fontes de informação.

Os autores descobriram que, para a maioria dos acessos, os recursos topológicos ajudam o computador a produzir melhores taxas de previsão do que os recursos de forma tradicionais. Esses resultados de classificação foram impulsionados ainda mais quando as informações tradicionais e topológicas foram combinadas, demonstrando que a topologia mede os recursos perdidos pelo cenário tradicional. Além disso, enquanto os descritores de forma tradicionais são capazes de agrupar as sementes com base em seu acesso, os descritores de forma topológica foram capazes de agrupá-las ainda mais com base em sua panícula.

Para determinar exatamente o que é esse “algo” perdido pelos recursos tradicionais, várias avaliações de análises de variância foram realizadas. Uma exploração das direções e fatias usadas para calcular o ECT revela que a forma da dobra e a parte inferior das sementes discriminam mais os acessos (Fig. 4)

Figura 4. As fatias mais significativas correspondem ao vinco da semente e à morfologia do fundo.

Amézquita diz: “A característica de Euler é uma maneira simples, mas poderosa, de revelar características que não são facilmente visíveis a olho nu. Há informações morfológicas ocultas que faltam nos métodos morfométricos tradicionais e geométricos. A característica de Euler e o TDA em geral podem ser facilmente calculados a partir de qualquer dado de imagem. TDA sugere um novo caminho emocionante, conduzido apenas por informações morfológicas, para explorar ainda mais a relação fenótipo-genótipo”.

LEIA O ARTIGO:

Erik J Amézquita, Michelle Y Quigley, Tim Ophelders, Jacob B Landis, Daniel Koenig, Elizabeth Munch, Daniel H Chitwood, Medindo o fenótipo oculto: quantificando a forma das sementes de cevada usando a transformação característica de Euler, in silico Plants, 2021;, diab033, https://doi.org/10.1093/insilicoplants/diab033


Este manuscrito faz parte do in silico Plant's Edição especial do Functional Structural Plant Model.

Todos os dados e códigos usados ​​neste artigo estão disponíveis livre e abertamente em https://doi.org/10.5061/dryad.rxwdbrv93 e https://github.com/amezqui3/demeter/.