A evolução reticulada, juntamente com as características reprodutivas que limitam outras recombinações interespecíficas, resulta em mosaicos misturados de grandes fragmentos genômicos dos táxons ancestrais. Dados de sequenciamento de genoma completo (WGS) são ferramentas poderosas para decifrar esses genomas complexos, mas ainda muito caros para serem usados ​​em grandes populações. O objetivo deste trabalho foi desenvolver uma abordagem para inferir estruturas filogenômicas em indivíduos diploides, triploides e tetraploides a partir de dados de sequenciamento em bibliotecas de complexidade genômica reduzida. A abordagem foi aplicada ao cultivo Cítrico pool gênico resultante da evolução reticulada envolvendo quatro táxons ancestrais, C. maxima, C. médico, C. micranta e C. reticulata.

Diagrama do fluxo de trabalho
Fluxo de trabalho para identificação de marcadores diagnósticos dos quatro táxons ancestrais (C. maxima, C. medica, C. micrantha e C. reticulata) a partir de leituras de GBS.

Entre 43,598 SNPs minerados, Ahmed et al. identificou um conjunto de 15,946 DSNPs cobrindo todo o genoma com uma distribuição semelhante à das sequências de genes. O conjunto inferiu com eficiência o cariótipo filogenético dos 53 acessos analisados, fornecendo padrões de acessos comuns muito próximos aos previamente estabelecidos com dados WGS. Os cariótipos filogenômicos complexos de 21 citros cultivados, incluindo bergamota, limão triploide e tetraploide, foram revelados pela primeira vez.

O pipeline, disponível online, inferiu com eficiência as estruturas filogenômicas de citros diploides, triploides e tetraploides. Será útil para qualquer espécie cujo comportamento reprodutivo resultou em um mosaico interespecífico de grandes fragmentos genômicos. Também pode ser usado para as primeiras gerações de esquemas de reprodução interespecífica.