O advento e a amplitude dos recursos da bioinformática facilitaram o trabalho dos cientistas. Antes de partir para o trabalho de laboratório, eles são capazes de analisar alvos de genes e construir hipóteses melhores. Vários grupos e institutos de pesquisa tomaram a iniciativa de fornecer conjuntos de dados, ferramentas, algoritmos, código-fonte aberto e plataformas de visualização.
Um estudo abrangente de um gene ou proteína requer o recrutamento de várias ferramentas online, bancos de dados e plataformas de visualização. Por exemplo, Araport or TAIR para recuperar informações sobre anotação e sequência, BioGRID para dados de interação proteína-proteína, SUBA4 para rastreamento de localização subcelular, AtPAN2.0 para detectar sítios de ligação do fator de transcrição (TF), Phyre2 para modelagem 3D de proteínas, e o Reactoma para vias de sinalização, metabólicas e reguladoras de genes. Além disso, existem inúmeras ferramentas para analisar a modificação pós-traducional (fosforilação, acetilação, miristoilação, etc.), sequências de direcionamento subcelulares, domínios funcionais e pequenas interações molécula-proteína.

Essas ferramentas e recursos também se concentram em uma planta específica na maioria dos casos. Como resultado, verificar a funcionalidade de uma determinada proteína ou domínio de uma perspectiva interespécie requer vários bancos de dados. Para isso, extrair dados de uma ferramenta e executá-los em uma plataforma diferente requer reprocessamento ou formatação precisa para a próxima ferramenta. A integração de várias ferramentas em uma única plataforma é uma solução elegante para evitar trabalho e complicações. A integração é uma maneira dessas ferramentas gerarem e testarem mais facilmente as hipóteses que deveriam facilitar em primeiro lugar.
Apresentando a plataforma integrada ePlant
ePlant traz várias plataformas de visualização de dados em uma interface baseada em uma escala hierárquica. Ele integra vários bancos de dados e possui uma interface de usuário com zoom. O ePlant integrou um visualizador de informações genéticas, visualizador de publicações, visualizador de mapas de calor, visualizador mundial eFP (pictograma fluorescente eletrônico), eFP de plantas, visualizador eFP de tecidos e experimentos, eFP de células, visualizador de cromossomos, visualizador de interação, visualizador de moléculas, visualizador de sequência e tem opções de link-out para outras ferramentas como Araport, TAIR, SUBA3, MASCP, biomercado etc.. Em vez de servir apenas como ferramentas de visualização, eles ajudam a responder a questões científicas.

Para um determinado gene, ABA INSENSÍVEL 3 (ABI3), o visualizador mundial eFP mostra a variação da expressão gênica em diferentes ecótipos. O visualizador de tecidos e experimentos eFP revela a expressão específica da raiz, o visualizador de células eFP mostra a localização abundante específica do núcleo, o visualizador de cromossomos contém a localização do mapa físico do locus, o visualizador de interação exibe interações proteína-proteína e proteína-DNA previstas e confirmadas , o visualizador molecular identifica a sequência de ligação do DNA de ABI3 a partir da estrutura 3D parcial.
Levando o ePlant além Arabidopsis
ePlant é baseado em Arabidopsis thaliana dados. Ele contém informações para mais de 35 milhões de medições de expressão gênica e localizações subcelulares documentadas experimentalmente para 10,910 proteínas. Além disso, ele seleciona aproximadamente 100,000 dados de interação proteína-proteína e 2.7 milhões de proteína-DNA. Ele também fornece estruturas previstas para Phyre2 de 23,091 produtos de genes e 6.19 milhões de SNPs não sinônimos com base no site 1001 Proteomes.

Embora o ePlant se dedique a Arabidopsis thaliana, todo o código fonte do projeto está disponível em GitHub. Plataformas semelhantes são possíveis de construir para quaisquer outras plantas através da incorporação de conjuntos de dados apropriados. Ao mesmo tempo, os navegadores eFP estão disponíveis para outros dicotiledôneas (Álamo, medicago, soja, Batata, Tomate, E. salsugineum, C. sativa, Arachis, Uva), monocotiledôneas (Milho, arroz, Cevada, Triticale, Braquipódio) e não vegetais (Rato, Pessoas) em BAR (The Bio-Analytic Resource for Plant Biology) juntamente com o ePlant. Observando a expressão gênica em Arabidopsis pode levar a insights sobre como ele funciona em outras plantas. Desta forma, ajuda a ampliar a aplicação de um gene pesquisado ou rede reguladora de genes em várias espécies de plantas. A integração de uma ampla gama de espécies para o visualizador eFP permite que os pesquisadores explorem padrões interessantes em diferentes sistemas experimentais.
