PHYLIP Filogenia
PHYLIP Filogenia

O método da Pacote de Inferência de Filogenia, PHYLIP, escrito por Joe Felsenstein (Universidade de Washington) atingiu a marca de 30 anos. Quase todos os volumes recentes de Annals of Botany tem artigos utilizando este programa para análise de dados, entre os 32,000 artigos que o citam publicados desde 1980. São poucos os pacotes de software que resistiram ao teste do tempo ao longo de tantas gerações de computadores – tenho-o utilizado regularmente desde que era um Doutorando. Desenvolvido muito antes das interfaces WIMP (janelas, ícones, mouse, ponteiro), o PHYLIP ainda mantém sua simplicidade modular e versatilidade. É muito menos provável que você acabe com lixo entrando e saindo, nenhum dos algoritmos é proprietário, há uma literatura gigantesca associada ao programa e a documentação é um modelo de clareza. Sempre me sinto desconfortável com os grandes pacotes modernos de análise de informática onde você está tão 'protegido' (ou isso é 'desprotegido'?) Dos algoritmos, e os métodos PHYLIP têm uma literatura robusta (embora às vezes controversa) por trás deles.

Durante esse período, o Dr. Felsenstein continuou com a extensão do programa e, além da documentação, há uma página da Phylip no Facebook, onde ele responde a todas as perguntas, desde as mais básicas até as mais avançadas. Apesar do uso generalizado de PHYLIP e valor para uma ampla comunidade, o anti-agradecimentos na parte inferior da página de créditos também tornam a leitura interessante, mostrando o quão difícil pode ser o financiamento do desenvolvimento e publicação de um método tão amplamente utilizado.

Devido à sua natureza direta, eu uso PHYLIP regularmente em cursos – no nível básico através de uma das muitas interfaces da web, portanto não é necessário fazer download e instalação. Um dos meus usos é mostrado em www.BS1008.molcyt.com : os alunos pontuam uma série de caracteres foliares de árvores e arbustos, que classificam as sempre-vivas (Quercus ilex e Osmanthus) juntas e, em seguida, comparam isso com os dados de DNA que seguem uma classificação natural e os carvalhos ficam juntos. Outra aplicação facilmente visualizada do PHYLIP para o ensino é trabalhar as relações entre os uísques escoceses. Um livro do segundo mais famoso Michael Jackson (depois, ou seja, do editor de AoB Plants) classifica 109 tipos diferentes de uísque de malte Com base em 68 qualidades organolépticas (cor, aroma, corpo, paladar e finalização), Lapointe e Legendre publicaram uma "Classificação de Whiskies Escoceses de Puro Malte". (Estatísticas Aplicadas. 1994; 43(1):237; http://dx.doi.org/10.2307/2986124 (arquivo versão do repositório disponível aqui; dados matriz para análise está aqui no site de Pierre Legendre, e ele tem outro relacionado artigo sobre matrizes de distância entre uísques de malte).

Então, feliz aniversário, PHYLIP, e parabéns ao seu criador.

Editar 1 de dezembro: adicionar link ao datamatrix de uísque de malte (não uísque).

Peter Bradbury, do USDA, Cornell, também observa outros programas úteis de análise de SNP:

PENDÃO, http://www.maizegenetics.net/tassel EMMA, http://mouse.cs.ucla.edu/ PLINK, http://pngu.mgh.harvard.edu/~purcell/plink/ Haploview, http://www.broadinstitute.org/haploview

Há também o PowerMarker, http://statgen.ncsu.edu/powermarker/ que também uso em cursos e permite a colagem simples de dados formatados em Excel.