Формат вывода BLAST

В каком формате лучше всего получать вывод BLAST?

Для человека, понятно, лучше всего plain text, который и выдается по умолчанию. А для разработчика (т.е. компьютера)?

Как показывает практика, парсить plain text вывод - дело ненадежное, поскольку формат может незначительно меняться в зависимочти от версии BLAST. Даже BioPerl не всегда справляется с этим. Поэтому при больших объемах автоматизированного анализа результатов выравнивания, старайтесь избегать этого формата.

Если не требуется информация о собственно последовательности HSP, то наилучшим форматом будет tab-delimited ( параметр -m 8), В случае, когда дополнительно нужны данные о последовательностях, то оптимальным выбором будет XML-формат (параметр -m 7). Правда, придется расплачиваться относительной потерей в производительности разбора результатов.

 

Добавить комментарий


Защитный код
Обновить