Подписаться на новости
  • Сенатор
  • ООО "Ай Вао"
  • TechWeek
  • Биомолтекст2020
  • vsh25

Складываем пазлы

Биоинформатики СПбГУ создали новый сборщик для чтения геномов микробных сообществ

Сотрудники лаборатории «Центр алгоритмической биотехнологии» СПбГУ в составе группы российских и американских ученых разработали сборщик metaFlye, специализирующийся на сборке образцов ДНК микробных сообществ. С его помощью можно решить широкий круг фундаментальных и прикладных задач, среди которых – контроль процесса лечения человека и даже создание новых лекарств.

Статья о сборщике опубликована в престижном научном журнале Nature Methods (Kolmogorov et al., metaFlye: scalable long-read metagenome assembly using repeat graphs).

Ученым доступно несколько десятков различных сборщиков, которые разрабатывают в ведущих биоинформатических лабораториях по всему миру. Такое многообразие обусловлено тем, что лежащие в основе сборщиков алгоритмы нужно адаптировать к разным типам входных данных, получаемых на разных видах секвенаторов, а также к различным организмам. Например, подходы для сборки генома бактерий могут совершенно не подойти сборке генома человека и наоборот. Кроме того, разработчики геномных сборщиков постоянно стремятся улучшить свои решения, чтобы их программы работали быстрее, использовали меньше памяти, а итоговые сборки были длиннее и точнее, чем у конкурентов.

Новый сборщик metaFlye используется при сборке метагеномов, то есть образцов ДНК микробных сообществ, полученных из различных сред, – например, из глубин океана, почвы в парке или кишечника человека. Получая сборку такого образца, можно определить, что за организмы в нем представлены и сколько их. Используя дополнительный анализ сборки, часто можно выяснить, чем эти организмы могут питаться, как взаимодействуют, какие вещества синтезируют. Все эти сведения в дальнейшем можно использовать, например, для поиска новых лекарственных средств природного происхождения, для определения причин, лежащих в основе особой плодородности почвы, при проверке хода лечения человека и во множестве других как фундаментальных, так и прикладных задач.

Сборщик metaFlye предназначен для данных, получаемых по самой современной технологии секвенирования на данный момент – технологии секвенирования длинными прочтениями (long-read sequencing). Для данных метагеномного секвенирования короткими прочтениями (short-read sequencing, или next-generation sequencing, NGS) на платформе Illumina уже есть несколько сборщиков, используемых во всем мире. В их число входит сборщик metaSPAdes, разработанный в Центре алгоритмической биотехнологии СПбГУ в 2016 году. Также уже существуют программы для сборки отдельных геномов из длинных прочтений. Новый продукт metaFlye позволяет использовать преимущества новой технологии для сложных метагеномных данных. Это первый специализированный сборщик для метагеномов, работающий с технологиями Oxford Nanopore и PacBio.

«Стимулом к созданию metaFlye послужило отсутствие специализированного метагеномного сборщика для технологии длинных прочтений. Эта технология уже кардинально изменила всю современную геномную науку, мы научились получать гораздо более полные сборки. Так, например, с ее помощью недавно были прочитаны и локализованы многие недостающие фрагменты генома человека (с использованием оригинального инструмента Flye и тоже с участием членов нашей лаборатории). Но для метагеномов такие данные только начали появляться, и, конечно, они потребовали специальных инструментов», – отмечает один из авторов проекта, старший научный сотрудник Центра алгоритмической биотехнологии СПбГУ Михаил Райко.

Работа над metaFlye началась примерно два года назад. Если же вести отсчет с создания его предшественника, геномного сборщика Flye, на базе которого и был реализован новый проект, получается вдвое больше – четыре года.

«В нашем исследовании, опубликованном в журнале Nature Methods, мы использовали metaFlye и другие сборщики, чтобы проанализировать несколько симулированных (то есть сгенерированных на компьютере, без секвенирования настоящей ДНК) и реальных метагеномных образцов из желудочно-кишечного тракта человека, коровы и овцы, – рассказывает другой автор сборщика, старший научный сотрудник Центра алгоритмической биотехнологии СПбГУ Алексей Гуревич. – Наибольший интерес, пожалуй, представляет образец микробиома овцы, так как он был впервые получен и исследован именно в этой работе, в то время как исходные данные секвенирования для двух других образцов взяты из работ сторонних авторов. Благодаря metaFlye в этом образце удалось собрать на порядок больше вирусных геномов и в полтора раза больше плазмид, чем при использовании лучших из существующих программ-аналогов. Сборщик metaFlye – это инструмент для решения широкого круга задач, который будет доступен всем исследователям, работающим с подобными данными. Из конкретных проектов, выполняемых в нашей лаборатории, мы применяем сборщик для изучения состава почвы черневой тайги – уникального биоценоза Западной Сибири с аномально высокой продуктивностью».

Другим любопытным результатом стало то, что в образце удалось собрать геномы не только бактерий и архей, но и эукариот. При этом биоинформатический анализ показал, что почти половина эукариотических геномных фрагментов относится к представителям нематод, или круглых червей. Этот результат полностью соответствует отчету о вскрытии трупа животного, в котором были обнаружены признаки паразитарной инфекции.

Публикация о metaFlye – результат коллаборации 11 российских и американских ученых, представляющих Санкт-Петербургский государственный университет, Калифорнийский университет в Сан-Диего (UCSD), Институт биоинформатики (Санкт-Петербург) и американские исследовательские центры молочных и мясных продуктов. Сам сборщик metaFlye в основном разрабатывается в UCSD. Его создатель и первый автор публикации – Михаил Колмогоров, постдок UCSD. Научный руководитель проекта – Павел Певзнер, профессор UCSD и главный научный консультант Центра алгоритмической биотехнологии СПбГУ.

Портал «Вечная молодость» http://vechnayamolodost.ru


Читать статьи по темам:

биоинформатика секвенирование генома Версия для печати
Ошибка в тексте?
Выдели ее и нажми ctrl + enter
назад

Читать также:

Лазерный секвенатор

Биологи из России научились расшифровывать и быстро сравнивать структуру ДНК разных клеток, просвечивая их молекулы лазером.

читать

Антибиотики из компьютера

Компьютерный анализ ДНК человеческой микробиоты помог ученым выделить два мощных антибиотика – гумимицин А и гумимицин В, которые помогут бороться с «супербактериями».

читать

Биоинформатика – медицине

Почему ожирение «заразно», микробиота – наше все и насколько важно изучать генетический состав окружающих нас бактерий, исследовали петербургские ученые.

читать

Проект «100 тысяч геномов» продолжает работу

Полученные данные помогут изучить механизмы развития генетически обусловленных заболеваний и создавать эффективные методы персонализированной терапии для тысяч пациентов.

читать

К проекту Genomics England подключилась Бигфарма

Десять крупнейших фармацевтических и биотехнологических компаний договорились о сотрудничестве с британской государственной организацией Genomics England.

читать