12 Февраля 2020

Протокол эпидемии

Что может сказать биоинформатика о вспышке nCoV

Георгий Базыкин, «Троицкий вариант»

Мы находимся в разгаре эпидемии новой опасной инфекции, но достоверной информации о ней мало. В этой ситуации помогает молекулярная эпидемиология. Ход накопления мутаций эволюционирующим вирусом позволяет оценить важные параметры эпидемии даже при неточных официальных данных. Ситуация очень быстро меняется; все оценки, приведенные ниже, верны по состоянию на 9 февраля.

С чего все началось?

Сравнивая организмы друг с другом, эволюционные биологи многое могут узнать про их историю. Больше всего материала для сравнений содержится в нуклеотидных последовательностях, в случае коронавирусов – в последовательностях РНК. Текущая вспышка – пожалуй, первый случай возникновения нового патогена, когда генетические данные есть почти с самого начала. Первая последовательность «нового» коронавируса (nCoV) появилась в открытом доступе всего через несколько недель после описания первых случаев [1]; для сравнения: при вспышке SARS (тяжелого острого респираторного синдрома, также вызываемого коронавирусами) 2002/2003 года первых последовательностей пришлось ждать много месяцев.

На рис. 1 показано эволюционное дерево коронавирусов. Как и на обычных эволюционных деревьях, расстояние между любыми двумя ветвями здесь соответствует времени, прошедшему с момента расхождения двух линий от их общего предка (LCA – last common ancestor).

nCoV1.jpg

Рис. 1. Эволюционное древо коронавирусов (из работы [4]). Числа около ветвей обозначают их статистическую достоверность по шкале от 0 до 100. Красным выделены штаммы уханьской вспышки (Wuhan), а также ближайший к ним штамм, выделенный из летучей мыши (Bat CoV RaTG13).

Видно, что ближайший родственник группы вирусных штаммов, давших начало этой вспышке, – это коронавирус, выделенный из летучей мыши; между ним и эпидемическими штаммами совпадает около 96% нуклеотидов. Такая картина может означать, что вирус был передан от летучих мышей, хотя окончательные выводы о пути передачи делать рано; в случае SARS, чтобы разобраться, потребовались годы. (Сведения о еще более близких штаммах из панголина пока есть только в виде пресс-релиза [2]). В любом случае все имеющиеся данные свидетельствуют о том, что инфекция была получена из природного резервуара. Чуть дальше расположены штаммы SARS, с которыми совпадает ~80% нуклеотидов; а еще дальше – штаммы MERS, ближневосточного респираторного синдрома [3, 4]. В последовательностях nCoV нет никаких свидетельств искусственной рекомбинации, вставок необычных фрагментов или какого-либо вмешательства; все сообщения об обратном, появлявшиеся в последние дни на препринтных серверах, были отозваны и/или опровергнуты.

Все линии nCoV более близки друг к другу, чем к любой другой известной вирусной последовательности. Это, по-видимому, означает, что занос был единственным. Не всегда бывает так: например, вспышки MERS в разные годы вызывались новыми переносами из природного резервуара – верблюдов [5].

Зная скорость эволюции (см. ниже), можно датировать LCA. По-видимому, он существовал в конце ноября – начала декабря. LCA мог быть у единственного человека, который заразил потом других, или же у животного, от которого заразилось несколько человек – это установить трудно. Первые описанные случаи датируются началом декабря; это означает, что вспышка была обнаружена почти сразу. Образцы вируса, выделенные с рынка в Ухане, очень близки к таковым у самых ранних пациентов из Уханя; это подтверждает, что первые люди заразились именно там.

Неизвестно, как мутации, отличающие nCoV от штаммов, распространенных у животных, изменили его характеристики и изменили ли вообще. Возможно, перескок был несчастной случайностью, не сопровождавшейся никакими изменениями генетических характеристик вируса по сравнению с его предками у диких животных.

Что происходит сейчас?

Любые биологические объекты изменяются в ряду поколений из-за случайных мутаций. «Перескочив» в людей, вирус продолжил эволюционировать, «прорастив» ветвистое эволюционное древо уже в людях (рис. 2) К сожалению, сегодня известны лишь очень немногие «листья» этого древа. Самые новые последовательности из Уханя датируются 3 января, и 42 из 73 известных сегодня последовательностей получены снаружи Китая (при том, что 99% подтвержденных случаев – в Китае [6]). Тем не менее, изучая древо, можно понять довольно много.

nCoV2.jpg

Рис. 2. Эволюционное древо nCoV [7] (слева) и расстояние между образцом и корнем дерева в зависимости от даты получения образца.

Во-первых, можно установить скорость эволюции вируса. Для этого нужно сопоставить даты инфицирования с числом отличий последовательности вируса от «предковой». По текущим оценкам, скорость составляет порядка 10–3 замен на нуклеотид в год [7, 8]; это сопоставимо с таковой у других РНК-содержащих вирусов, например, у гриппа [9]. Это может означать, что, как и в случае с гриппом, трудно будет создать универсальную вакцину, защищающую от всех штаммов, и вакцина потребует периодического обновления.

Во-вторых, можно проследить пути передачи. Первые надежные данные о передаче от человека человеку были получены именно таким образом. Можно задавать и более тонкие вопросы. Сколько людей заражается от членов семьи, сколько на работе, сколько в транспорте, сколько в больнице? Насколько эффективны карантинные меры? Как именно вирус переносится между странами? Можно пытаться узнать это по молекулярным данным. Это очень помогает с другими инфекциями, для которых таких данных больше, например с ВИЧ [10].

В-третьих, можно оценить скорость распространения вируса, а именно ставший знаменитым в последние дни показатель R0. R0, или базовое репродуктивное число, – это число людей, зараженных одним инфицированным за всё время течения болезни в полностью уязвимой популяции. Очевидно, что это ключевой показатель: если R0 меньше единицы, то эпидемия пойдет на спад, а если больше – то будет расти. Разные заболевания характеризуются очень разными значениями R0 – от 1,3 для гриппа до >10 для кори. Для ближайшего родственника nCoV – SARS – R0 составлял около 3 в начале вспышки и около 0,3 в ее конце [11].

Как измерить R0? Можно строить «традиционные» эпидемические модели и оценивать скорость роста числа заболевших. К сожалению, это трудно сделать точно. Начало вспышки трудно датировать, а в разгар эпидемии многие легкие случаи заведомо не диагностируются; даже скорость диагностики тяжелых случаев может зависеть от пропускной способности системы здравоохранения, например от доступности тест-систем.

Эволюционные методы дают другие способы оценить скорость распространения эпидемии. Основная идея такова: общие статистические характеристики древа, например отношения длин ветвей вблизи корня к длинам ветвей около листьев, должны зависеть от того, сохраняет ли патоген приблизительно постоянную численность или же она растет или убывает. Это связано с тем, что длина ветвей древа, построенного по выборке из некой популяции, определяется численностью этой популяции: чем меньше популяция, тем быстрее «встречаются» друг с другом ветви, поскольку повышается вероятность, что две случайно выбранные особи оказываются близкими родственниками. Растущая вспышка вируса определяется относительно короткими ветвями у корня и относительно длинными – около листьев.

Применение такого анализа к nCoV дает оценки R0 в районе 2 или 3 [7, 8]). Конечно, здесь тоже много предположений, многие из которых заведомо неверны: например, что выборка анализируемых последовательностей более-менее случайна и что на вирус не действует отбор. Но данные, полученные с использованием разных методов, взаимно подтверждают друг друга и позволяют сказать, что R0, по-видимому, находится где-то в диапазоне от 2,2 до 3,3 [12].

Что может быть дальше?

В последние дни появились работы, в которых моделируется развитие эпидемии при различных параметрах [13, 14, 15]. Важно понимать, что эти модели – не прогнозы. Во-первых, точность, с которой оценен R0, совершенно недостаточна. При R0~3 в отсутствие каких-либо мер и без предсуществующего иммунитета вспышка, например, в десятимиллионном городе будет быстрой и острой, будет иметь пик через два-три месяца, и на пике будут одновременно инфицированы десятки процентов населения [15]. Если же R0 ниже двух, то пик растянется на много месяцев и будет смазан (рис. 3).

nCoV3.jpg

Рис. 3. Число инфицированных в простейшей детерминистической SIR-модели [16]. Параметры: N=107, γ=0,119.

Во-вторых, практически невозможно моделировать такие факторы, как разработка вакцин, эффективность имеющихся лекарственных препаратов (которая остается пока практически неизвестной), а также принимаемые меры по снижению скорости распространения.

В-третьих, сам по себе R0 мало что говорит о том, насколько серьезной окажется эпидемия: R0 для риновирусов, вызывающих обыкновенную простуду, составляет ~6, однако они не являются столь существенной проблемой мирового здравоохранения. Ключевые параметры, остающиеся неизвестными, – это доля тяжелых и смертельных случаев. Составит ли она ~0,1% от общего числа инфицированных, как для ежегодного сезонного гриппа, 2,5%, как для испанки, или 10%, как для SARS? Эти сценарии будут очень разными. Имеющиеся сегодня данные не позволяют сказать, какой из них сбудется.

Литература:

  1. Wuhan seafood market pneumonia virus isolate Wuhan-Hu-1, complete genome. (2020).
  2. Cyranoski D. Did pangolins spread the China coronavirus to people? Nature (2020) doi: 10.1038/d41586-020-00364-2.
  3. Lu R. et al. Genomic characterisation and epidemiology of 2019 novel coronavirus: implications for virus origins and receptor binding. The Lancet 10 (2020).
  4. Zhou P. et al. A pneumonia outbreak associated with a new coronavirus of probable bat origin. Nature 1–4 (2020) doi: 10.1038/s41586-020-2012-7.
  5. Zhang Z., Shen L. & Gu X. Evolutionary Dynamics of MERS-CoV: Potential Recombination, Positive Selection and Transmission. Sci Rep 6, (2016).
  6. Coronavirus 2019-nCoV global cases by Johns Hopkins CSSE.
  7. Rambaut A. Phylodynamic Analysis | 67 genomes | 08 Feb 2020. Virological (2020).
  8. Bedford T. Nextstrain / narratives / ncov / sit-rep / 2020-01-30 (2020).
  9. Peck K. M. & Lauring, A. S. Complexities of Viral Mutation Rates. Journal of Virology 92, (2018).
  10. Poon A. F. Y. et al. Near real-time monitoring of HIV transmission hotspots from routine HIV genotyping: an implementation case study. Lancet HIV 3, e231-238 (2016).
  11. World Health Organization. Consensus document on the epidemiology of severe acute respiratory syndrome (SARS). (2003).
  12. ncov-R0. Google Docs.
  13. Read J. M., Bridgen J. R., Cummings D. A., Ho A. & Jewell C. P. Novel coronavirus 2019-nCoV: early estimation of epidemiological parameters and epidemic predictions. medRxiv 2020.01.23.20018549 (2020) doi: 10.1101/2020.01.23.20018549.
  14. Riou J. & Althaus C. L. Pattern of early human-to-human transmission of Wuhan 2019-nCoV. bioRxiv 2020.01.23.917351 (2020) doi: 10.1101/2020.01.23.917351.
  15. Wu J. T., Leung K. & Leung, G. M. Nowcasting and forecasting the potential domestic and international spread of the 2019-nCoV outbreak originating in Wuhan, China: a modelling study. The Lancet (2020) doi: 10.1016/S0140-6736(20)30260-9.
  16. Compartmental models in epidemiology. Wikipedia (2020).

Портал «Вечная молодость» http://vechnayamolodost.ru


Нашли опечатку? Выделите её и нажмите ctrl + enter Версия для печати

Статьи по теме