ORGANIZATION OF GENOMIC SURVEILLANCE FOR SARS-CoV-2 WITHIN THE MOSCOW CITY HEALTH DEPARTMENT
- Authors: Latypova M.F.1, Tsibin A.N.1, Komarov A.G.2, Romanova V.A.1, Speshilov G.I.2, Tarnovetsky I.Y.2
- Affiliations:
- Research Institute for Healthcare Organization and Medical Management of Moscow Healthcare Department
- Diagnostic Center (Laboratory Testing Center) of Moscow Heаlthcare Department
- Issue: Vol 30 (2022): Special Issue
- Pages: 1061-1066
- Section: Articles
- URL: https://journal-nriph.ru/journal/article/view/1061
- DOI: https://doi.org/10.32687/0869-866X-2022-30-s1-1061-1066
- Cite item
Abstract
Full Text
Введение В сфере общественного здравоохранения геномика патогенов открывает новую эру открытости данных. В рамках борьбы с пандемией COVID-19 на территории России в середине февраля 2021 г. президент В. Путин поручил правительству расширить и профинансировать научно-практические исследования по расшифровке (секвенированию) геномов возбудителей инфекций, циркулирующих в России и в мире, а также провести дополнительные исследования эффективности вакцин против новых штаммов коронавируса 71. Чуть позже, 24.05.2021 глава правительства РФ подписал распоряжение № 1339-р о выделении средств из резервного фонда правительства для Роспотребнадзора, из которых 400 млн руб. направить на проведение секвенирования геномов 48 тыс. проб с образцами коронавируса 72. Затем, 23.03.2022 премьер-министр М. Мишустин подписал постановление № 448, в соответствии с которым федеральные и региональные организации, проводящие молекулярно-генетические исследования вирусов, должны направлять информацию по расшифровке генома возбудителя коронавируса в ЦНИИ эпидемиологии в течение 1 сут с момента их получения 73. Во исполнение поручений для обеспечения быстрого доступа к данным об эпидемиях и пандемиях вируса создана российская платформа агрегации информации о геномах вирусов VGARus (Virus Genome Aggregator of Russia - Агрегатор геномов вирусов России). База данных VGARus содержит информацию о нуклеотидных последовательностях вирусов SARS-CoV-2 и их мутациях, распространённых в тех или иных регионах РФ, и может быть использована для хранения, систематизации и выборки данных для выявления мутаций и определения штаммов вирусов. Разработчиком этой программы и консолидирующим центром стал Центральный НИИ эпидемиологии Роспотребнадзора. Программное обеспечение, интегрированное в платформу VGARus, позволяет анализировать результаты секвенирования, определять вероятный штамм вируса, формировать стандартизированные отчёты, загружать образцы, предназначенные для дальнейшего секвенирования. В настоящее время все научные учреждения России, занимающиеся секвенированием геномов коронавируса и зарегистрировавшиеся на портале в качестве пользователей, имеют возможность выложить изучаемые геномные последовательности в Национальную базу данных. Полученные регистрационные удостоверения позволяют предоставить зарегистрированным пользователям возможности пользоваться информацией из базы данных. Доступ к платформе осуществляется через портал genome.crie.ru. Эта платформа при необходимости может быть использована как база для мониторинга за другими инфекциями 74. В структуре Департамента здравоохранения города Москвы лидером в использовании секвенирования следующего поколения в отношении SARS-CoV-2 стал ГБУЗ «Диагностический центр (Центр лабораторных исследований) ДЗМ» (ДЦЛИ), который первым наладил применение этой инновационной технологии: «Экстракция нуклеиновой кислоты образца - подготовка NGS-библиотеки - секвенирование нового поколения (NGS) - анализ данных». Начало работ регламентировано нормативными документами Департамента здравоохранения города Москвы (ДЗМ) 75, 76, 77. Внедрение секвенирования следующего поколения (NGS) потребовало инвестиций в оборудование, а также в высокопроизводительную вычислительную инфраструктуру для перемещения, хранения и анализа больших объёмов данных последовательностей. Не менее важным было осуществить интеграцию секвенирования с биоинформатикой - новой дисциплиной для общественного здравоохранения. Секвенирование следующего поколения и биоинформатика трансформируют реакцию на вспышки COVID-19, обеспечивая новое понимание возникновения и передачи, ускоряя характеристику патогенов и способствуя обмену данными. Секвенирование, особенно полногеномное, часто требует чистых культур патогенных микроорганизмов, получение которых проблематично. Поэтому клинические лаборатории расширяют использование высокомультиплексных тестов, независящих от культуры клеток. Секвенирование геномов патогенов непосредственно из образцов явилось одним из решений, позволяющих обойти процедуру культивирования. Однако этот метод для исследования отдельных микроорганизмов в конкретных образцах ещё не адаптирован для повседневного использования в медицинских организациях ДЗМ. Существуют определённые трудности: техническая сложность выполнения и интерпретации результатов, соблюдение требований к отчётности и надзору за выполнением технологии. Несмотря на то что стоимость и сложность генетического секвенирования со временем значительно снизились, эффективные программы секвенирования по-прежнему требуют значительных ресурсов: персонала, оборудования, реагентов и биоинформационной инфраструктуры. Лаборатории геномного секвенирования и анализа должны быть тесно интегрированы с существующими диагностическими и эпидемиологическими программами общественного здравоохранения. Сотрудничеству между группами по секвенированию будут способствовать общие протоколы секвенирования, стандартизация структуры базы данных и форматов метаданных, совместное обучение, а также доступ к аудитам и проверкам квалификации с использованием эталонных стандартов. Целью данной статьи является обмен уникальным опытом лабораторной службы города Москвы по адаптации технологии NGS для нужд общественного и столичного здравоохранения на предмет осуществления надзора за появляющимися изменениями в геноме SARS-CoV-2, потенциально повышающими его трансмиссивность и/или вирулентность, а также поиск альтернативного, быстрого и достаточно эффективного решения для выявления мутаций и штаммов нового коронавируса, пригодного к использованию в национальном масштабе. Материалы и методы В этом наблюдательном геномно-эпидемиологическом исследовании применён способ таргетного высокопроизводительного NGS полного генома вируса SARS-CoV-2, для чего использовалась праймерная панель, основанная на «Artic Network» («ДиаСистемс», Россия). С помощью представленной панели исследовано 16 816 назофарингиальных образцов, полученных от пациентов с подозрением на новую коронавирусную инфекцию, проживающих в городе Москве, в период с 15.07.2021 по 11.04.2022. Отбор образцов для секвенирования. В качестве биологического материала для секвенирования применяли образцы с биоматериалом из верхних дыхательных путей (назофарингиальные мазки) от пациентов с подозрением на COVID-19, поступивших в лаборатории ДЦЛИ с целью исследования на наличие РНК SARS-CoV-2 методом ОТ-ПЦР в качественном варианте. Биоматериал доставлялся с учётом требований в различных транспортных средах, предназначенных для этих целей и имеющих регистрационные удостоверения Росздравнадзора. Среди них: физиологический раствор, транспортная среда XK-PCR30 («Jiangsu Xinkang Medical Instrumet Co.») и транспортная среда ГЕМ («Гем»). Для исследования образцов на наличие РНК SARS-CoV-2 применяли различные наборы реагентов для ОТ-ПЦР и комплектные к ним наборы для выделения РНК: «ПОЛИВИР SARS-CoV-2 Express» («ЛИТЕХ»), «АмплиПрайм SARS-CoV-2 DUO/МагноПрайм ФАСТ-Р» («НекстБио») и «CoV-2-Тест» («ТестГен»). Пригодными к секвенированию считали образцы, в которых концентрация РНК SARS-CoV-2 при постановке ОТ-ПЦР соответствовала пороговому числу циклов менее 28-31. Подготовка образцов и секвенирование. Подготовка библиотек для секвенирования из выделенной РНК SARS-CoV-2 включала несколько этапов. На первом этапе происходило обогащение образца последовательностями генома SARS-CoV-2 методом обратной транскрипции (ОТ) и мультиплексной амплификацией со специфичными праймерами. Для этого этапа применялся подход «2 реакции в одной пробирке», т. е. синтез кДНК c матрицы РНК вируса и последующая её амплификация производились последовательно в одной пробирке, содержащей смесь ферментов для обратной транскрипции и амплификации. Для мультиплексной амплификации использовали набор специфических праймеров («ДиаСистемс», Россия). Первый этап выполняли на амплификаторах «T100» («Bio-Rad»): при 55°C проводили реакцию обратной транскрипции (ОТ-ПЦР), с образованием первой цепи кДНК, после чего смесь нагревали до 95°C и проводили этап амплификации, полученной кДНК. Таким образом, каждый исследуемый образец подлежал двум реакциям ОТ-ПЦР, которые проводили параллельно, с двумя смесями специфических праймеров для мультиплексной амплификации. Каждая из смесей позволяла получить набор ампликонов, покрывающих половину генома короновируса: первая смесь позволяла получить набор нечетных ампликонов (1, 3, 5 и т. д.), а вторая смесь - чётных ампликонов (2, 4, 6 и т. д.). При смешивании продуктов амплификации обоих смесей получали набор перекрывающихся ампликонов, покрывающих полный геном коронавируса SARS-CoV-2. Наборы, использовавшиеся для мультиплексной амплификации праймеров («ДиаСистемс»), содержали ген-специфические части из базы данных международного консорциума исследователей ARTIC network (Advancing Real Time Infection Control) - международного консорциума по анализу инфекций, предложившего набор праймеров для амлификации генома SARS-CoV-2, ставшие международным стандартом. На втором этапе проводили ре-амлификацию (баркодирование) продуктов ОТ-ПЦР без промежуточной очистки с использованием набора адаптерных олигонуклеотидов («ДиаСистемс»), совместимых с платформой секвенирования MiSeq («Illumina»). Контроль прохождения этапа баркодирования проводился с использованием системы амлификации в режиме реального времени, с применением интеркалирующего красителя SYBR Green на амплификаторе CFX-96 («Bio-Rad»). В результате реакции каждый образец представлял собой готовую библиотеку для NGS в формате двусторонних чтений 2×250 пар оснований (п.о.) с двусторонним баркодированием. Набор используемых адаптерных олигонуклеотидов (индексов) позволял одновременно мультиплексировать и секвенировать 384 образца SARS-CoV-2 в рамках одного запуска секвенатора «Illumina MiSeq» с использованием набора реактивов «MiSeq 600 cycles v3», запускаемого в режиме чтения 2×250 п.о. Среднее число прочтений на один образец составляло примерно 64 000. Баркодированные библиотеки без промежуточного измерения концентрации смешивали в равных объёмах с целью последующей очистки готовой смеси на магнитных частицах. Для этого к смеси библиотек добавляли магнитные частицы AMPure («Beckman Coulter Life Sciences») и проводили двойную очистку, согласно стандартному протоколу производителя. В процессе двойной очистки из раствора были удалены фрагменты праймер-димеров, негативно влияющие на запуск секвенатора. Только после этих процедур в полученном растворе измеряли концентрацию пула ДНК-библиотек на флуориметре «Qubit 4» («Thermo Fisher Scientific»). Используемый протокол пробоподготовки на реактивах производства «ДиаСистемс» оказался максимально удобным и быстрым по времени выполнения, т. к. исключал стадии промежуточной очистки продуктов ОТ-ПЦР, квантификацию каждого отдельного образца и требовал всего одну очистку и квантификацию готовой смеси библиотек. Высокий уровень мультиплексирования, обеспеченный сбалансированностью панели специфических праймеров для мультиплексной амплификации, и применение простого протокола пробоподготовки позволили обеспечить выполнение анализа из большого количества проб с временем подготовки смеси 384 библиотек на запуск работы секвенатора «Illumina MiSeq Dx» менее чем за 4 ч. В качестве примера для сравнения - широко используемый набор реактивов «QIAseq SARS-CoV-2» («Primer Panel Qiagen») обеспечивает одновременный анализ всего 24 образцов с применением того же секвенатора и набора реагентов для секвенирования к нему. Наш подход позволил достигнуть производительность анализа более 1500 образцов в неделю в режиме максимальной загрузки с параллельным применением всего 2 секвенаторов «Illumina MiSeq». Анализ данных секвенирования. Для анализа данных был использован стандартный алгоритм, предложенный консорциумом «Artic Network» 78. Для обработки данных применяли программное обеспечение (ПО) с открытым исходным кодом. Биоинформатический анализ проводили с использованием облачных кластерных вычислений на платформе Yandex Cloud. Обработку осуществляли параллельно 150 виртуальных машин, каждая из которых содержала 4 CPU и 8 Гб RAM. Одна виртуальная машина обрабатывала данные с секвенатора за время порядка 10 мин. В результате, анализ 384 образцов в рамках одного запуска при использовании 150 виртуальных машин параллельно занимал время около 30 мин. Российская облачная платформа Yandex Cloud обеспечивала дополнительную сохранность обезличенных геномных данных. Первичный контроль качества данных, получаемых в ходе биоинформатического анализа, выполняли следующим образом: полученные сырые данные прочтений в формате fastq с прибора «Illumina MiSeq Dx» фильтровали по качеству с помощью ПО «Trimmomatic v.0.39» с качеством более Q20. На следующем этапе данные, отфильтрованные по качеству прочтения, выравнивали на стандартный референсный геном сравнения Wuhan-Hu-1 (GenBank: MN908947.3) с использованием ПО «Minimap2 v. 2.24». Из выровненных прочтений удаляли последовательности праймеров мультиплексной панели для ОТ-ПЦР, не несущие геномной информации. После этого следовала процедура поиска (коллинг) вариантов, с помощью программного обеспечения юGATK v. 4.2.6.1», т. е. сравнение картированных прочтений с геномом сравнения и выявлением вариантов (отличий) анализируемого образца по отношению к референсному геному при наличии покрытия более 5. На основе найденных вариантов собирались итоговые (консенсусные) последовательности геномов SARS-CoV-2 в формате fasta с помощью программы Bsftools. Далее эти последовательности аннотировали с применением баз данных Pango-lineage и NextStain. В процессе аннотации каждой найденной вариации в геноме присваивали соответствующее белковое изменение и определяли штамм и подштамм генома нового коронавируса, присутствующего в образце, взятом у пациента с подозрением на COVID-19. Результат исследования образца получали определением генома вируса, кодируемого в формате fasta, представившим информацию о его принадлежности к определённому штамму и подштамму SARS-CoV-2. В случае невозможности определения штамма в связи с фрагментированным прочтением генома образец отмечался как брак и подлежал выбраковке. Все последовательности геномов в формате fasta, полученные в настоящем исследовании, были загружены в российскую базу данных нуклеотидных последовательностей вируса SARS-CoV-2 и его мутаций VGARus 79. Результаты С начала мониторинга 15.07.2021 по 11.04.2022 было проанализировано 16 816 образцов от амбулаторных (81,3%) и стационарных (18,71%) больных. Среднее покрытие одного образца составило 653. После биоинформатического анализа данных и контроля качества принадлежность к штамму SARS-CoV-2 была определена в 15 759 образцах пациентов. Важно подчеркнуть, что из общего количества исследованных проб было выявлено 7 образцов с высоким покрытием (489-1608х) и с уникальными профилями мутаций, характерными для разных штаммов SARS-CoV-2. Эти образцы были переданы в ФГБУ «Национальный исследовательский центр эпидемиологии и микробиологии им. почётного академика Н. Ф. Гамалеи» Минздрава РФ для дальнейшего изучения в культуре клеток. Следует отметить, что такие химерные штаммы, в том числе «Дельтакроны», были зарегистрированы в лабораториях по всему миру и долгое время считались результатом лабораторной контаминации. Однако в марте 2022 г. ВОЗ признала существование рекомбинантных штаммов во Франции, Дании и Нидерландах. Для остальных 1050 образцов было получено фрагментарное прочтение генома, недостаточное для определения штамма. ГБУЗ «ДЦЛИ ДЗМ» на 05.04.2022 находился на 1-м месте в рейтинге институтов по числу загруженных данных полногеномного секвенирования SARS-CoV-2 в национальную российскую базу VGARus. В результате проведённых нами исследований наблюдалась сменяемость генетических линий. С июля 2021 г. до середины января 2022 г. в Москве преобладал штамм Дельта (B.1.617.2), но с середины декабря (запуск 16.12.2021) были обнаружены первые образцы с штаммом Омикрон (B.1.1.529). Немного более чем за месяц этот штамм почти полностью вытеснил штамм Дельта. Последние единичные образцы, содержащие штамм Дельта, были зафиксированы в запуске от 25.02.2022. Кроме того, наблюдалось динамика подштаммов, при которой один из них вытеснял другой. Так например, было выявлено большое число подштаммов Дельта: AY.12, AY.4, AY.6, AY.9, AY.7, AY.11, AY.20, AY.23, AY.23.1, AY.29, AY.3, AY.34, AY.38, AY.39, AY.5, AY.5.2, B.1.617.2, AY102, AY.33, AY.43, AY.48, AY.49, AY.122, AY.103, AY.110, AY.36, AY.59, AY.70, AY.75, AY.77, AY.88, AY.92, AY.98.1, AY.99, B.1.1.523, AY.85, AY.4.5, AY.106, AY.72, AY.46, AY.61, AY.25, AY.118, AY.122.1, AY.44, AY.116, AY.121, AY.82, AY.28, AY.120, AY.86, AY.35, AY.100, AY.120.1, AY.46.1, AY.73, AY.78, AY.119, AY.114, AY.4.2, AY.80, AY.9.1, AY.71, AY.113, AY.91, B.1.1.529, AY.5.3, AY.108, AY.105, AY.111, AY.125, AY.84, AY.42, AY.5.4, AY.74, AY.46.6, AY.124, AY.47, AY.126, AY.129, AY.127, AY.117, AY.7.1, AY.4.6, AY.45. В условиях Москвы почти все они были замещены разновидностью AY.122 в период с 08.10.2021 по 25.02.2022. Аналогичные изменения наблюдали среди подштаммов Омикрон: BA.1, BA.2, BA.1.1, BA.2.3, BA.1.17, BA.1.14, BA.1.15, BA.3, B.1.1, BA.2.9, BA.2.10, BA.2.12, BA.2.6, BA.1.17.2. Кроме базового штамма (B.1.1.529) были выявлены и превалировали 6 сублиний: BA.1, BA.2, BA.1.14, BA.1.15, BA.1.17, BA.2.3. С 14.01.2022 в Москве появилась датская разновидность BA.2 (стелс-омикрон), которая стала быстро вытеснять остальные линии. По данным секвенирования от запуска 08.04.2022, её относительная численность составляла более 85% исследуемых образцов (219 образцов в запуске). Обсуждение С начала пандемии COVID-19, вызываемой SARS-CoV-2, во всём мире регулярно фиксируют появление мутаций этого коронавируса, потенциально повышающих его трансмиссивность и/или вирулентность. В частности, с конца 2020 г. в мире обнаружено несколько вызывающих озабоченность вариантов, включая Альфа (B.1.1.7), Бета (B.1.351), Гамма (P.1), Дельта (B.1.617) и Омикрон (B.1.1.529). Однако существующие способы поиска мутаций, выявления штаммов и их подштаммов методом полногеномного секвенирования не всегда достаточно эффективны, занимают много времени, обладают низкой производительностью из-за трудоёмких протоколов пробоподготовки и обладают высокой стоимостью. В нашей работе представлен высокопроизводительный подход, с помощью которого определена динамика циркуляции в Москве штаммов Дельта и Омикрон нового коронавируса, а также сменяемость их подштаммов в период с июля 2021 г. по 11.04.2022. Установлено, что штамм Дельта преобладал на территории Москвы с июля 2021 г. до середины января 2022 г., а последние единичные образцы, содержащие Дельту, были зафиксированы 25.02.2022. За весь этот период было выявлено 85 разновидностей штамма Дельта, среди которых доминирующим стал AY.122 с 08.10.2021 по 25.02.2022. Однако с середины декабря 2021 г. в лаборатории ГБУЗ «ДЦЛИ ДЗМ» были обнаружены первые образцы с штаммом Омикрон. Среди выявленных 14 подштаммов Омикрон доминировали 6 сублиний: BA.1, BA.2, BA.1.14, BA.1.15, BA.1.17, BA.2.3. Отмечено, что с 14.01.2022 в Москве появилась датская разновидность BA.2 (стелс-омикрон), быстро вытесняющая остальные линии. А к началу апреля 2022 г. доля стелс-омикрона BA.2 в еженедельных анализах составила более 85%, тогда как остальные 15% относились к другим подштаммам Омикрон: BA.1.14, BA.1.15, BA.1.17. Результаты настоящего исследования представили целесообразность описанного подхода для осуществления геномного надзора за циркуляцией штаммов SARS-CoV-2 и их подштаммов. Методика позволяет изучать большее количество образцов в короткие сроки и получить без задержек более детальное представление об эпидемиологической ситуации на определённой территории с последующей агрегацией полученной информации о геномах вирусов в базу данных VGARus. Нами адаптирован максимально удобный и быстрый протокол пробоподготовки, требующий всего одну очистку и квантификацию готовой смеси библиотек, представлена панель специфических праймеров, обеспечивающая высокий уровень мультиплексирования. В совокупности они позволяют обеспечить выполнение анализа из большого количества проб, с временем подготовки смеси 384 библиотек на запуск работы секвенатора «Illumina MiSeq Dx» менее чем за 4 ч. Наш метод позволяет достигнуть производительность анализа более 1500 образцов в неделю в режиме максимальной загрузки с параллельным применением всего 2 секвенаторов «Illumina MiSeq». Выводы Описанный подход может быть рекомендован к использованию для выявления новых и существующих разновидностей SARS-CoV-2 как в отдельно взятом регионе, так и в национальном масштабе. Заключение Геномный надзор имеет важное значение для борьбы с COVID-19 и должен осуществляться в России на комплексной и совместной основе. Он даёт возможность получения информации, важной для реализации более адресной стратегии московского и российского здравоохранения против нового коронавирусного заболевания, а также других инфекций. Активизация усилий по смягчению последствий, благодаря выявлению в короткие сроки мутаций, включая те, которые способствуют повышенной трансмиссивности вируса или ускользанию от поствакцинального иммунитета, открывает уникальные возможности для обеспечения быстрого геномного надзора и демонстрирует его необходимость. Источник финансирования. Создание в ГБУЗ «ДЦЛИ ДЗМ» лаборатории, использующей способ таргетного высокопроизводительного секвенирования нового (следующего) поколения (next generation sequencing, NGS) полного генома вируса SARS-CoV-2 в части, предусматривающей организационные мероприятия и материально-техническое обеспечение, проводилось при поддержке Департамента здравоохранения города Москвы. Конфликт интересов. Авторы заявляют об отсутствии конфликта интересов.About the authors
M. F. Latypova
Research Institute for Healthcare Organization and Medical Management of Moscow Healthcare Department
Email: kdlorg-1@mail.ru
A. N. Tsibin
Research Institute for Healthcare Organization and Medical Management of Moscow Healthcare Department
A. G. Komarov
Diagnostic Center (Laboratory Testing Center) of Moscow Heаlthcare Department
V. A. Romanova
Research Institute for Healthcare Organization and Medical Management of Moscow Healthcare Department
G. I. Speshilov
Diagnostic Center (Laboratory Testing Center) of Moscow Heаlthcare Department
I. Yu. Tarnovetsky
Diagnostic Center (Laboratory Testing Center) of Moscow Heаlthcare Department