Подписаться на новости
  • Сенатор
  • ООО "Ай Вао"
  • zdravomyslie
  • bio-mol-tekst-2021
  • Save Sci-Hub

Виртуальные геномы

Машинное обучение генерирует реалистичные геномы несуществующих людей

XX2 век

Благодаря новым алгоритмам и достижениям в области компьютерных технологий, электронные вычислительные машины теперь могут обучать сложные модели искусственного интеллекта и генерировать высококачественные синтетические данные, такие как фотореалистичные изображения или резюме вымышленных людей. В исследовании, недавно опубликованном в международном журнале PLOS Genetics (Yelmen et al., Creating artificial human genomes using generative neural networks), представлен обученный на базах существующих биобанков алгоритм машинного обучения, генерирующий фрагменты человеческих геномов, не принадлежащих реальным людям, но имеющих характеристики реальных ДНК.

realistic-genomes.jpg

Генератор формирует случайный шум, в то время как дискриминатор проверяет сгенерированные данные по базе имеющихся реальных данных. По завершении процесса алгоритм генерирует искусственные данные, которые выглядят как настоящие, но на самом деле являются совершенно новыми.

– Существующие базы данных геномов – бесценный ресурс для биомедицинских исследований, но они либо недоступны для сообщества, либо защищены длительными и изнурительными процедурами подачи заявок в связи с обоснованными этическими соображениями. Это создаёт серьёзный барьер для исследователей. Машинные геномы, или искусственные геномы, как мы их называем, могут помочь нам преодолеть эту проблему в безопасных этических рамках, сказал Бурак Йельмен (Burak Yelmen), первый автор исследования, специалист по современной популяционной генетике из Тартуского университета (Tartu Ülikool).

Многопрофильная группа учёных провела множество анализов для оценки качества генерируемых геномов по сравнению с реальными.

– Удивительно, но эти геномы, создаваемые случайно, имитируют сложности, которые мы можем наблюдать в реальных человеческих популяциях, и по большинству свойств они не отличаются от других геномов из базы данных, которую мы использовали для обучения нашего алгоритма, за исключением одной детали: они не принадлежат ни одному из доноров, объясняет доктор Лука Пагани (Luca Pagani), один из старших авторов исследования.

Оценка близости искусственных геномов к реальным производится также, чтобы проверить, сохраняется ли конфиденциальность оригинальных образцов.

– Хотя поиск утечек среди тысяч геномов может показаться поиском иголки в стоге сена, сочетание множества статистических вычислений позволило нам тщательно проверить все модели. Детальное изучение сложных закономерностей утечки может привести к улучшению оценки и проектирования генеративных моделей, а также будет способствовать развитию машинного обучения, сказала Флора Джей (Flora Jay), координатор работы и исследовательница в Междисциплинарной вычислительной лаборатории Университета Париж-Сакле (Université Paris-Saclay).

С использованием машинного обучения уже генерируются лица, биографии, а теперь и геномы несуществующих людей. Эти воображаемые люди с реалистичными геномами могли бы служить в исследованиях своего рода представителями реальных геномов, доступ к которым затруднён для учёных.

Портал «Вечная молодость» http://vechnayamolodost.ru

Читать статьи по темам:

геномика компьютеры Версия для печати
Ошибка в тексте?
Выдели ее и нажми ctrl + enter
назад

Читать также:

ИИ умеет много гитик

Новая система анализирует генетические данные и строит прогнозы на основе десятков тысяч геномных вариаций.

читать

Три кита кризиса

Кризис современной науки, вызванный взрывным ростом числа лабораторий и исследовательских проектов, в биологии и медицине базируется на трех проблемных «китах».

читать

Так держать!

Первый раунд соревнования по машинному обучению в биологии DREAM-ENCODE, приуроченный к международной конференции DREAM, выиграла команда autosome.ru из России.

читать

Искусственный интеллект made in China

Руководитель Пекинского института геномики Цзюнь Ван удивил научное сообщество, сложив свои полномочия в начале июля 2015 года. Теперь он объявил о своём желании сосредоточиться на исследованиях в области искусственного интеллекта.

читать

EMC и Академический университет создают ПО для биоинформатических расчетов

Анализ данных геномики и других «-омик» – такая же big data, как социальные сети или данные Большого адронного коллайдера.

читать