25 Марта 2019

Рекорд скорости

Скорость чтения-записи ДНК разогнали до 1,9 бит/час

Максим Абдулаев, «Чердак»

Успешные попытки такого рода были и прежде, но теперь процесс записи и чтения, во-первых, впервые удалось автоматизировать, а во-вторых – ускорить.

Ученые Вашингтонского университета (США) и корпорации Microsoft смогли записать данные на ДНК, как на какой-нибудь цифровой носитель. Они автоматизировали процедуру кодирования цифровых данных в «генетический алфавит» и потратили на запись в ДНК слова hello и его чтение 21 час.

ДНК – очень компактное и долговечное хранилище информации. Один миллилитр ДНК может уместить до миллиарда гигабайт информации, которая может храниться тысячи лет, – сегодня ученые расшифровывают геномы палеонтологических находок, которым десятки тысяч лет. Другие же ученые занимаются не чтением, а записью информации в ДНК. Пока что рекорд объема данных, которые удалось втиснуть в ДНК той же самой исследовательской группе, – 200 мегабайт. Процесс записи до недавнего времени выглядел так: сначала информацию в виде двоичного кода из единиц и нулей переводили на «азбуку жизни» азотистых оснований (А, Т, Г, Ц), затем синтезировали ДНК с такой последовательностью. А чтобы считать информацию с ДНК, последовательность секвенировали, а затем снова переводили в двоичный код. При этом каждый шаг производился отдельно, что занимало массу времени и вообще не было похоже на использование обычного хранилища файлов.

Как сказал один из авторов статьи, опубликованной в журнале Scientific Reports (Takahashi et al., Demonstration of End-to-End Automation of DNA Data Storage), «вокруг дата-центра не должны бегать люди с пипетками». Поэтому ученые автоматизировали систему и создали комплекс, внутри которого происходят все стадии процесса.

Выглядит он так:

Чтобы апробировать свою установку, ученые перевели слово Hello в двоичный код, получив последовательность размером 5 байт (01101000 01100101 01101100 01101100 01101111), а затем перевели его в четверичный код, в котором А был нулем, Ц единицей, Г = 2, а T = 3. После этого установка синтезировала ДНК в соответствующей последовательности. Всего насинтезировали 1 миллиграмм ДНК, из которого в секвенатор по специальному насосу отправилось 4 микрограмма.

Система расшифровывает ДНК нанопоровым секвенированием. В этом методе используется тонкая мембрана всего в полтора нанометра толщиной, в которую встроены белки-поры. Мембрана делит пополам камеру с раствором электролита, в котором плавает ДНК. Когда через систему подается ток, ДНК, которая заряжена отрицательно, ползет к «плюсу», по ту сторону мембраны. По дороге она протискивается через поры, и азотистые основания, из которых она состоит, затыкают отверстие. Ручеек ионов электролита, который тоже течет через пору, становится уже, и сила тока, текущего через мембрану, падает. Разные нуклеотиды имеют разную форму и в разной степени затыкают проход, поэтому по снижению тока можно определить, какой именно нуклеотид сейчас лезет через пору.

Секвенаторы такого типа позволяют расшифровывать очень длинные куски ДНК, до 100 000 пар оснований. Правда, точность у них ниже, чем у лучших секвенаторов других типов, – количество ошибок может доходить до 10%. Зато стоят они от 1000 долларов, размером меньше смартфона и работают быстро – у авторов статьи процесс расшифровки занял шесть минут. Весь остальной процесс не был таким же быстрым. На всё про всё ушел 21 час, причем львиную долю времени занял синтез ДНК.

Как пишут ученые, 5 байт за 21 час пока нельзя назвать коммерчески жизнеспособными показателями. Тем не менее, прежние технологии хранения данных тоже начинали с не очень впечатляющих результатов. Сейчас ученые собираются уменьшить время синтеза ДНК, а также сделать многократными запись и считывание информации.

Портал «Вечная молодость» http://vechnayamolodost.ru

Рекорд скорости

Скорость чтения-записи ДНК разогнали до 1,9 бит/час

Статьи по теме

ДНК «Гамлета»

400 петабайт на один грамм ДНК

ДНК-хранилище нового поколения

Бактериальная «флешка»

Без ПЦР