Подписаться на новости
  • Сенатор
  • ООО "Ай Вао"
  • medtech
  • ММИФ-2018
  • Vitacoin

ДНК-архив

Память на искусственной ДНК

Алексей Понятов, «Наука и жизнь» по материалам Университета штата Вашингтон: UW team stores digital images in DNA – and retrieves them perfectly

На завершившейся 6 апреля в Атланте (США) 21-й Международной конференции по архитектурной поддержке языков программирования и операционных систем исследователи из университета Вашингтона и фирмы Microsoft представили доклад, в котором описали систему хранения информации на синтезированных ДНК. Им удалось не только сохранить этим способом различные виды информации (текст, изображения, звук), но и безошибочно прочитать их.

dna_info1.jpg
Три изображения, которые были закодированы в ДНК, а затем успешно извлечены обратно.
(Рисунок здесь и ниже – Tara Brown Photography/ University of Washington.)

Молекулы ДНК, созданные природой для хранения генетической информации живых организмов, способны хранить информацию во много миллионов раз более плотно, чем все существующие технологии для цифровых запоминающих устройств – жесткие и оптические диски, флэш-накопители и др. Кроме того, ДНК может надежно сохранять данные в течении нескольких столетий в отличие от срока от нескольких лет до двух-трех десятилетий для прочих устройств. По оценкам предел плотности записи на ДНК достигает 1 эксабайт на мм3 (1018 байт/мм3) при периоде полураспада более 500 лет. Правда, пока доступ к записанной таким образом информации очень медленный (от десятков секунд до часов), так что такую систему можно использовать только для архивного хранения данных.

dna_info2.jpg2
Все данные из сотен обычных смартфонов (10 000 гигабайт) 
можно хранить в слабом розовом мазке ДНК в конце этой пробирки.

Кодирование осуществляется с помощью четырех основных строительных блоков ДНК: аденина (А), гуанина (G), цитозина (C) и тимина (T). Эти блоки соответствуют цифрам кода. Поскольку их четыре, то двоичные числа перед кодированием переводятся в код с другим основанием. В простейшем случае, может использоваться система с основанием 4, тогда A, C, G, T сопоставляются цифрам 0, 1, 2, 3. Процесс кодирования, к примеру, двоичной последовательности 01110001 заключается в ее замене на код Хаффмена при основании 4 – 1301, а затем синтезе цепочки ДНК – СТАС. Однако такое кодирование не позволяет уберечься от многочисленных ошибок, возникающих при синтезе ДНК, поэтому пришлось разработать специальный метод кодирования, уменьшающий вероятность ошибки, и кроме того, добавить к биотехнологиям схемы коррекции ошибок, используемые в компьютерной памяти.

Исследователи решили и проблему произвольного доступа к информации, записанной на большом количестве различных ДНК. Для этого они научились кодировать в них служебные данные («индексы»), позволяющие находить нужную информацию. С помощью полимеразной цепной реакции, используемой в молекулярной биологии, они идентифицировали нужные индексы, а затем, используя методы секвенирования (определения последовательности блоков) ДНК, читали данные.

Эта работа представляет большой интерес на фоне лавинообразного роста информации во всем мире. По прогнозам в 2017 году ее количество возрастет до значения более 16 зеттабайт (1021). Даже при условии, что далеко не все надо сохранять, это огромное число. А наибольшая плотность коммерчески доступной памяти на ленточных картриджах составляет всего 10 гигабайт на мм3 (1 ГБ = 109 Б), даже самые последние исследования обещают оптические диски с плотностью всего около 100 ГБ/мм3. Высота нужной стопки таких дисков будет больше расстояния до Луны. Разумеется, пока стоимость и эффективность памяти на ДНК оставляют желать лучшего, но исследователи считают эти проблемы вполне решаемыми.

Портал «Вечная молодость» http://vechnayamolodost.ru
 08.04.2016

Читать статьи по темам:

синтетическая биология база данных Версия для печати
Ошибка в тексте?
Выдели ее и нажми ctrl + enter
назад

Читать также:

Библиотека в горстке семян

По мнению учёного, использование четырёхбуквенного языка ДНК в виде двоичного кода позволит хранить огромные объёмы информации в ДНК растений.

читать

Хранить вечно

Магнитные пленки, DVD, диски Blue-ray способны сохранить запись максимум десятки лет. Чтобы информация оставалась в целости веками и тысячелетиями, придется воспользоваться рецептом природы – молекулами ДНК.

читать

Программирование ДНК: как и зачем

Технология программного кода «Cello» позволяет прописывать в ДНК бактерий требуемый набор свойств и создавать биологические схемы с нужными логическими параметрами, работающие внутри живой клетки.

читать

Выпрямитель из нуклеотидов

Самый маленький диод – выпрямитель электрического тока – представляет собой короткий фрагмент ДНК, в который введены две посторонние молекулы.

читать

Язык программирования для ДНК

Инженеры из Массачусетского технологического института разработали язык ДНК-программирования, который позволит человеку без углубленных знаний биологии создавать бактерии с желаемыми свойствами.

читать

Прожиточный минимум

Михаил Гельфанд – о том, что такое минимальный геном и как он продвигает нас к созданию синтетической жизни.

читать