15 Июля 2016

Шифровка в ДНК

Исследователи центра интегрированных нанотехнологий Сандийских национальных лабораторий США, работающие под руководством Джорджа Бачанда (George Bachand), работают над новым исключительно надежным методом кодирования и хранения важной информации. Они предлагают использовать в качестве носителя данных ДНК, уникальность которой заключается в беспрецедентной компактности и долговечности. Так, даже из найденных в реке Юкон останков коня, возраст которых составляет около 600 000 лет, была выделена «читабельная» ДНК.

Используемые для хранения информации пленки и диски могут изнашиваться и выходить из строя, поэтому нуждаются в регулярном переписывании примерно раз в десятилетие. Хранение данных на серверах или в облачных хранилищах требует огромных затрат электроэнергии. Электричества, потраченного серверами Google за 2011 год, хватило бы на электроснабжение 200 000 домов в США. Более того, старые методы хранения информации требуют очень много места.

На работу с ДНК Бачанда вдохновили последние достижения в данной области (недавний рекорд – специалистам компании Microsoft удалось записать в еле видной капле на дне пробирки 200 Мб информации).

В рамках своего проекта Бачанд и его коллеги с помощью практически не поддающегося расшифровке шифровального ключа закодировал сокращенную версию исторического письма президента Гарри Трумана в ДНК. После этого они синтезировали молекулу ДНК, нанесли ее на печатный бланк учреждения и послали его вместе с обычным бумажным письмом путешествовать по стране. После возвращения письма они успешно выделили ДНК из бумаги, амплифицировали ее и декодировали послание в течение примерно 24 часов. Затраты на эту процедуру составили примерно 45 долларов США.

Первым этапом этого проекта была разработка программного обеспечения, генерирующего шифровальный ключ и кодирующего текст в последовательность ДНК.

ДНК состоит из четырех типов нуклеиновых оснований, обычно обозначаемых буквенными сокращениями: А (аденин), С (цитозин), G (гуанин) и Т (тимин). С помощью триплетного (триплет – 3 последовательных нуклеотидных основания) кода, используемого всеми живыми организмами для кодирования генетической информации, можно закодировать 64 различных символа (букв, пробелов и знаков препинания), которых с запасом достаточно для зашифровки информации.

Например, на пробелы в среднем приходится 15-20% объема текстового документа. Согласно шифровальному коду TAG, TAA и TGA могут кодировать пробелы, тогда как GAA и CTC – букву «Е». Это уменьшит количество повторений, что технически усложнит синтез и чтение ДНК, одновременно затрудняя несанкционированную расшифровку текста.

Авторы начали эксперименты по кодированию с зашифровки послания объемом 180 символов с пробелами. Они отмечают, что само кодирование послания в 550 нуклеотидных оснований было легкой задачей, а последующий синтез ДНК оказался трудоемким и дорогостоящим. Однако достижения последних лет в области синтеза искусственной ДНК из так называемых генных блоков значительно облегчили работу и исследователям вскоре удалось зашифровать письмо Трумана объемом 700 символов с пробелами. В настоящее время они работают над еще более длинными последовательностями.

Bachand.gif

Разработанный группой Бачанда метод кодирования теста в ДНК. С помощью компьютерного алгоритма текст кодируется в последовательность нуклеотидов. После этого исследователи синтезируют соответствующую цепочку ДНК, которую можно прочитать с помощью технологии секвенирования и декодировать с помощью того же компьютерного алгоритма.

Конечной целью работы является использование разработанного подхода для решения проблем национальной безопасности. Два описанных авторами возможных подхода к его применению заключаются в хранении исторических конфиденциальных документов, а также в штриховом кодировании/нанесении водяных знаков на электромеханические компоненты, такие как компьютерные микросхемы.

Исследователи отмечают, что хранение информации в форме ДНК гораздо менее затратно по сравнению с традиционными методами и не требует огромных хранилищ. В то же время конверсия информации с твердых носителей в ДНК представляет собой очень сложный процесс, включающих сканирование, декодирование и синтез ДНК. Наиболее дорогим этапом этого процесса является именно синтез ДНК, однако его стоимость за последние несколько лет значительно снизилась и продолжает снижаться.

Евгения Рябцева
Портал «Вечная молодость» http://vechnayamolodost.ru по материалам Sandia National Laboratories: Sandia storing information securely in DNA.

15.07.2016

Нашли опечатку? Выделите её и нажмите ctrl + enter Версия для печати

Статьи по теме