Лента TH Статьи о науке и технике


1 грамм бактерий ≈ 1 Тб информации

∴ 201

Новый биологический принцип хранения информации был разработан командой CUHK iGEM 2010, состоящей из преподавателей и студентов Китайского университета в Гонконге. Работа была выполнена для участия команды в конкурсе iGEM этого года. В этом году ученые собираются использовать бактерии не только для хранения информации, но и объединить вместе с этим стойкую систему биологического шифрования данных. Естественно, что все технологии манипулирования ДНК и анализа генома, использованные в данной работе, чрезвычайно дороги, что пока не позволяет рассматривать данную технологию с точки зрения практического применения.

Использование бактерий в качестве устройств хранения информации — идея не новая, она была предложена группой Бэнкрофта в 2001 году, а группа ученых Ячи занималась хранением информации в геноме бактерий с 2007 года. Ученые выяснили, что для того, что бы обеспечить надежное хранение данных необходимоы правильно подойти к используемому виду бактерий. Использование Bacillus subtilis обеспечит сверхнадежное хранение благодаря тому, что бактерии размножатся и сделают дополнительные копии данных, микроорганизмы Deinococcus radiodurans могут выдержать радиацию ядерного взрыва и сохранить при этом записанные данные.

Кодирование информации в ДНК называется рекомбинацией ДНК и производится сложными методами генной инженерии. Для преобразования в генный вид информация подвергается перекодированию. Каждый байт информации, содержащий 8 бит, кодируется двумя четырехбитными последовательностями, соответствующими различным основам ДНК. Значение 0 соответствует аденозину:

1 — тимину

2 — цитозин

3 — гуанину

С математической точки зрения такие преобразования достаточно просты и понятны. После перекодирования информация подвергается сжатию с использованием алгоритмов Хоффмана и LZ77, что позволяет сократить объем информации и избавиться от повторяющихся блоков.

Используя современные технологии кодирования ДНК невозможно вместить достаточно объемную информацию в одну последовательность. Таким образом информация должна фрагментироваться, каждый фрагмент обрамляется специальными метками начала и контрольной суммой, позволяющей контролировать и корректировать ошибки (мутации). После этого начинается непосредственно сборка ДНК и ее внедрение в геном бактерий.

Чтение информации, записанной биологическим образом, тоже является достаточно сложной операцией. Но, с появлением новых современных устройств и технологий это в будущем будет делаться гораздо проще.

Ну, и наконец можно привести несколько фактов. В одной бактерии вида E. Coli, а именно этот вид использовался командой iGEM, можно сохранить всего один килобайт информации. А в одном грамме живого веса содержится такое количество особей этого вида, что общее количество информации составит 931322 ГБ.