Технологии секвенирования следующего поколения (проект «дорожной карты»)

Технологическая платформа «Медицина будущего»

ТЕХНОЛОГИИ СЕКВЕНИРОВАНИЯ СЛЕДУЮЩЕГО ПОКОЛЕНИЯ (проект «Дорожной карты»)

Пущино, cентябрь 2011 г.

Введение

Быстрое совершенствование технологий секвенирования ДНК в последние годы привело к значительному снижению стоимости оцифровки генетической информации. Производительность некоторых секвенаторов измеряется уже сотнями миллиардов пар оснований, что позволяет подобным приборам сканировать индивидуальный геном человека всего за несколько дней /1/. В результате стоимость заказного секвенирования геномов к середине 2011 года понизилась до 5000 $ (При заказе секвенирования 10 и более образцов)/2/.

Сейчас на рынке доминируют геномные секвенаторы двух компаний – Illumina и Life Technologies

Флуоресцентные секвенаторы последнего поколения

HiSeq 1000 и HiSeq 2000 (Illumina)                            5500 и 5500xl  (Life Technologies)

Рис. 1

Подобные приборы являются специализированными флуоресцентными микроскопами, способными сканировать при большом увеличении тысячи полей зрения, объединять их в общую панорамную картину и определять спектральные характеристики флуоресценции микронных объектов, общее количество которых может достигать миллиарда. Стоимость флуоресцентных секвенаторов измеряется сотнями тысяч долларов, причём объёмы получаемой ими информации настолько велики, что для обработки данных необходим специальный мощный сервер.

Высокая производительность медлительных флуоресцентных технологий хороша для полногеномного секвенирования, необходимого для персонализации медицины. Это одна из главных задач медицины будущего, но имеется множество менее амбициозных задач, для решения которых требуются экспрессные и дёшёвые секвенаторы. До недавних пор эту нишу занимали пиросеквенаторы компании Roche, но сейчас их быстро вытесняет появившийся в продаже в начале этого года полупроводниковый секвенатор PGM (Personal Genome Machine), разработанный компанией Ion Torrent. Приборы подобного типа и необходимые для их работы реагенты могут заметно подешеветь уже в ближайшем будущем.

Производительность одного рабочего цикла у полупроводникового секвенатора пока в 1000 раз ниже, чем у флуоресцентных систем, но работает он почти в 100 раз быстрее (2 часа вместо недели). PGM на порядок дешевле флуоресцентных секвенаторов (49 500 $), причём стоимость подобных приборов может понизиться ещё примерно на порядок (до 4…8 тыс. $), а производительность рабочего цикла всего за год может увеличиться с нынешних 100…500 Mb до 1…5 Gb.

При полногеномном анализе бесспорное лидерство в настоящее время принадлежит технологиям флуоресцентного секвенирования. Тем не менее, через 2…3 года полупроводниковое секвенирование сможет составить им заметную конкуренцию. Что касается дешёвых и экспрессных тестов, требующих не столь производительного секвенирования ДНК, то здесь у полупроводниковой технологии конкуренция практически отсутствует. Отсюда следует, что именно на эту технологию нужно ориентироваться при разработке отечественного секвенатора.

Технология полупроводникового секвенирования


Основные стадии полупроводникового секвенирования показаны на рисунке 2.

Стадии полупроводникового секвенирования /3/

Стадии подготовки ДНК к секвенированию (b -Prepare Genomic Library; с Prepare Template on Bead) по продолжительности превосходят само секвенирование (d – Sequence on Ion Chip, ~ 2 часа) в 2…3 раза, но самой продолжительной может оказаться обработка получаемой информации (Signal Processing and Base Calling). Что касается трудоёмкости, то по этому показателю пробоподготовка (b+c) занимает первое место.

Схема полупроводникового секвенатора


Внешний вид и общее устройство секвенатора PGM показаны на рисунке 3.

Секвенатор PGM /3/

Рис.3

Полупроводниковый секвенатор состоит из трёх подсистем – вычислительной, электронной (детектирующей) и жидкостной (подачи реагентов) (Рис. 4).

Принципиальная схема полупроводникового секвенатора /3/

Рис.4

У PGM предварительную обработку считываемых сигналов проводит специализированный процессор, смонтированный на одной плате с контактной площадкой pH-сенсорного чипа. Примерно так же устроены цифровые фотоаппараты, считывающие информацию с сенсоров изображения. Стоимость подобной электронной платы, предназначенной для считывания и предварительной обработки информации, может быть не выше стоимости обычного цифрового фотоаппарата (200…500 $), хотя при малых объёмах производства эта цифра может возрасти (~ 2000 $).

Что касается системы подачи реагентов, то её устройство заслуживает отдельного рассмотрения.

Флюидика

У PGM система подачи реагентов в проточную ячейку построена на использовании пневматических микроклапанов. Это требует подключения баллона со сжатым аргоном и делает её излишне громоздкой. Тем не менее, использование пневматики в данном случае вполне оправдано и диктуется необходимостью минимизации мёртвых объёмов в капиллярных трубках, что характерно для пневматических микроклапанов. Добиться этого при использовании электромагнитных клапанов намного сложнее. Кроме того, пневматическая система позволяет обходиться без насосов. Растворы в проточную ячейку подаются благодаря избыточному давлению в ёмкостях с реагентами. Это устраняет присущие перистальтическим и пьезоэлектрическим микронасосам пульсации давления, способные повлиять на сигналы, считываемые с чувствительного сенсорного чипа. В пневмосистеме минимальны и электромагнитные наводки на чип.

К недостаткам пневматической системы можно отнести необходимость использования баллона со сжатым газом (аргоном), что затрудняет миниатюризацию прибора. Кроме того, пневматика непригодна для создания системы с замкнутым циклом циркуляции реагентных растворов (Рис. 5).

Основные отличия открытых и замкнутых систем подачи реагентов

Обычный геномный секвенатор Система с замкнутым циклом

Рис.5

Повысить производительность полупроводниковых секвенаторов позволяет увеличение количества параллельно работающих сенсорных чипов. Для этого необходимо применение MEMS-технологий, позволяющих создавать очень компактные микрофлюидные устройства. В то же время, на начальных стадиях разработки полупроводникового секвенатора желательно ориентироваться на создание одночиповых приборов и на применение более доступных технологий и комплектующих.

При однократном использовании рабочих растворов стоимость реагентов является основным параметром, определяющим стоимость геномного секвенирования. Но на само секвенирование расходуются тысячные доли процента содержащихся в рабочих растворах реагентов. Отсюда следует, что у секвенаторов следующего поколения система циркуляции растворов должны быть замкнутой, т.е. обеспечивающей многократное использование реагентных растворов.

Секвенатор с замкнутым циклом циркуляции реагентов


Схема устройства одночипового секвенатора с замкнутой системой циркуляции реагентов показана на рисунке 6.

Схема полупроводникового секвенатора с замкнутой системой подачи реагентов


1. Ёмкости с промывочным раствором. 7. Проточная ячейка.
2. Ёмкости с растворами реагентов. 8. Сенсорный чип.
3. Пятиканальный перистальтический насос. 9. Контроллер чипа.
4. Шаговые моторы. 10. Контроллер шаговых моторов.
5. Датчики кондуктометра. 11. Плата кондуктометра.
6. Многоходовые краны. 12. Управляющий компьютер.

Рис.6

Циклическая подача реагентов в проточную ячейку (7) в такой системе обеспечивается одним многоканальным перистальтическим насосом (3) и двумя многоходовыми кранами (6). Вращают головку насоса и переключают краны три шаговых мотора (4), управляемых компьютером (12) при помощи контроллера (10).

Пригодные для создания такой конструкции USB-контроллеры шаговых моторов вполне доступны и стоят от 50 до 100 $. Миниатюрные шаговые моторы стоят ещё меньше. Довольно велик выбор и подходящих перистальтических (и не только) насосов и микронасосов. Наиболее сложными компонентами такой системы являются миниатюрные многоходовые краны. Подобные краны иногда применяются в жидкостных хроматографах, но подобрать готовый вариант вряд ли удастся, поскольку кран секвенатора должен содержать не менее пяти переключаемых входных каналов – четыре для дНТФ и один для промывочного раствора.

Многоходовые краны секвенатора желательно оснастить встроенными электродами (5), подключаемыми к кондуктометру (11). Измерение импеданса протекающих через краны и капиллярные трубки растворов позволит определять момент переключения каналов и получать информацию, необходимую для мониторинга циркуляции реагентных растворов -определения степени их разбавления промывочным буфером, проверки системы на наличие воздушных пузырьков и т.п..

Общая стоимость системы подачи растворов, состоящей из перистальтического насоса, многоходовых кранов и кондуктометрической подсистемы, может быть в пределах 2…3 тыс. $. Подобная система циклической подачи реагентов может использоваться с большинством типов геномных секвенаторов, независимо от применяемых в них технологий параллельного секвенирования ДНК и типов проточных ячеек.

Проточная ячейка

Проточная ячейка полупроводникового секвенатора предназначена не только для прокачки реагентов через рабочую зону сенсорного чипа, но и для защиты электропроводящих элементов чипа от солевых растворов, способных вызвать замыкание открытых контактов. У PGM ячейка (пластиковая крышка сложной конфигурации) и сенсорный чип образуют неразборную конструкцию с замкнутым объёмом, через который прокачиваются растворы. На крышке ячейки имеются кольцевые выступы с входным и выходным отверстиями, через которые подаются реагенты.

Конфигурация проточной камеры далека от совершенства, поскольку 10…15 % сенсорных пикселов остаются за её пределами. Из ~1,5 Mp чипа Ion 314 (1152х1280) в рабочую зону попадают только ~ 1,2 Mp, а у чипа Ion 316 (2640х2736) из 7,2 Mp работоспособны около 6,1 Mp. Данными потерями можно пренебречь, но в системе с циклической подачей растворов необходимо минимизировать их перемешивание не только в трубках, но и в рабочей камере проточной ячейки. Квадратная форма проточной камеры со скруглёнными боковыми краями в таком случае может оказаться далеко не идеальным решением (Рис. 7).

Чипы Ion 314 и Ion 316 с проточными ячейками

Рис.7

Улучшить равномерность подачи растворов в рабочую камеру позволяет разветвление (bifurcations) входных и выходных каналов. Подобная система используется, например, в проточных ячейках секвенатора Polonator 007 (Рис. 8).

Проточная ячейка секвенатора Polonator 007 /4/

Если ориентироваться на создание улучшенного аналога проточной ячейки PGM, то некоторые сложности создаёт её компактность. При размерах корпуса 24х24 мм довольно затруднительно сделать однослойную систему, обеспечивающую равномерный подвод реагентов к сенсорной поверхности размером 10х10 мм или 20х20 мм. Из-за этого ячейка должна состоять из 2…3 слоёв, содержащих горизонтальные микроканалы и вертикальные отверстия, образующие входы и выходы микроканалов соседних слоёв.

Компактную разводку рабочих микроканалов могут иметь проточные ячейки, состоящие из трёх и более слоёв. Возможный вариант расположения каналов в слоях восьмиканальной трёхслойной проточной ячейки показан на рисунке 9.

Схема расположения микроканалов и отверстий у трёхслойной проточной ячейки

А Б В

А – нижний слой с микроканалами, прилегающими к сенсорной поверхности;
Б – средний слой с разветвлениями микроканалов;
В – верхний слой с парными разветвлениями и впускным и выпускным отверстиями.

Рис.9

По-видимому, формат нынешних сенсорных чипов будет ещё не раз пересматриваться, а площадь их рабочей поверхности увеличиваться. Поэтому разработчикам новых чипов желательно ориентироваться на установку мультисенсорного элемента в корпус с более крупным основанием, несущим контактные площадки и обеспечивающим его герметичность. При выборе формата основания желательно ориентироваться на стандартные размеры типа 24х36 мм (стандарт “full frame” в фотографии), 25х75 мм (стандарт предметных стёкол для микроскопии) ит.п..

Сенсорные микрочипы Ion Torrent унаследовали размеры из технологических стандартов индустрии полупроводников, в которой стремление к миниатюризации вполне оправдано, но соблюдение этих же стандартов при сочетании микрочипов с микрофлюидикой вряд ли целесообразно. При увеличении размеров корпусов чипов разводка микроканалов может быть монослойной, что позволит заметно упростить конструкцию проточной ячейки. Да и работать с более крупными чипами станет удобнее.

Сенсорные чипы


У компании Ion Torrent нет оборудования, необходимого для выпуска какихлибо электронных компонентов по КМОП-технологии. Заказы на производство pHсенсорных чипов они размещают в Великобритании (Plessey Semiconductor, Plymouth, UK /5/) и в Германии (X-Fab Semiconductors foundries AG, Erfurt, Germany /6/). По-видимому, в данной области у Ion Torrent скоро появятся конкуренты, что должно привести к значительному снижению стоимости подобных чипов, выбор которых пока ограничен всего двумя вариантами -Ion 314 (1,5 Mp, 99$) и Ion 316 (7,2 Mp, 500$). Третий вариант -Ion 318 (13 Mp) -должен появиться ближе к концу этого года /7/.

Разработкой КМОП-микросхем обычно занимаются небольшие фаблесскомпании, не имеющие собственного высокотехнологичного оборудования, а массовым производством чипов -крупные компании, владеющие сложными технологиями и располагающие специальным оборудованием. Подобное разделение труда в микроэлектронике характерно и для России /8/. Разработанные отечественными специалистами микросхемы часто производятся на Тайване, в Китае, Италии, Германии и в некоторых других странах.

pH-чувствительными элементами в чипах компании Ion Torrent служат полевые транзисторы, у которых заряд сенсорной поверхности зависит от концентрации протонов. Изменение поверхностного электрического потенциала регистрируется по изменению электропроводности лежащего под ним тонкого слоя полупроводника (Рис. 10).

Схема устройства ион-чувствительного полевого КМОП-транзистора

Из статьи /3/ Из патента /9/




Рис. 10

В последние годы широкое применение в современных сотовых телефонах, смартфонах и цифровых фотоаппаратах получили производимые по КМОПтехнологии сенсоры изображения типа BSI (backside illumination), у которых транзисторные элементы регистрирующих свет активных пикселов расположены под тонким светочувствительным слоем кремния. Электронные компоненты таких фотопикселов могут использоваться и в ион-чувствительных микросенсорах, отличающихся только покрытием. Не исключено, что некоторые разработчики BSIсенсоров смогут их модифицировать и предложить конкурентоспособные pHсенсорные чипы.

На рынке BSI-сенсоров изображения в конкурентной борьбе принимают участие около дюжины компаний и корпораций различного калибра (OmniVision Technologies, Sony, Toshiba, Samsung, Fujifilm, TSMC, InVisage и др.)., но переключиться на разработку и производство pH-сенсорных чипов, по-видимому, проще всего будет компании InVisage Inc., сделавшей ставку на технологию QuantumFilm /10/. В их BSI-сенсорах светочувствительным слоем служит не кремний, удаление которого может создавать проблемы, а полимерная полупроводниковая плёнка, содержащая фоточувствительные наноточки. Плёнка наносится на поверхность «голого» КМОП-чипа, и заменить её pH-сенсорным или любым другим плёночным покрытием не слишком сложно.

КМОП-сенсоры изображения стоят от 1 до 5$. Служить они могут практически вечно, тем не менее, годовой объём их продаж превышает миллиард долларов. Производимые по той же технологии pH-сенсорные чипы дороже примерно на 2 порядка (от 99 до 500$), причём все они одноразовые. Объём рынка таких чипов пока сравнительно невелик, но в перспективе может значительно превзойти объёмы продаж сенсоров изображения. Это может служить неплохим стимулом для появления конкурентов.

Одним из первых конкурентов может стать компания Insilixa /11/, целенаправленно разрабатывающая КМОП-биочипы (“NextGen Biochips”) для секвенирования ДНК /12/.

Высокая стоимость одноразовых сенсорных чипов побуждает потребителей, занимающихся секвенированием, использовать такие чипы многократно. Распределённые по сенсорным лункам старые микросферы можно «вытряхнуть» из них центрифугированием и заменить новыми /13/. Правда, в водных растворах стойкость тонкого pH-сенсорного диэлектрического слоя сравнительно невысока, поэтому долго использовать один и тот же чип не удастся.

Первые чипы были покрыты плёнкой нитрида кремния (Si3N4), сохраняющей диэлектрические свойства при контакте с водой около недели. Сейчас сенсорным слоем у чипов служит более чувствительное к изменениям pH покрытие из окиси тантала (Ta2O5) /3/, для которого характерны также чувствительность к свету, инерционность и ряд других недостатков. К недостаткам такого покрытия можно причислить и линейные характеристики изменения поверхностного потенциала в широком диапазоне pH. При полупроводниковом секвенировании интервал изменения (снижения) pH очень узок и не превышает 0,2…0,3 единицы, причём исходное значение pH у незабуференных водных растворов реагентов равно 7,5 /3/.

При удешевлении pH-сенсорных КМОП-чипов низкого разрешения (1….10 Mp) до уровня, близкого к себестоимости (0,5…2 $), их повторное использование потеряет смысл, но эти времена наступят ещё не скоро. Не скоро появятся и чипы высокого разрешения (100…1000 Mp), которые обеспечат экспрессное секвенирование генома человека. Такие чипы будут намного дороже, и их однократное использование станет непозволительной роскошью. Отсюда следует, что при разработке чипов нового поколения желательно ориентироваться на возможность их регенерации и на сенсорные покрытия, отличающиеся высокой «износостойкостью».

Проблемы миниатюризации

Технологии параллельного секвенирования ДНК можно условно разделить на мономолекулярные и мультимолекулярные. Первые имеют дело с отдельными молекулами ДНК, т.е. с наноразмерными объектами. Возможно, в отдалённом будущем появятся конкурентоспособные мономолекулярные нанотехнологии секвенирования ДНК, но пока попытки их коммерциализации оканчиваются провалом из-за дороговизны подобных приборов и высоких эксплуатационных расходов. Характерным примером может служить мономолекулярный секвенатор компании Helicos (HeliScope™, ~ 1 млн.$), для которого попытка выхода на рынок закончилась провалом. По-видимому, та же участь ждёт и секвенатор компании Pacific Bioscienсes (PacBio RS, 695 тыс.$), разработка которого была завершена в этом году (Рис. 11).

Мономолекулярные секвенаторы

HeliScope™ PacBio RS



Рис. 11

Пока в геномных гонках безоговорочно лидируют мультимолекулярные технологии. Расход реагентов напрямую связан с размерами проточных ячеек, поэтому миниатюризация клонов ДНК является одним из главных направлений в их конкурентной борьбе.

У первого пиросеквенатора (GS 20, Roche, 2005 г.) носителями клонов ДНК служили агарозные гранулы диаметром около 30 мкм, размещаемые в лунках проточной ячейки. Со временем размеры лунок удалось уменьшить до 14 мкм, что позволило увеличить их количество в каждой ячейке с 1,6 млн до 3,6 млн (FLX Titanium, Roche, 2008 г.) (Рис. 12).

Ячейки пиросеквенаторов

Рис. 12

Последующее увеличение длины чтения ДНК до 700 п.о. (FLX+, Roche, 2011 г.) позволило повысить производительность пиросеквенаторов до 1 Gb. Дальнейшей миниатюризации гранул препятствует присущая технологии пиросеквенирования диффузия пирофосфата и люциферина, низкий квантовый выход биолюминесценции и большие потери света в регистрирующей системе прибора.

Отсутствие диффузионных потерь у технологий флуоресцентного секвенирования позволило значительно уменьшить размеры и клонов ДНК, и проточных ячеек. Соответственно, уменьшился и расход реагентов. В результате уже у первого секвенатора такого типа (1 G, Illumina, 2007 г.) производительность была на уровне 1 Gb. У последней модели, продажи которой начались в 2010 году (HiSeq 2000, Illumina), весной этого года производительность перевалила за 600 Gb, а в отдельных экспериментах превышает 1 Tb (1000 миллиардов пар оснований за один рабочий цикл). Сейчас на стенках проточной ячейки флуоресцентного секвенатора удаётся разместить до миллиарда микронных кластеров ДНК.

Перейти на субмикронный уровень пока удалось только компании Complete Genomics, использующей в своей технологии ДНК-наноболлы – однонитевые молекулы ДНК, состоящие из сотен тандемно повторяющихся копий одного короткого фрагмента /14/. В растворе длинные молекулы ДНК-наноболлов образуют отрицательно заряженные клубки диаметром около 300 нм. Такие клубки связываются с упорядочено расположенными на дне проточной ячейки активированными зонами, размеры которых сопоставимы с размерами наноболлов (Рис. 13).

Получение и иммобилизация ДНК-наноболлов /15/

Рис. 13

Применение ДНК-наноболлов упрощает подготовку ДНК к секвенированию и позволяет добиться предельно компактного упорядоченного расположения клонов ДНК в проточной ячейке. На сегодняшний день это наиболее прогрессивный подход, применение которого в ближайшие годы может заметно повысить производительность мультимолекулярных флуоресцентных секвенаторов.

Компания Complete Genomics сделала ставку на предоставление услуг по секвенированию индивидуальных геномов человека в специализированных геномных центрах. Для сторонних лабораторий данная технология пока недоступна, но ситуация может измениться уже в ближайшем будущем. Недавно появившийся в продаже секвенатор Max-Seq (Intelligent Bio-Systems -Danaher Motion's Dover -Azco BioTech, 2011 г.) рассчитан на работу как с микросферными носителями клонов ДНК, получаемыми при помощи эмульсионной ПЦР, так и с «ролониями»-ДНКнаноболлами, получаемыми при помощи RCA (rolling circle amplification) /16/.

В полупроводниковом секвенировании пробоподготовка построена на использовании микросферных носителей и эмульсионной ПЦР. Двухмикронные шарики с клонами иммобилизованной ДНК, как и при пиросеквенировании, располагаются в упорядоченном массиве микролунок на дне проточной ячейки (Рис. 14).

Расположение лунок на поверхности pH-сенсорных чипов /3/

Рис. 14

Шаговое расстояние между микросенсорами и лунками у чипов Ion 314 и Ion 316 равно 5,1 мкм, ау Ion 318 (13 Mp) будет уменьшено до 4,1 мкм (Рис. 15).

Вид сенсорных чипов на срезе /3/ (сканирующая электронная микроскопия)

Рис. 15

В отдалённой перспективе размеры микросенсоров и лунок могут быть уменьшены до 1…2 мкм, но субмикронный уровень для pH-сенсорного секвенирования, по-видимому, недостижим. Препятствовать миниатюризации сенсорных массивов будет диффузия протонов. Она же может ограничивать разработку гигапиксельных сенсорных чипов. Последнее обусловлено тем, что изменение pH при нынешних размерах лунок продолжается менее секунды и считывается (измеряется) с частотой 15…60 «кадров» в секунду. Уменьшение размеров лунок и сенсорных пикселов будет сопровождаться уменьшением продолжительности считываемого сигнала, а увеличение их количества – увеличением продолжительности считывания информации с чипа. Такая обратно пропорциональная зависимость может оказаться непреодолимым препятствием на пути разработки гигапиксельных pH-сенсорных чипов.

Полупроводниковая технология секвенирования, в которой используются регистрирующие pH микросенсорные чипы, не сможет конкурировать за секвенирование индивидуальных геномов с флуоресцентными технологиями, поскольку рост её производительности после уменьшения шага лунок до 1…2 мкм и преодоления миллиардного рубежа (1 Gb за рабочий цикл), скорее всего, замедлится. Производительность некоторых флуоресцентных секвенаторов уже сейчас перевалила за 100 Gb, и постепенно приближается к 1 Tb. Конкурировать с ними полупроводниковые секвенаторы смогут только после появления чипов с субмикронным шагом сенсорных пикселов.

Перспективы наносеквенирования

Разрешение BSI-сенсоров изображения c шагом 1,4…1,7 мкм в этом году достигло 14 Mp. У их следующего поколения шаг должен уменьшиться до 1,1…1,2 мкм /17/, хотя уже имеются сообщения о подобных сенсорах с разрешением 16 Mp и шагом 0,9 мкм /18/. Дальнейшая миниатюризация ограничивается не столько техническими нормами используемых для производства микрочипов технологий, сколько дифракцией света. Разработанные в последние годы миниатюрные чипы флеш-памяти содержат уже по 8 миллиардов ячеек памяти (полевых транзисторов с туннельным эффектом), и это ещё не предел /19/.

Использование обычных ДНК-наноболлов позволяет уменьшить размеры клонов секвенируемой ДНК до 200…300 нм, причём при наличии в тандемных повторах небольших самокомплементарных последовательностей диаметры клубков однонитевой ДНК могут быть меньше 100 нм. При шаге сенсорных пикселов 250…300 нм микрочип, сходный по размерам с Ion 314, может содержать более миллиарда наносенсоров. В таком случае при длине чтения более 100 п.о. производительность полупроводникового секвенирования может превышать 100 млрд.п.о. (100 Gb) за рабочий цикл.

При субмикронных размерах ДНК-наноболлов продолжительность и амплитуда увеличения положительного заряда pH-сенсорной поверхности должны уменьшиться из-за диффузии протонов. В то же время, эффективность регистрации увеличения отрицательного заряда наноболлов на малых расстояниях должна увеличиться. Такое изменение (накопление) заряда, в отличие от изменения pH, не ограничено по времени, и может служить альтернативным способом регистрации включения нуклеотидов в ДНК и, соответственно, использоваться для секвенирования.

Регистрация изменения заряда иммобилизованной ДНК уже давно применяется в гибридизационных сенсорах /20, 21/, и при секвенировании проявляется в виде продолжительного снижения регистрируемого потенциала после узкого пика, обусловленного выбросом протонов.

На рисунке, взятом из патента компании Ion Torrent /9/, показаны изменения величины потенциала четырёх pH-сенсорных пикселов, два из которых регистрируют встраивание нуклеотидов в ДНК (Рис. 16).

Изменение потенциала, измеряемого протон-чувствительными микросенсорами /9/

Рис. 16

Хорошо видно, что после непродолжительного всплеска, обусловленного изменением pH, потенциал у двух микросенсоров снижается, причём становится меньше исходного. У сигналов, регистрируемых парой контрольных микросенсоров, подобных изменений не наблюдается.

Снижение потенциала может служить альтернативным показателем, регистрируемым при секвенировании последовательности нуклеотидов. Недостатком такого варианта полупроводниковой технологии секвенирования является большая величина исходного суммарного заряда ДНК и сравнительно небольшое её увеличение при встраивании одного нуклеотида. Отсюда следует, что ДНК-наноболлы целесообразно использовать только при небольшой длине чтения нуклеотидных последовательностей (< 100 п.о.), при которой изменение потенциала может превышать 1%. При большой длине чтения (> 200 п.о.) предпочтительнее регистрировать выделение протонов.

С разработкой гигапиксельных наносенсорных микрочипов, предназначенных для секвенирования ДНК, способны справиться некоторые крупные корпорации, располагающие технологиями производства гигабайтных микрочипов памяти. (Samsung, Panasonic, Sony ит.д.). Ближе всего к решению этой задачи, по-видимому, подобрались специалисты компании IBM, пытающиеся разработать ДНКтранзисторы для мономолекулярного секвенирования /22, 23/. В мономолекулярном варианте их нанотранзисторная технология секвенирования неработоспособна, но накопленный опыт работы с ДНК и c наноразмерными базовыми элементами регистрирующей системы может служить хорошей основой для создания гигапиксельных наносенсорных чипов.

Структура затрат

Стоимость полупроводникового секвенирования складывается из стоимости приборов и оборудования, а также стоимости расходных материалов и реагентов, необходимых для эксплуатации секвенатора. Сейчас секвенатор PGM стоит 49,5 тыс.$, но для работы с ним требуется сервер за 16 тыс.$, устройство для автоматизации пробоподготовки (Ion OneTouch™, 5 тыс.$) /24/, ультразвуковой дезинтегратор для фрагментации ДНК (Bioruptor®, 5 тыс.$) /25/ ит.п.. В результате стоимость минимального комплекта оборудования превышает 75 тыс.$, но вряд ли долго удержится на этом уровне. Стоимость секвенатора явно завышена. Кроме того, работать с ним можно и без рекомендуемого оборудования.

Вычислительной мощности сервера достаточно для обслуживания четырёх секвенаторов, но с обсчётом результатов одного прибора может справиться и обычный игровой компьютер. Синтез ДНК-наноболлов не требует специального оборудования, а для фрагментации ДНК вместо ультразвука можно использовать ДНКазную обработку. Да и стоимость самого секвенатора со временем может уменьшиться на порядок. Благодаря этому амортизационными отчислениями в структуре затрат можно пренебречь.

Стоимость расходных материалов и реагентов, необходимых для проведения одного анализа (рабочего цикла полупроводникового секвенирования), равна примерно 500$ /26/:

приготовление библиотеки фрагментов ДНК ~ 50$;

получение клонов ДНК на микросферных носителях ~ 125$;

расходные реагенты (растворы дНТФ) ~ 75$;

чип (Ion 314 – 99$, Ion 316 – 500$) ~ 250$

Приведённые выше ориентировочные значения могут меняться в зависимости от характера анализа, длины секвенирования и других параметров, и не включают «прочие расходы»-зарплату исполнителей, коммунальные услуги и т.п.. Cтоимость заказного секвенирования одной пробы на PGM обычно составляет от 750$ до 1600$ (в США).

Расходы на чипы и реагенты сейчас почти в 2 раза выше, чем на подготовку ДНК к секвенированию, но это соотношение скоро может измениться. У секвенаторов с замкнутой системой подачи реагентов их расход может быть уменьшен в 10…50 раз (до 50…250 руб.). Многократное использование сенсорных чипов (10…100 раз) и их удешевление до 10…100$ позволит в недалёком будущем уменьшить затраты на однократное использование чипов до 0,1…10$ (~ 3…300 руб.). На этом фоне расходы на пробоподготовку в размере 5000 рублей (~175$) будут выглядеть непозволительной роскошью.

Многие этапы пробоподготовки можно заменить более рациональными приёмами и упростить, ускорить и удешевить их проведение. Например, для выделения и очистки ДНК вполне пригодны отечественные наборы, используемые в ПЦР-диагностике (10…50 руб. за пробу). Для быстрого получения библиотек фрагментов ДНК, содержащих концевые адапторы, можно использовать разработанную ещё в прошлом веке ПЦР-фрагментацию /27/. Клоны ДНК на микросферных носителях, получаемые с помощью эмульсионной ПЦР, можно заменить ДНК-наноболлами, синтез которых с помощью RCA занимает менее получаса. Подобные усовершенствования позволят сократить продолжительность подготовки ДНК к секвенированию до 1 часа и уменьшить расходы на неё до 200…500 рублей за пробу.

Существенный вклад в структуру затрат на поставляемые из США приборы, оборудование, чипы и наборы вносит завышение цен, обусловленное отсутствием серьёзной конкуренции. Ещё нужно учитывать то, что в Европе цены такие же, как в США, но исчисляются не в долларах, а в евро. Поэтому приобретение там американских товаров подобного рода обходится примерно в полтора раза дороже. Поставки в Россию идут через европейское представительство корпорации Life Technologies, причём при пересечении границы европейские цены увеличиваются, как минимум, на 40% (30% таможенной пошлины плюс транспортные расходы). К этому нужно приплюсовать ещё и «особенности национальной торговли».

Суммирование всех наценок повышает конечную стоимость производимых в США секвенаторов и расходных реагентов для российских потребителей в 2…2,5 раза. Подавляющее большинство подобных приобретений делается на госбюджетные средства, поэтому данная ситуация никого особо не волнует.

В случае разработки и освоения производства отечественных полупроводниковых секвенаторов, расходных реагентов и наборов для пробоподготовки стоимость секвенирования одного препарата ДНК может уменьшиться до 300…500 рублей. Дальнейшее совершенствование этой технологии и применение гигапиксельных сенсорных чипов позволит уменьшить стоимость секвенирования генома человека до 1000 рублей /28/.

Заключение

Из мировой практики известно, что затраты на каждую доведённую до работоспособного состояния технологию секвенирования превышают 100 млн.$, причём далеко не всегда результаты оправдывают ожидания. Изыскать подобные средства (~3 млрд. руб.) в России невозможно, поскольку имеются более приоритетные направления НИОКР (нанотехнологии, полёты на Марс, ГЛОНАС и т.п.). Отсутствуют и команды специалистов, способные самостоятельно справиться со столь сложной задачей в полном объёме.

Сейчас расходы на NGS (next generation sequencing) в России сравнительно невысоки. Закуплено всего около 20 секвенаторов (~20 млн.$), для эксплуатации которых с полной загрузкой требуется 10…20 млн.$ в год. Отсутствие импортзамещения в ближайшие годы может привести к многократному увеличению подобных расходов. Но разработка отечественных технологий NGS оправдана не только экономически. Не менее важна подготовка отечественных специалистов для медицины будущего, развитие которой в значительной степени связано с медицинской генетикой и, соответственно, с развитием новых технологий секвенирования ДНК.

Послесловие


Postoronnim_V (Александр Нечаев) 26.08.2011.

http://dirty.ru/comments/321360

…Он устало прикрыл воспаленные веки и задернул тяжелую портьеру. За ней было не окно, а огромный экран, освещающий бетонную коробку призрачным мерцанием бесконечного белого шума. В полной темноте мысли не казались столь беспросветными, а стены не так давили. И как всякий лишенный общения, чтобы не окончательно тронуться умом, он говорил сам с собой. Отрывистые, хриплые фразы повисали в сухом воздухе Убежища.


Когда это случилось? Дай–ка вспомню… 2020–й или 2025… "Познай самого себя?"… Генный анализатор в мобильном телефоне… "Старости и смерти — конец", писали тогда в Нью–Йорк Блог… Благие, благие намерения. Он замолчал и задумался.

Никто и не вспомнит, кто был первым. А дальше всё по этой же дороге. Гены геены огненной. Мода на цвет глаз и кожи. Новые оттенки."Эволюционируй за ночь!" Что они выращивали из головы вместо волос? Перья? Чешую? А после четвертого взрыва на Фукусиме и теракта в Бушере… Он снова надолго ушел в себя.

Кто первый начал войну? Пуристы или мутанты? Неважно. Победителей нет. Есть проигравший. Род человеческий. Мне 126 или 127 лет. Я последний. И набрав полную грудь затхлого воздуха, он страшно, протяжно закричал.—

Будь! Прокляты! Секвенаторы!!

 

СПИСОК ЛИТЕРАТУРЫ


1. Зубов В.В. Приборы для чтения ДНК / Химия и жизнь. – 2010. -№7. – с.4-7. (pdf)

2. Illumina reduces price of whole human genome sequencing through Illumina Genome Network / SAN DIEGO, May 09, 2011 (BUSINESS WIRE)

3. An integrated semiconductor device enabling non-optical genome sequencing / J.M. Rothberg et al. // Nature. – 2011. – Vol.475. – P.348–352. (Abstract)

4. http://www.polonator.org/flowcells.aspx

5. http://www.plesseysemiconductors.com/

6. http://www.xfab.com/

7. http://www.iontorrent.com/lib/images/PDFs/ionjuly11releasefinal.pdf

8. Мелик-Адамян А. Российские fabless-компании как двигатель отечественной микроэлектроники. В чём сильны наши разработчики / Электронные компоненты. – 2007. -№2. – с.31-33.

9. US Pat. № 7948015. Method and apparatus for measuring analytes using large scale FET arrays (http://www.freepatentsonline.com/7948015.pdf).

10. http://www.invisageinc.com/

11. http://insilixa.com/

12. Davies K. A sequencing squabble over Ion Torrent’s Stanford licenses / Bio-IT WORLD, July 20, 2011.

13. http://seqanswers.com/forums/showthread.php?p=44216#post44216

14. http://en.wikipedia.org/wiki/DNA_nanoball_sequencing

15. Human genome sequencing using unchained base reads on self-assembling DNA nanoarrays / R. Drmanac et al. // Science. – 2010. – Vol.327, № 5961. – P.78-81. (Abstract).

16. Robinson K. Will Max-Seq Gain Traction? / August 31, 2011. (Ref.)

17. Fontaine R. A review of the 1.4 µm pixel generation / Chipworks Inc., 2011. (pdf)

18. http://image-sensors-world.blogspot.com/2011/07/tsmc-reveals-its-11um-and-09umpixel.html

19. http://ru.wikipedia.org/wiki/Флеш-память

20. Recent trends in electrochemical DNA biosensor technology / Kerman K., Kobayashi M., Tamiya E. // Measurement Science and Technology. – 2004. – Vol.15, №2. – R01.

21. Recent development of nano-materials used in DNA biosensors / Xu K. et al. // Sensors. – 2009. – Vol.9. – P.5534-5557. http://www.mdpi.com/14248220/9/7/5534/pdf

22. Electrochemical characterization of thin film electrodes toward developing a DNA transistor / S. Harrer et al. // Langmuir. 2010 Dec 21;26(24):19191-8. (Ref.)

23. http://www.moscowuniversityclub.ru/home.asp?artId=11593

24. http://www.youtube.com/watch?v=fxCY_f0QaZQ

25. http://www.diagenode.com/media/documents/press-release/March%202nd%202011ion%20press%20release.pdf

26. http://seqanswers.com/forums/showthread.php?t=11929

27. PCR-фрагментация ДНК / Л.А. Железная и др. // Биохимия. – 1999. – Т.64, вып.4. -с.447-453.

28. Геном за 1000 рублей. (pdf).

Приложения

В популярном виде развитие технологий секвенирования нового поколения было описано в статье «Приборы для чтения ДНК», опубликованной в журнале «Химия и жизнь» (2010 г., №7, с.4-7). За прошедший год многое изменилось, но основные изложенные там положения по-прежнему актуальны и могут представлять интерес для людей, не знакомых с данной проблемой. Полный текст этой статьи приводится ниже (Приложение 1).

При подготовке проекта Дорожной карты были использованы материалы из пояснительной записки к проекту «Геном за 1000 рублей»(Приложение 2).

Спонсорскую помощь в проведении всех экспериментальных и аналитических исследований оказывает ООО «Изогель».

 

 

Приложение 1. Приборы для чтения ДНК

 

Кандидат биологических наук В.В. Зубов ИТЭБ РАН

Проблемы и методы науки



Что нужно было для определения нуклеотидной последовательности ДНК методом Сенгера в начале 90-х годов ХХ века? Сущие пустяки: один-два аспиранта или дипломника, пара идеально отполированных стекол длиной в полметра, между которыми заливали полиакриламидный гель, источник высокого напряжения для электрофореза, собственно ДНК в достаточном количестве, фермент полимераза, фирменные реагенты по списку, рентгеновская пленка размером со стекло, реактивы для ее проявления ... . По большому счету, кажется, все? Ах да, еще допуски для всего коллектива (радиоактивное излучение «меченых» нуклеотидов, хоть и мягкое, требует знания техники безопасности), ловкость рук и немного терпения. К концу недели, если все проходило удачно, вы получали десятки, а то и сотни новых «букв» ДНК.

Это было давно. А недавно «Химии и жизни» задали вопрос: если действие фантастического детектива происходит во второй половине XXI века, может ли в рядовом полицейском управлении стоять прибор для «чтения» ДНК? Запросто, ответили мы. Потом подумали и уточнили: смотря в какой стране.

В 1990 году стоимость расшифровки нуклеотидной последовательности ДНК человека оценивалась в 3 миллиарда долларов. Именно столько в США планировали потратить на проект «Геном человека»-«по доллару за каждый нуклеотид», как сказал Эрик Ландер, основатель Центра геномных исследований института Уайтхеда и МТИ. Работа была рассчитана на 15 лет, но завершить её удалось немного раньше – в начале 2003 года, когда была получена «обобщенная» последовательность, составленная из фрагментов геномов разных людей. По такому случаю Конгресс США даже принял резолюцию, в соответствии с которой ранее малоизвестный Международный День ДНК, отмечаемый 25 апреля, был объявлен Национальным Днём ДНК. В этот день в 1953 году в апрельском номере журнала “Nature” появилась небольшая статья двух авторов -американца Джеймса Уотсона и англичанина Фрэнсиса Крика.

Открытие ими двойной спирали ДНК стало точкой отсчёта для всей современной биологии, ав 2007 году появилась ещё одна важная точка отсчёта – был расшифрован (просеквенирован) первый персональный геном человека, и человеком этим стал Джеймс Уотсон. Возможно, вручение винчестера с записью собственного оцифрованного генома 31 мая 2007 года стало для него не менее радостным событием, чем получение Нобелевской премии за открытие двойной спирали в 1962 году.

Скорость развития технологий секвенирования можно сравнить разве что с прогрессом в области развития вычислительной техники, но сравнение будет далеко не в пользу электронщиков. Производительность компьютеров растёт в соответствии с законом Мура, т.е. каждые два года удваивается, тогда как производительность секвенаторов увеличивается за те же два года примерно в 10 раз, причём на протяжении уже 10 лет. Одновременно с этим снижается стоимость секвенирования ДНК. В 2007 году можно было «оцифровать» ДНК человека за миллион долларов. В мае 2009 года компания “Illumina” начала принимать заказы на секвенирование индивидуальных геномов за 48000 долларов, а с мая этого года -за 19500 долларов, причём если секвенирование способно помочь лечению пациента, то ему это обойдётся всего в 9500 долларов.

В начале XXI века еще шло некоторое совершенствование электрофоретических (Сенгеровских) секвенаторов, но к концу первой «пятилетки» их потенциал был практически исчерпан. Революционный прорыв наметился в 2005 году (см.«Химию и жизнь», 2006, № 1), когда в продаже появился первый секвенатор нового поколения – GS 20 (“454 Life Science Inc.”). Именно он позволил в 2007 году преодолеть ценовой рубеж в 1 миллион долларов. В начале того же года появился секвенатор GA1 (“Illumina”), способный за один рабочий цикл считывать миллиард оснований ДНК, а примерно через год конкуренты выпустили прибор SOLiD 2.0 (“Applied Biosystems”), читающий за один заход до трёх миллиардов оснований ДНК.

Если учесть, что гаплоидный (одинарный) набор хромосом человека содержит примерно 3 миллиарда пар оснований двунитевой ДНК, то можно считать, что в начале 2008 года появился первый прибор, способный за один рабочий цикл оцифровать целый геном человека. Правда, у каждого человека набор хромосом не одинарный, а двойной, да и точность чтения ДНК у высокопроизводительных секвенаторов не идеальна. В результате получить качественную генетическую информацию можно только благодаря многократному чтению нуклеотидных последовательностей, то есть читать нужно не три миллиарда, а десятки миллиардов букв. Например, геном Джеймса Уотсона был прочитан семикратно. Сейчас хорошим тоном в научных кругах считается не менее чем тридцатикратное секвенирование геномов. Ещё недавно это казалось непомерной роскошью, но производительность последних моделей секвенаторов измеряется уже не десятками, а сотнями миллиардов букв генетического кода, и похоже, что это далеко не предел.

Столь быстрый прогресс связан с ожесточённой борьбой за первенство между крупными корпорациями, каждая из которых уже на старте геномных гонок вложила более 100 миллионов долларов в приобретение фирм-разработчиков и в совершенствование технологий геномного секвенирования. Тройку лидеров образуют корпорации “Illumina”, “Life Technologies” и “Roche”. Первая из них включилась в геномные гонки в начале 2007 года, после того как поглотила компанию “Solexa”, разработавшую самую производительную на сегодняшний день кластерную технологию секвенирования геномов.

Практически не уступает ей по производительности лигазная технология секвенирования компании “Applied Biosystems”, ставшей в прошлом году подразделением корпорации “Life Technologies”. Снекоторым отрывом за этими лидерами следует корпорация “Roche”, которой принадлежит компания “454 Life Science Inc.”.

Первопроходцем в разработке секвенаторов нового поколения стал Джонатан Ротберг – учредитель компании “454 Life Science Inc.”, разработавшей самый первый прибор нового типа. До 2007 года он был и единственным, но теперь в различных типах приборов и разновидностях параллельного секвенирования легко запутаться даже специалисту, поэтому желательно их как-то классифицировать. Обычно выделяют два основных типа секвенаторов – NGS (Next Generation Sequencing) и NNGS (Next-Next Generation Sequencing), но лучше делить их на мультимолекулярные и мономолекулярные. Лучше потому, что к NNGS относят приборы, считывающие информацию с отдельных молекул ДНК, и теоретически у них это должно получаться очень быстро и дёшево. Практически же нынешние NNGS по многим показателям явно отстают от большинства мультимолекулярных (NGS) приборов, и относить их к «супер-следующему» (Next-Next) поколению пока рановато. Ещё «несенгеровские» технологии секвенирования бывают полимеразные, лигазные, экзонуклеазные, циклические и нециклические, флуоресцентные и биолюминесцентные, полупроводниковые и нанопорные, гибридизационные и денатурационные, ит.д, ит.п.. Среди них попадаются вполне достойные претенденты на звание NNGS, а может быть и NNNGS.

Сейчас на рынке представлено уже около десятка моделей NGS-секвенаторов. По производительности первое место пока удерживает HiSeq 2000 компании “Illumina” (200 миллиардов оснований за рабочий цикл). Он же лидирует и по стоимости (690 тыс.$), хотя правильнее было бы сказать – отстаёт, поскольку в условиях рыночной конкуренции лидировать должен самый дешёвый прибор. В этом отношении наиболее интересен секвенатор Junior FLX корпорации “Roche” (125 тыс.$), который и по габаритам, и по внешнему виду похож на обычный лазерный принтер. Производительность у него сравнительно невысока – до 35 миллионов оснований, но рабочий цикл занимает примерно 10 часов, тогда как у конкурентов считывание генетической информации может продолжаться больше недели.

Модельный ряд секвенаторов 2010 года

Борьба за первенство в геномных гонках не была бы столь напряжённой, если бы на пятки лидерам не наступал «пелетон» разработчиков альтернативных технологий оцифровки генетической информации. К их числу относится, например, недавно выбывшая из гонок компания “Helicos”. Её мономолекулярный секвенатор Heliscop по некоторым параметрам даже превосходил конкурентов, но оказался слишком громоздким и стоил около миллиона долларов.

Большие надежды многие специалисты до сих пор возлагают на компанию “Pacific Bioscience”, потратившую больше четверти миллиарда долларов на разработку самой скоростной на сегодняшний день технологии мономолекулярного секвенирования ДНК. Правда, прибор получился малопроизводительным и далеко не дешёвым (695 тыс.$). Начало продаж этого секвенатора намечено на конец текущего года.

Если ориентироваться только на стоимость прибора, то к лидерам геномных гонок мог бы примкнуть Polonator G.007 (170 тыс.$) компании “Danaher Motion – Dover”. Массового распространения секвенаторы этой фирмы не получили не из-за каких-либо конструкционных недоработок, а из-за недостаточной эффективности используемого в них варианта лигазной технологии секвенирования.

Всего же в мире насчитывается уже около двух с половиной тысяч секвенаторов нового поколения (июль 2010 г.). Из них более полутора тысяч произведены компанией “Illumina” и по нескольку сотен приборов имеется на счету корпораций “Life Technologies” и “Roche”.

Растущие как грибы крупные центры секвенирования ДНК заказывают самые последние модели секвенаторов десятками. Рекорд пока принадлежит Пекинскому геномному институту, заказавшему в начале этого года сразу 128 секвенаторов HiSeq 2000. Их суммарная производительность позволяет расшифровывать более 20 индивидуальных геномов в день, но только при условии, что эти геномы принадлежат людям. Последняя оговорка необходима из-за того, что у некоторых животных и растений геномы намного крупнее, а отдельные виды амёб превосходят человека по этому показателю в 200 раз.

Основными «потребителями» массивов получаемой генетической информации до недавних пор были учёные, пытающиеся разобраться в многочисленных вопросах биологии и медицины. Например, в ходе выполнения проекта «Геном человека» первоочередной задачей для учёных было определение количества и функций всех генов, которых по предварительным подсчётам должно было быть не меньше 100 тысяч. В действительности их оказалось немного больше 20 тысяч. Многих учёных интересовало, чем человек разумный отличается от своего ближайшего родственника – неразумной обезьяны. Секвенирование генома шимпанзе позволило определить все отличия, но ничего сенсационного или даже просто существенного обнаружить не удалось. Зато секвенирование ДНК неандертальцев показало, что избежать генетических контактов с ними удалось только африканцам.

Новые технологии секвенирования ДНК позволяют решать и менее глобальные, но более насущные задачи. К таким задачам относится, например, персонализация медицины (лекарства, назначаемые без учёта индивидуальной восприимчивости пациентов, могут быть бесполезными, вредными, а иногда и смертельными). Обнаружение некоторых мутаций позволяет определить генетическую предрасположенность к различным заболеваниям и уменьшить риск их развития. Ещё благодаря секвенированию можно ставить точный диагноз при любых инфекционных заболеваниях – от хорошо знакомых всем ОРЗ и ОРВИ до более опасных и малоизученных (атипичная пневмония, птичий грипп, свиной грипп и т.п.), или даже совсем неизвестных и неизученных. И если уж речь зашла о биобезопасности, то неплохо было бы при помощи секвенирования выяснить, из чего состоят и насколько безвредны некоторые магазинные продукты питания, а не изучать это методом проб и ошибок на собственном организме.

По мере удешевления геномного секвенирования всё больший интерес к нему проявляют частные заказчики. Причины такого интереса могут быть самыми разнообразными. Многим далеко не безразличны свои генетические корни. Не лишним может быть установление предрасположенности к различным заболеваниям, определение индивидуальной восприимчивости к лекарственным препаратам и т.п.. А ещё секвенирование индивидуальных геномов может использоваться в рекламных целях, но для этого обладатель генома должен быть достаточно знаменит. Например, сообщение компании “Illumina” о секвенировании генома актрисы Гленн Клоуз прошло почти незамеченным, а вот информация о намерении стареющей звезды тяжёлого рока Оззи Осборна провести секвенирование собственного генома недавно облетела многие средства массовой информации. Доживший до 61 года «Князь Тьмы» решил разобраться в генетических причинах своего необычного для наркоманов и алкоголиков долголетия.

Прогресс в технологиях секвенирования геномов настолько динамичен, что строить более или менее достоверные прогнозы можно только на самое ближайшее время. В начале ноября, например, в продажу должны поступить сравнительно дешёвые (50 тыс.$) и быстродействующие секвенаторы PGM (Personal Genome Maсhine) компании “Ion Torrent”, учредителем и исполнительным директором которой является уже известный вам Джонатан Ротберг. По производительности эти приборы смогут догнать и перегнать пока только «настольный принтер» корпорации Roche (75 миллионов оснований за час у PGM против 35 миллионов за 10 часов у Junior FLX), но через год или два начнут обходить и других конкурентов.

Остальные участники геномных гонок тоже не собираются топтаться на месте. Уже в следующем году производительность секвенаторов компаний “Illumina” и “Life Technologies” должна преодолеть рубеж в 500 миллиардов оснований ДНК за рабочий цикл, и это явно ещё не предел.

Но вернёмся к началу – к вопросу о возможности установки приборов для чтения ДНК в рядовом полицейском управлении. Это уже не фантастика, а одна из первоочередных задач судебно-медицинской экспертизы. Правда, придётся ещё немного подождать. И не год или два, а три, или даже четыре года. В какой стране это будет? В первую очередь в той, где День ДНК считается национальным праздником, а школьники своими руками собирают модели двойной спирали ДНК и не задают характерный для наших чиновников вопрос «а зачем это надо?».

Каковы прогнозы для России? Скорее всего, через два – три года страна понемногу оправится от последствий финансового кризиса, вызванного прошлогодним падением цен на нефть, и будет возобновлено финансирование некоторых научных разработок. Уверенно можно предсказать и то, что в начале 2014 года в Сочи состоятся зимние Олимпийские игры. А при чём здесь секвенирование геномов? Да ни при чём.

 

 

Приложение 2. Геном за 1000 рублей


Знать последовательность своей ДНК

не менее важно, чем иметь автомобиль.

Джеймс Уотсон

Пущино, 20 февраля 2011 г.


Всего за 3 года (с мая 2007 г. по май 2010 г.) стоимость секвенирования индивидуального генома человека упала примерно в 100 раз (с 1 млн. до 10 тыс.$), но по ряду причин дальнейшее падение может замедлиться:

  • потенциал совершенствования большинства технологий секвенирования второго поколения (NGS) уже почти исчерпан;
  • возможность успешного завершения разработки технологий следующего поколения (NNGS), нацеленных на мономолекулярное секвенирование, вызывает большие сомнения;
  • почти монопольное положение тройки лидеров геномных гонок (Illumina, LifeTech и Roche) недостаточно стимулирует снижение ими цен на секвенаторы и расходные реагенты;
  • снижению стоимости геномных секвенаторов препятствуют высокие затраты на их разработку;
  • быстрое моральное старение дорогостоящих приборов увеличивает амортизационные отчисления, которые также необходимо учитывать при определении «цены генома».


Рубеж в 1000$ может стать барьером, в преодолении которого не заинтересованы нынешние участники геномных гонок. Приблизиться вплотную к этому барьеру, по-видимому, удастся через 2…3 года, но для продолжения гонок потребуется новая цель, и такой целью может стать «Геном за 1000 рублей». Правда, возможны и другие варианты. Например, в прошлом году компания GnuBio (США) пообещала разработать «микрофлюидную» технологию, позволяющую уменьшить стоимость секвенирования генома человека до 30$, но все продаваемые в России секвенаторы и их расходные реагенты стоят в 2…3 раза дороже, чем в США. Соответственно, для отечественных потребителей тридцатидолларовой технологии эта цена возрастёт до 1800…2700 руб. (60…90$).

Отсюда следует необходимость разработки российского секвенатора, который на пути к российским же потребителям не будет проходить через цепочку посредников и пересекать государственную границу. При прочих равных условиях секвенирование на произведённом в России приборе для отечественных учёных будет дешевле, чем на американском, в 2…3 раза. Менее очевидные возможности уменьшения стоимости секвенирования геномов желательно рассмотреть более подробно.

Выбор NGS-технологии


В современных технологиях параллельного секвенирования, обозначаемых обычно аббревиатурой NGS (Next Generation Sequencing), используются иммобилизованные на микросферных носителях или на плоской поверхности мультимолекулярные клоны, получаемые при помощи твердофазной амплификации коротких фрагментов ДНК. Секвенаторы следующего поколения (NNGS – Next-Next Generation Sequencing), возможно, станут мономолекулярными, но многочисленные попытки создать конкурентоспособную технологию подобного рода пока оканчиваются провалом.

Первый мономолекулярный секвенатор Heliscop™, появившийся в продаже в начале 2008 года, оказался неконкурентоспособным, и в середине 2010 года компания Helicos BioSciences прекратила попытки улучшить его ценовые показатели и рабочие характеристики. Прибор получился слишком дорогим (около миллиона долларов), расход реагентов слишком высоким, а длина и точность чтения нуклеотидных последовательностей слишком низкой.

Следующую попытку вывести на рынок мономолекулярный секвенатор предприняла компания Pacific Biosciences, вложившая в эту разработку около 400 млн.$. Секвенаторы PacBio RS должны поступить в продажу во втором квартале 2011 года, но их конкурентоспособность уже сейчас вызывает большие сомнения. Имеющиеся у этого прибора преимущества (экспрессная пробоподготовка и высокая скорость секвенирования) явно не смогут компенсировать его недостатки -низкую производительность, высокий фон ошибок, а также чрезмерную стоимость прибора (695 тыс.$) и расходных материалов (~ 300 тыс.$ в год).

Рынок приборов и реагентов для NGS в 2010 году достиг 1,3 млрд.$, и продолжает быстро расти. Лидирует на нём компания Illumina с секвенаторами HiSeq 1000 (производительность -100 млрд.п.о. за рабочий цикл, стоимость – 550…600 тыс.$) и HiSeq 2000 (200 млрд.п.о., 690 тыс.$). Основными расходными реагентами для них являются ДНК-полимераза и флуоресцентно меченые субстраты полимеразного синтеза (дНТФ). На втором месте обосновалась компания Life Technologies с моделями 5500 (90 млрд.п.о., 349 тыс.$) и 5500xl (180 млрд.п.о., 595 тыс.$), расходующими ДНК-лигазу и флуоресцентно меченые олигонуклеотиды. При одинаковой (недельной) продолжительности рабочего цикла секвенаторы обеих компаний демонстрируют примерно равную производительность. Правда, HiSeq 2000 при увеличении рабочего цикла до двух недель сможет читать до 600 млрд.п.о., но реагентов он будет расходовать больше, а точность чтения понизится.

Расход реагентов на секвенирование генома человека при общепринятом сейчас 30…40кратном чтении ДНК для HiSeq 2000 (Illumina) составляет примерно 5 тыс.$., а для 5500xl (LifeTech) – 3 тыс.$, причём определяется это не столько сложностью их синтеза, сколько маркетинговой политикой компаний.

Стоимость приборов такого класса вряд ли опустится ниже 150 тыс.$, а снижение стоимости реагентов при приближении к 1000$ за геном может прекратиться уже по объективным причинам. Тем не менее, потенциал этих технологий ещё не исчерпан. Значительную экономию реагентов может обеспечить, например, многократное использование расходных реагентов. Но даже при удешевлении флуоресцентных секвенаторов до 150 тыс.$ их широкое применение в российских лабораториях, для которых они буду стоить по 300…450 тыс.$, вызывает большие сомнения.

Отдельный сектор рынка NGS занимают менее производительные, но более скоростные биолюминесцентные секвенаторы компании Roche (FLX Titanium и GS Junior). Первый прибор такого типа (GS 20) появился в продаже ещё в 2005 году. Сейчас потенциал совершенствования используемой в них биолюминесцентной технологии секвенирования в основном исчерпан. Продажи последней модели (GS Junior, 125 тыс.$) начались в середине 2010 года, но уже к концу года она морально устарела, поскольку компания Ion Torrent выпустила первый полупроводниковый секвенатор PGM (Рис. 1).

Personal Genome Machine (PGM) компании Ion Torrent

Рис. 1

По производительности (10…15 млн.п.о. за 2 часа) первая модель PGM близка к GS Junior (35 млн.п.о. за 10 часов), но прибор и «расходники» стоят в 2…4 раза меньше (~50 000$/125 000$ и 500$/2000$).

В октябре 2010 г. компания Ion Torrent перешла в собственность Life Technologies (цена сделки – 725 млн.$). Данная сделка способна пошатнуть лидерство компании Illumina, ответным шагом которой стало заявление от 12.01.2011 г. о скором завершении разработки упрощённой и предельно удешевлённой модели флуоресцентного секвенатора MiSeq (120 млн.п.о., 125 тыс.$). Но в продаже он появится только через пол года, а производительность PGM уже через 1…2 месяца должна превысить 100 млн.п.о..

Со стороны Roche ответным ходом стало заключение партнёрского соглашения с компанией DNA Electronics, обладающей ключевым патентом на полупроводниковую технологию секвенирования ДНК. Лицензионное соглашение между DNA Electronics и Ion Torrent было подписано в августе прошлого года.

Таким образом, наиболее перспективной на сегодняшний день является полупроводниковая технология секвенирования, разработанная компанией Ion Torrent. Для полногеномного анализа она пока непригодна, но через 2…3 года ситуация может измениться.

 

Полупроводниковая NGS-технология

В секвенаторе PGM регистрируются изменения pH, происходящие при выделении всего одного протона на каждый встраиваемый в ДНК нуклеотид. Побочным продуктом этой же реакции является молекула пирофосфата. Её расщепление пирофосфатазой до двух фосфатов способно утроить суммарный выход протонов и заметно увеличить смещение pH, но можно регистрировать и не pH. При изменении характера ион-селективного покрытия микросенсоров встраивание нуклеотидов в ДНК можно регистрировать по выделению пирофосфата, появлению фосфатных анионов, а в простейшем виде и по изменению суммарного заряда иммобилизованной на поверхности сенсора ДНК.

Рассматривать и разрабатывать альтернативные варианты секвенирования имеет смысл только в случае невозможности договориться с обладателями патента на самый прямолинейный и уже проверенный компанией Ion Torrent вариант полупроводниковой NGS-технологии. Пожалуй, единственным исключением из этого правила является ДНК-лигазное секвенирование, сочетание которого с ДНК-полимеразным способно заметно улучшить качество полупроводниковой «оцифровки» ДНК. Но этот вариант может быть не более чем вспомогательным.

Сравнительная дешевизна полупроводникового секвенатора обусловлена отсутствием прецизионных оптических и механических частей. «Сердцем» такого прибора является небольшой полупроводниковый чип, на поверхности которого располагаются более миллиона pHчувствительных микросенсоров. Включение нуклеотидов в ДНК вызывает небольшое снижение pH в прилегающих к микросенсорам лунках, что позволяет читать нуклеотидные последовательности по наличию или отсутствию изменения pH при пропускании через проточную ячейку индивидуальных субстратов ДНК-полимеразы (дезоксинуклеозидтрифосфатов дАТФ, дГТФ, дТТФ и дСТФ).

Примерно такое же «сердце» имеется у всех цифровых фотоаппаратов, веб-камер и т.п., считывающих информацию с сенсоров изображения. Это позволяет оценить ориентировочную стоимость электронных компонентов, необходимых для сканирования pH-сенсорного чипа и первичной обработки сигналов (< 1000$).

Наиболее дорогой частью полупроводникового секвенатора является программируемая система подачи субстратных реагентов и промывочных растворов в сенсорную проточную ячейку. Информация об этой системе у PGM очень ограничена, но её отечественным аналогом может служить синтезатор олигонуклеотидов ASM-800 (~27 тыс.$).

Синтезатор ASM-800 (ООО «Биоссет», Новосибирск)

Рис.2

Основным отличием является количество обслуживаемых системой проточных ячеек (или микроколонок). ASM-800 прокачивает строго дозированные микрообъёмы реагентов через 8 микроколонок, а PGM имеет дело всего с одной проточной ячейкой. Таким образом, использование готовой восьмиканальной системы подачи реагентов способно почти на порядок повысить производительность полупроводникового секвенатора без увеличения его стоимости. Вероятно, при уменьшении количества каналов цена секвенатора может уменьшиться в 2…3 раза (до 10…15 тыс.$). В таком случае амортизационные отчисления станут незначительными, и стоимость секвенирования ДНК будет определяться в основном стоимость пробоподготовки, расходных реагентов и pH-сенсорных чипов.

pH-сенсорные чипы

pH-сенсорный чип секвенатора PGM (“314x”) содержит 1,55 Mp (миллионов сенсорных пикселов). В ближайшие месяцы компания Ion Torrent планирует заменить его более производительным чипом (“Ion 316”, 7Mp) и одновременно оптимизировать технологию секвенирования, что позволит увеличить производительность секвенатора почти на порядок (до 100 млн.п.о.).

Аналогичную структуру полупроводникового чипа имеют получаемые по CMOSтехнологии BSI-сенсоры изображения (Back Side Illuminated), которые благодаря высокой светочувствительности, компактности и дешевизне широко используются в цифровой фототехнике, сотовых телефонах и коммуникаторах последнего поколения. Их разрешение (количество фотосенсорных пикселов) обычно составляет 5, 8 или 12 Mp. Уже появились BSIсенсоры на 14 и 16 Mp, и это далеко не предел. В астрономии используются даже гигапиксельные сенсоры изображения.

Полупроводниковый секвенатор, работающий на гигапиксельных pH-сенсорах, сможет конкурировать с флуоресцентными приборами типа HiSeq 2000 и 5500xl, но появится он ещё не скоро. Что касается ближайшего будущего (2011…2012 г.г.), то ориентироваться лучше на дешёвые сенсорные чипы с разрешением 12…14 Mp. Стоимость подобных чипов, производимых на заказ компанией TSMC (Taiwan Semiconductor Manufacturing Company), составляет менее 1$. У заказчиков (fabless-компаний) их цена увеличивается в 5…10 раз (до 5…10$).

Одноразовый чип “314x” от Ion Torrent сейчас стоит 250$, но после появления на рынке первого же конкурента цена может понизиться более чем на порядок. В данной конкурентной борьбе способны принять участие многие компании, разрабатывающие BSI CMOS-сенсоры (OmniVision Technologies, Sony, Toshiba, Samsung, Fujifilm, TSMC, InVisage и др.).

Значительно удешевить полупроводниковое секвенирование позволяет многократное использование pH-сенсорных чипов. pH-чувствительным покрытием у них служит тонкая плёнка диэлектрика -нитрида кремния, которая сохраняет свои защитные и сенсорные свойства в нейтральных водных растворах до 7 дней. Пропускаемые через проточную ячейку реагенты не отличаются особой агрессивностью, поэтому 10-кратное или даже 100-кратное использование чипов представляется вполне реальным.

Таким образом, благодаря многократному использованию сенсорных чипов и снижению их стоимости данная статья расходов на полупроводниковое секвенирование в ближайшем будущем может уменьшиться примерно в 1000 раз (с 250$ до 10 рублей). При этом возрастёт доля затрат на прокачиваемые через проточную ячейку расходные реагенты – растворы особо чистых дезоксинуклеозидтрифосфатов (дНТФ), содержащие ДНК-полимеразу.

Расходные реагенты

В полупроводниковом секвенировании используются растворы дезоксинуклеозидтрифосфатов с минимальными концентрациями, сравнимыми с характерными для ДНК-полимераз константами Михаэлиса (20…50 мкм). Следовательно, из 1 мМ дНТФ (~ 1000 руб. по каталогу ООО «Медиген») можно приготовить 20…50 мл реагентных растворов (по 5…12,5 мл каждого из четырёх дНТФ). Это примерно соответствует расходу данных реагентов на один цикл работы полупроводникового секвенатора (1…2 часа). В то же время расход дНТФ в самой полимеразной реакции, обеспечивающей секвенирование ДНК, не превышает 1013…1014 молекул на одну проточную ячейку, что составляет менее 0,00001% от их общего количества (1 мМ =6х1020 молекул). Отсюда следует необходимость повторного использования данных растворов.

Проблема в том, что часть дНТФ может гидролизоваться спонтанно. Кроме того, при прохождении индивидуальных растворов через насосы, трубки и проточные ячейки возможно их перекрёстное загрязнение. Следовательно, кроме системы подачи реагентов секвенатор должен быть оснащён ещё и системой их сбора, исключающей смешивание разных дНТФ на выходе, а после каждого цикла секвенирования дезоксинуклеозидтрифосфаты должны проходить повторный цикл очистки. Накапливающиеся в результате гидролиза дНТФ моно-и дифосфаты нуклеозидов желательно регенерировать до трифосфатов.

Разумеется, это создаёт дополнительные проблемы, но все они вполне разрешимы. Одним из решений может стать разработка секвенатора с замкнутой системой циркуляции реагентов, обеспечивающей их очистку в самом рабочем цикле.

Ещё одной проблемой являются очень высокие требования, предъявляемые к чистоте индивидуальных дНТФ. Стоимость особо чистых реагентов, предназначенных для секвенирования ДНК, может оказаться на порядок выше общедоступных дНТФ, применяемых для проведения ПЦР. Разработка внутрилабораторного метода многократной повторной очистки использованных дНТФ позволит решить заодно и проблему чистоты исходных реагентов.

Многократно должна использоваться и содержащаяся в расходных реагентах ДНКполимераза. При стоимости ~1 руб./ед. и рабочей концентрации ~1 ед./10 мкл для приготовления 20…50 мл рабочего раствора потребуется 2…5 тыс. ед. фермента (2…5 тыс. руб.). Самостоятельная очистка ДНК-полимеразы, её регенерация и повторное использование способны уменьшить эти расходы в 100…1000 раз.

Отсюда следует, что при разработке системы подачи реагентов в проточную ячейку полупроводникового секвенатора необходимо предусмотреть возможность сбора отработанных реагентов, а в комплект поставки прибора должна входить система их повторной очистки и регенерации. Это позволит уменьшить стоимость наиболее дорогих расходных реагентов (дНТФ и ДНК-полимеразы) до 10…100 руб. на рабочий цикл.

Пробоподготовка

Подготовка ДНК к секвенированию заслуживают отдельного рассмотрения, поскольку без уменьшения расходов на пробоподготовку удешевление самого секвенирования может оказаться бессмысленным. Обычно такая подготовка включает следующие стадии:

  • очистка ДНК;
  • фрагментация; «полировка» двунитевых концов;
  • пришивка адапторов;
  • предварительная амплификация;
  • выделение ампликонов заданной длины;
  • определение концентрации ДНК;
  • получение клонов отдельных молекул ДНК на микросферных носителях при помощи эмульсионной ПЦР (или твердофазный синтез кластерных колоний ДНК);
  • фракционирование микросфер (для кластеров не требуется);
  • иммобилизация микросфер на сканируемой поверхности проточной ячейки (для кластеров не требуется);
  • перевод двунитевой ДНК в однонитевую форму.

Заметно упрощает пробоподготовку прямое получение клонов ДНК на сканируемой поверхности проточной ячейки секвенатора, используемое в кластерной SBS-технологии (Sequencing By Synthesis) компании Illumina. Что касается технологии SOLiD (Sequencing by Oligonucleotide Ligation and Detection) компании Life Technologies и технологии 454секвенирования (пиросеквенирования) компании Roche, то их существенным недостатком является необходимость получения микросферных носителей ДНК при помощи эмульсионной ПЦР. Данный недостаток унаследовала и полупроводниковая технология секвенирования, разработанная компанией Ion Torrent.

Этапов пробоподготовки может быть и больше. Например, для секвенирования РНК необходимо проведение обратной транскрипции. Для секвенирования транскриптомов нужна нормализация получаемой библиотеки кДНК или ампликонов. Дополнительные стадии подготовки ДНК требуются для проведения парноконцевого или сцепленноконцевого секвенирования, а также для избирательного секвенирования участков генома, экзомов, микроРНК ит.п..

Для подготовки ДНК к секвенированию используется целые комплекты дополнительного дорогостоящего оборудования (системы очистки ДНК, ультразвуковые дезинтеграторы, небулизаторы, автоматизированные системы амплификации ДНК и т.п.). Появляются и системы экспрессной пробоподготовки, не требующие дополнительного приборного оснащения. Одна из первых – Nextera, в которой вместо фрагментации ДНК и пришивки адапторов используется одноэтапное транспозонное встраивание в ДНК синтетических олигонуклеотидов, занимающее около двух часов (http://www.epibio.com/nextera/nextera_tech_overview.asp). Намного проще использовать для этих же целей ПЦР-фрагментацию, предложенную ещё в прошлом веке отечественными учёными (PCR-фрагментация ДНК / Л.А.Железная и др. // Биохимия. – 1999. – Т.64, вып.4. -с.447-453). ПЦР-фрагментация занимает менее часа и приводит к образованию молекул ДНК, пригодных для дальнейшей амплификации (получения молекулярных клонов) и секвенирования.

Сейчас в полупроводниковом секвенировании используется эмульсионная ПЦР. Носителями моноклонов ДНК служат микросферы диаметром ~3 мкм, распределяемые по лункам pH-сенсорного чипа. Для упрощения пробоподготовки желательно моноклоны (микроколонии) молекул ДНК получать твердофазной амплификацией на пористом носителе. Такими носителями могут служить, например, ядерные (трековые) фильтры с вертикальными порами диаметром 0,1…0,5 мкм. Преимущества данного подхода требуют отдельного обсуждения. Пока очевидно только то, что необходима тщательная экспериментальная проработка упрощённых и улучшенных вариантов пробоподготовки. Без проведения такой работы получить «геном за 1000 рублей» не удастся.

Проблемы биоинформатики

Для высококачественного секвенирования геномов требуется 30…40-кратное чтение геномной ДНК. Многократность секвенирования обусловлена несколькими причинами, к которым относятся и высокая вероятность ошибочного чтения, и небольшая длина секвенируемых фрагментов ДНК. Но главной причиной является диплоидность генома, из-за которой при низкой кратности чтения существенные отличия в одной из хромосом могут остаться незамеченными.

Важным фактором, способным уменьшить показатель кратности, является наличие высококачественной референсной последовательности генома человека и баз данных с описаниями известных нуклеотидных замен и других мутаций. Например, база данных dbSNP содержит уже около 50 млн. записей. Используя подобные данные несложно отличить ошибки от мутаций и при низкой кратности чтения (3…4 раза). Что касается диплоидности, то эта проблема также постепенно решается, поскольку всё больше появляется данных о сцепленности мутаций. Проводится работа по составлению баз данных с информацией о гаплоблоках – консервативных участках генома, разделённых горячими точками (или участками) рекомбинации.

Возможность гаплотипирования протяжённых участков хромосом по единичным характерным мутациям определяется количеством оцифрованных индивидуальных геномов человека, которое растёт в геометрической прогрессии. В октябре 2010 года их количество приблизилось к 2700, а к концу этого года прогнозируется увеличение до 30 тысяч. В рамках нескольких проектов проводится углублённый анализ получаемых данных (проекты “1000 Genomes”, “HapMap” и др.). В ближайшие 1…2 года можно ожидать появления баз данных, описывающих сцепленность пар SNP и других мутаций, а также основные гаплоблоки генома человека.

Одним из следствий быстрого увеличения объёмов подобной информации может стать развитие ассоциативного картирования, способного понизить требования к кратности чтения индивидуальных геномов. Данный способ получения недостающей генетической информации пока используется не часто, но в недалёком будущем ситуация может измениться, и вместо общепринятого 30…40-кратного чтения геномов будет достаточно 3...4-кратного. Отсюда следует, что одно только улучшение биоинформационной обработки данных способно в 10 раз уменьшить расходы на секвенирование генома человека.

Рост производительности NGS-технологий

В 1965 году, через 6 лет после появления первых интегральных микросхем, один из основателей компании Intel Гордон Мур высказал предположение, что число транзисторов на кристалле будет удваиваться каждые 24 месяца. Данная закономерность, определяющая рост производительности вычислительной техники, наблюдается уже более 50 лет, и называется законом Мура. Аналогичный закон можно предложить и для NGS-технологий, но с существенной поправкой. Каждые 2 года их производительность увеличивается не в 2, ав 10 раз. При этом стоимость секвенирования генома человека каждые два года уменьшается примерно на порядок (Рис. 3).

«Закон Мура» для геномного секвенирования

Рис. 3

Если такая тенденция сохранится, то стоимость секвенирования генома человека через два года должна уменьшиться до 1000$, а вскоре после зимней Олимпиады-2014 она может опуститься до 100$. Вероятно, оцифровать индивидуальный геном за 1000 рублей можно будет в 2015 году, но «традиционные» NGS-технологии на это уже неспособны.

Первая из таких технологий (454-секвенирование) появилась в 2005 году, и именно она позволила в середине 2007 года преодолеть рубеж в 1 млн.$. К концу 2009 года стоимость пиросеквенирования геномов уменьшилась на порядок, до 100 тыс.$, но конкуренты (Illimina и Applied Biosystems) преодолели этот рубеж раньше -в конце 2008 года. Производительность последней модели пиросеквенатора FLX сейчас достигла 1 млрд.п.о. за рабочий цикл (1/3 генома человека). Ещё недавно это было бы прекрасным показателем, но при сравнении с характеристиками флуоресцентных секвенаторов нынешние параметры пиросеквенаторов выглядят весьма скромно.

Рост производительности флуоресцентных секвенаторов компании Illumina, появившихся в начале 2008 года, был более стремительным (Рис. 4).

Прогнозы роста производительности секвенатора GA IIx на 2009 год

Рис. 4

В начале 2010 года появился секвенатор нового поколения (HiSeq 2000), производительность которого была увеличена до 200 млрд.п.о. за рабочий цикл. Его разработчики недавно объявили, что в I квартале 2011 года производительность этого прибора возрастёт до 600 млрд.п.о., причём уже сейчас в тестовых прогонах им удаётся считывать более 1 «терабайта» генетической информации. Правда, стоимость расходных реагентов в пересчёте на 30…40-кратное чтение генома человека при этом не снижается и равна примерно 5 тыс.$. Похоже, что дальнейшее увеличение производительности флуоресцентных секвенаторов уже не будет сопровождаться заметным уменьшением стоимости расходных реагентов.

Не менее быстро росла и производительность разработанных компанией Applied Biosystems ДНК-лигазных секвенаторов серии SOLiD. Первый прибор появился в конце 2007 года, но имел ряд недоработок. Работоспособной оказалась только вторая модель, поставки которой начались в начале 2008 года. Сейчас компания полностью обновила модельный ряд секвенаторов и приступила к производству приборов 5500 и 5500xl. По производительности эти приборы несколько уступают секвенаторам HiSeq 1000 и HiSeq 2000 компании Illumina, но точность чтения у них немного выше, а стоимость расходных реагентов заметно ниже (3 тыс.$ на геном).

Первый полупроводниковый секвенатор стартовал на рынке NGS всего пару месяцев назад с начальной производительностью 10…15 млн.п.о., но уже через 1…2 месяца она должна возрасти до 100 млн.п.о.. Разработчикам данного прибора уже сейчас удаётся читать по 300 млн. п.о. за один рабочий цикл (~2 часа).

Производительность полупроводникового секвенирования зависит от ряда параметров:

  • длины читаемых нуклеотидных последовательностей (у PGM - 100 п.о.);
  • разрешения чипа (у PGM – 1,55 Mp);
  • эффективности использования pH-сенсорных пикселов;
  • количества pH-сенсорных чипов (у PGM только 1 чип).


Через 1…2 месяца длина читаемых секвенатором PGM последовательностей должна увеличиться со ста до двухсот пар оснований и, судя по всему, это далеко не предел. У пиросеквенаторов FLX и GS Junior средняя длина чтения ДНК составляет примерно 400 п.о.,

причём в ближайшие месяцы ожидается её увеличение до 1000 п.о.. По-видимому, PGM после оптимизации технологии сможет продемонстрировать такие же показатели.

Не менее быстро может расти разрешение pH-сенсорных чипов. Через пару месяцев на смену “314x” (1,55 Mp) должен прийти “Ion 316” (7 Mp). Дальнейшие планы компании Ion Torrent пока неизвестны, но, судя по появлению дешёвых BSI-сенсоров изображения с разрешением 14 и 16 Mp, появления аналогичных pH-сенсорных чипов ждать придётся недолго.

Ожидается прогресс и в повышении эффективности использования pH-сенсоров. Значительная часть лунок на чипе остаётся незаполненной микросферами, а часть этих микросфер или не содержит ДНК, или несёт на себе не моноклоны молекул, а смесь двух и более их видов. Такая же проблема характерна и для пиросеквенаторов, у которых эффективность использования лунок проточной ячейки удалось довести до 50%. У PGM из имеющихся на чипе 1,55 Mp сенсорных пикселов 0,25 Mp остаются за пределами проточной ячейки (Рис. 5), а эффективность использования остальных 1,3 Mp, судя по нынешней производительности прибора, составляет примерно 10%. Следовательно, увеличить производительность полупроводникового секвенатора примерно в 5 раз можно только за счёт улучшения конфигурации проточной ячейки и повышения эффективности использования сенсорных пикселов.

Проточная ячейка секвенатора PGM с чипом “314x”

Рис. 5

Ещё одним пока неиспользованным резервом наращивания производительности полупроводниковых секвенаторов является увеличение количества проточных ячеек с одной (у PGM) до 6 (как у 5500), 8 (HiSeq 1000), 12 (5500xl), 16 (HiSeq 2000), или даже до 96 (ASM-2000).

К концу текущего года производительность PGM может преодолеть рубеж в 1 млрд.п.о. и продемонстрировать рекордные темпы роста – в 100 раз всего за один год. Предыдущий рекорд принадлежит секвенаторам Illumina, производительность которых увеличилась за 4 года почти в 1000 раз -с 1 миллиарда п.о. в начале 2007 года до 1 триллиона в начале 2011 г. (при продолжительности рабочего цикла 10…14 суток).

По-видимому, темпы роста производительности полупроводниковых секвенаторов через 2…3 года побьют этот рекорд и обеспечат 3…4-кратное секвенирование генома человека на одном чипе за один рабочий цикл (при продолжительности рабочего цикла 10…14 часов). Затем фаза взрывного роста замедлится, и в дальнейшем производительность секвенирования будет расти в соответствии с законом Мура, т.е. будет удваиваться каждые 2 года.

Dream Machine

Секвенатор PGM (Personal Genome Machine) ещё несовершенен, но рассмотрение его недостатков позволяет понять, к чему следует стремиться, и какие рабочие характеристики должны быть у идеального прибора -у Dream Machine (DM). Данное название было предложено одним из участников форума seqanswers.com (http://seqanswers.com/forums/showthread.php?t=8692). По-видимому, именно так можно назвать прибор, позволяющий секвенировать индивидуальные геномы за 1000 рублей.

Наглядно сопоставить характеристики PGM и возможных моделей DM позволяет приведённая ниже таблица.

Сравнение Personal Genome Machine и Dream Machine

Параметры PGM DM
Стоимость прибора 50 тыс.$ 1 млн. руб.
Стоимость расходных материалов: а) на один рабочий цикл б) на геном человека 500 $ ~500 тыс.$ 100 руб. (3,3$) 1 тыс. руб. (33$)
Длина чтения 100…200 п.о. 400…800 п.о.
Продолжительность рабочего цикла 2 часа 2…10 часов
Разрешение чипа 1,55 Mp 12…16 Mp
Стоимость чипа 250 $ 250 руб. (<10$)
Эффективность использования pH-сенсоров 10% 50%
Многократное использование чипа - +
Многократное использование реагентов - +
Количество проточных ячеек 1 8, 16 или 96
Производительность рабочего цикла 10…100 млн.п.о. 10…100 млрд.п.о.

 

Особенности национального секвенирования

В мире сейчас насчитывается около трёх тысяч геномных секвенаторов. В России на сегодняшний день имеется 19 приборов такого типа (4 FLX, 2 GS Junior; 6 SOLiD 2…4; 6 GA IIx, 1 HiSeq 2000), которые, как правило, простаивают из-за отсутствия дорогих реагентов.

В конце октября прошлого года в мире было оцифровано 2700 индивидуальных геномов человека. В конце 2009 года с большой помпой было объявлено о выдающемся достижении отечественных учёных – о секвенировании первого генома, принадлежащего «русскому мужчине». Других новостей с тех пор не слышно.

Таким образом, доля российских секвенаторов на мировом рынке NGS не превышает 0,7%. Из них только HiSeq 2000 вполне современен. Остальные можно отнести к морально устаревшим.

Интересно, что этот единственный российский HiSeq 2000 был приобретён на деньги спонсора (http://grostok.ru/i/press/?id=8). При действующей медлительной системе госзакупок приобрести самую последнюю модель геномного секвенатора практически невозможно, поскольку смена их поколений происходит ежегодно.

Можно ли изменить эту ситуацию? Не можно, а нужно.

Что для этого нужно сделать?

Изыскать финансирование и найти специалистов, которые смогут разработать секвенатор DM, технологии получения и очистки реагентов, системы пробоподготовки, биоинформационное обеспечение и т.п..

Кто будет этим заниматься? Думайте сами. Извините, но мне одному это не потянуть.