Начальная обработка данных заключается в применении общепринятых стандартных программных средств к сырым данным, как, например, картирование на референсный геном или поиск похожих последовательностей в публичных базах данных. На этом этапе мы считаем важным придерживаться двух принципов. Во-первых, качественно отделять осмысленную информацию от мусора, чтобы снизить момент неопределенности при дальнейшем анализе. Во-вторых, по возможности уделять внимание всему геному, в том числе той части, которая не кодирует белок, поскольку не менее половины полезной информации скрыто в «тёмной материи» генома.
Обработка данных секвенирования нового поколения (NGS – next generation sequencing) включает в себя:
- Первичную фильтрацию и контроль качества
- Картирование на референсный геном
- Построение таблиц экспрессии генов
- Сборка транскриптов или генома
- Поиск отличий между группами образцов статистическими методами
- Поиск точечных мутаций (SNP, снипов) и структурных вариаций
- Аннотацию по открытым и закрытым базам данных и специализированным консорциумам
- Предсказание межмолекулярных взаимодействий
- Поиск фактов и взаимосвязей по литературе в ручном и автоматическом режимах
В процессе работы мы гарантируем надежное хранение данных и можем работать как на собственном оборудовании, так и на серверах, предоставляемых нашими клиентами.
У нас имеется богатый опыт работы с различными платформами и программным обеспечением. Мы являемся частью команды, обладающей уникальной технологией одномолекулярного секвенирования (прямое высокопроизводительное секвенирование без амплификации молекул).