12–15 мая 2025 года в Санкт-Петербурге прошел XI Съезд Российского общества медицинских генетиков с международным участием. В рамках научной программы с докладом «Клинико-биоинформатические задачи с использованием синтетических данных» выступила врач-генетик Слепухина Анастасия Александровна.
Доклад был посвящен актуальным вопросам применения биоинформатических методов и синтетических данных в медицинской генетике
Стремительное развитие медицинской генетики и широкое внедрение NGS создали острую потребность в специалистах, способных интерпретировать генетические данные. Однако обучение врачей и студентов затруднено из-за ограничений, связанных с защитой персональных данных, недостатком специалистов по обработке генетических данных и отсутствием адаптированных учебных материалов.
Цель: создание клинико‑биоинформатических задач на основе синтетических данных для обучения интерпретации генетических вариантов.
Материалы и методы: использовали случайные комбинации фрагментов образцов европейской субпопуляции проекта 1000Genomes. По полученным последовательностям (GRCh38) генерировали парные синтетические файлы FASTQ с использованием программы ExoSim. Путем анализа учебных программ по специальности «Генетика» и учебных пособий выбирали нозологии, для которых составлялась клиническая часть задачи, исходя из типичных черт или минимальных диагностических критериев, научных публикаций. В синтетический образец внедряли варианты нуклеотидной последовательности, объясняющие фенотип. Проверили результаты обработки данных на отсутствие ошибок и ложноположительных результатов интерпретации.
Результаты: разработан метод создания клинико-биоинформатических задач с использованием синтетических экзомов, которые имитируют клинические случаи, приближенные к реальности. Создано 10 задач, охватывающих распространенные наследственные заболевания. Представленность SNPs в синтетических экзомах соответствует европейской субпопуляции проекта 1000Genomes. Задачи доступны преподавателям в программном инструменте GenoSkill (по заявкам).