Перейти к основному содержанию

Data Scientist - NLP/LLM Engineer

12 августа 2024

Требуется специалист по применению больших языковых моделей (LLM) к задачам обработки научного и медицинского текста (NLP). Вам предстоит проводить дообучение моделей на русском языке.

Задачи:
Улучшение поиска контента
Разбор запросов на естественном языке и выдача релевантных книг, глав, абзацев.
Кластеризация контента.
Создание системы поддержки принятия врачебных решений (СППВР) способной правильно отвечать на медицинские вопросы.
Создание помощника генерации медицинских документов: справок, выписок, заключений, отчетов.

Требования:
понимать принципы NLP;
ориентироваться в современном ландшафте языковых моделей;
опыт дообучения языковых моделей на корпусах текстов;
локально разворачивать и запускать открытые модели серий LLaMA, Mistral и дообученные с HugginFace;
уметь оркестровывать модели с помощью LangChain, LlamaIndex;
опыт работы с Big Data и векторными БД;
опыт с LoRa, RAG.

Будет плюсом:
умение прототипировать web-интерфейсы;
орuанизация для проекта CI/CD;
владение знаниями биомедицинского домена;
обучение LLM для перевода с английского на русский.

Отправить резюме

Только один файл.
Ограничение 25 МБ.
Допустимые типы: txt, pdf, doc, docx.
CAPTCHA на основе изображений
Введите символы, которые показаны на картинке.