Требуется специалист по применению больших языковых моделей (LLM) к задачам обработки научного и медицинского текста (NLP). Вам предстоит проводить дообучение моделей на русском языке.
Задачи:
Улучшение поиска контента
Разбор запросов на естественном языке и выдача релевантных книг, глав, абзацев.
Кластеризация контента.
Создание системы поддержки принятия врачебных решений (СППВР) способной правильно отвечать на медицинские вопросы.
Создание помощника генерации медицинских документов: справок, выписок, заключений, отчетов.
Требования:
понимать принципы NLP;
ориентироваться в современном ландшафте языковых моделей;
опыт дообучения языковых моделей на корпусах текстов;
локально разворачивать и запускать открытые модели серий LLaMA, Mistral и дообученные с HugginFace;
уметь оркестровывать модели с помощью LangChain, LlamaIndex;
опыт работы с Big Data и векторными БД;
опыт с LoRa, RAG.
Будет плюсом:
умение прототипировать web-интерфейсы;
орuанизация для проекта CI/CD;
владение знаниями биомедицинского домена;
обучение LLM для перевода с английского на русский.