Поиск работы на сайте Jobvk.com
Разместить вакансию
Разместить резюме

Senior Data Scientist NLP | RND TeamLead в LegaTech

СБЕР
  • Полная занятость
  • Опыт: 3-6 лет
  • Описание: Мы — R&D команда проекта GigaLegal в СБЕР, создающая решения в правовой сфере на основе LLM для автоматизации юридических процессов. Наша цель — трансформировать работу юристов, бизнеса и госструктур через: Автоматизацию анализа договоров и юридических документов Интеллектуальную генерацию правовых текстов Разработку специализированных юридических чат-ботов Создание автономных юридических ИИ-агентов Мы в поиске опытного TL|Senior-специалиста, который возьмет на себя ответственность за разработку и внедрение LLM-решений, способных масштабировать бизнес-процессы наших клиентов.Обязанности LLM-ориентированные решения : Проектирование и реализация стратегий адаптации LLM (prompting, fine-tuning, LoRA, RLHF) под специфику юридических задач. Проектирование и разработка пайплайнов для обработки юридических данных (RAG, агентские системы, семантический поиск). Проектирование навыков и обучение LLM и NLP/Сlassic ML моделей для реализации бизнес-задач Оптимизация производительности LLM в production (латентность, стоимость, точность). Продакшен-инжиниринг : Внедрение DS-моделей в production с использованием MLOps-практик (CI/CD, мониторинг, A/B-тесты). Интеграция решений с внешними API, работа с векторными базами, поисковыми движками (ElasticSearch). Проектирование отказоустойчивых систем для обработки конфиденциальных юридических данных. Работа с SQL/No SQL БД Лидерство и экспертиза : Участие в постановке технических требований и взаимодействие с бизнес-заказчиками. Проработка с юридическими экспертами, системными аналитиками, стороной заказчиков требований и вариантов решения задач Проработка с отделом обучения тестовой и обучающей разметки для обучения юридическим навыкам GigaChat и других LLM Менторство младших коллег, code review, разработка best practices для команды. Анализ рисков и поиск компромиссов между качеством моделей, скоростью и стоимостью. Возможно лидирование RND команды проекта и позиция TeamLeadТребования Опыт : 3+ лет в DS/NLP, включая 1+ год работы с LLM, опыт с production. Технические навыки : Готовность как писать код, пайплайны, обучать модели, так и писать документацию, проектировать системы и готовить спецификации на модели, данные, пайплайны. Глубокая экспертиза в адаптации LLM: SFT, RLHF, LoRA, prompt engineering. Опыт построения RAG-систем, агентских пайплайнов и сервисов на основе LLM. Знание современных фреймворков (PyTorch, Hugging Face, LangChain, LlamaIndex). Уверенная работа с инфраструктурой: Docker, Kubernetes, облачные платформы. Понимание MLOps: CI/CD, мониторинг дрифта данных, логирование. Бизнес-ориентированность : Опыт трансформации бизнес-задач в технические требования. Умение оценивать ROI DS-решений и балансировать между инновациями и практичностью. Умение быстро делать прототипы решений и искать баланс между скоростью/качеством/производительностью. Soft Skills : Умение аргументировать технические решения перед заказчиками. Опыт управления мини-проектами и координации команд. Умение коммуницировать с