Python ML-разработчик (частичная или полная занятость)
Требования
Местоположение и тип занятости
Компания
Разработка ИТ-продуктов и реализация проектов
Описание вакансии
О компании и команде
Мы создаём интеллектуальные системы нового поколения — ИИ-агентов и платформы для автоматизации анализа данных, речи и текстов.
Ищем опытного ML-разработчика на Python, который умеет превращать неструктурированные тексты в данные, проектировать алгоритмы семантического сопоставления и строить RAG-архитектуры с интеграцией LLM-моделей.
Задачи
- Разработка алгоритмов обработки и анализа неструктурированных текстовых документов (PDF, DOCX, и др.).
- Парсинг, извлечение и нормализация данных с применением NLP-моделей.
- Определение ключевых значений и позиций в текстах согласно требованиям бизнес-логики.
- Сопоставление данных с НСИ по принципам нечёткого сравнения (Левенштейн, Jaro-Winkler, Cosine Similarity, Embeddings).
- Разработка и оптимизация алгоритмов семантического сопоставления и нормализации текстов.
- Построение и интеграция RAG-систем (Retrieval-Augmented Generation): индексация, векторный поиск, контекстная подача данных LLM.
- Реализация REST API для интеграции компонентов ML-систем с внешними сервисами.
- Работа с очередями сообщений (RabbitMQ) для обмена данными и оркестрации задач.
- Контейнеризация и деплой сервисов в Docker, участие в CI/CD-пайплайнах.
Требования к кандидату
- Уверенные знания и опыт разработки на Python 3.x (не ниже уровня Middle).
- Глубокое понимание принципов обработки естественного языка (NLP): токенизация, лемматизация, NER, эмбеддинги, семантическое сравнение.
- Уверенные навыки реализации REST API и авторизации на основе JWT.
- Знание и применение алгоритмов:
Левенштейн, Cosine Similarity, TF-IDF, Embeddings, Jaccard, BM25. - Опыт построения RAG-систем и интеграции с популярными LLM-API (OpenAI, Gemini, Anthropic, Llama, и др.).
- Навыки работы с векторными базами данных.
- Опыт работы с RabbitMQ (очереди задач, брокеры сообщений, publish/subscribe-механизмы).
- Понимание принципов контейнеризации и оркестрации: Docker, Docker Compose, CI/CD-процессы.
- Уверенное владение Git, базовыми SQL-запросами.
- Умение проектировать устойчивые и масштабируемые архитектуры ML-модулей.
Мы предлагаем
- Участие в передовых ИИ-проектах: от речевой аналитики до умных агентов.
- Возможность влиять на архитектурные решения и технологический стек.
- Работу в команде сильных инженеров, где ценятся инициатива и инженерное мышление.
- Гибкий формат (удалённо), современный стек, короткие итерации.
