🧑‍💻 Что вам не нравится на собеседованиях? Поделитесь с нами → пройти опрос

Python ML-разработчик (частичная или полная занятость)

Местоположение и тип занятости

Неполный рабочий деньМожно удаленно

Компания

Разработка ИТ-продуктов и реализация проектов

Описание вакансии

О компании и команде

Мы создаём интеллектуальные системы нового поколения — ИИ-агентов и платформы для автоматизации анализа данных, речи и текстов.
Ищем опытного ML-разработчика на Python, который умеет превращать неструктурированные тексты в данные, проектировать алгоритмы семантического сопоставления и строить RAG-архитектуры с интеграцией LLM-моделей.

Задачи

  • Разработка алгоритмов обработки и анализа неструктурированных текстовых документов (PDF, DOCX, и др.).
  • Парсинг, извлечение и нормализация данных с применением NLP-моделей.
  • Определение ключевых значений и позиций в текстах согласно требованиям бизнес-логики.
  • Сопоставление данных с НСИ по принципам нечёткого сравнения (Левенштейн, Jaro-Winkler, Cosine Similarity, Embeddings).
  • Разработка и оптимизация алгоритмов семантического сопоставления и нормализации текстов.
  • Построение и интеграция RAG-систем (Retrieval-Augmented Generation): индексация, векторный поиск, контекстная подача данных LLM.
  • Реализация REST API для интеграции компонентов ML-систем с внешними сервисами.
  • Работа с очередями сообщений (RabbitMQ) для обмена данными и оркестрации задач.
  • Контейнеризация и деплой сервисов в Docker, участие в CI/CD-пайплайнах.

Требования к кандидату

  • Уверенные знания и опыт разработки на Python 3.x (не ниже уровня Middle).
  • Глубокое понимание принципов обработки естественного языка (NLP): токенизация, лемматизация, NER, эмбеддинги, семантическое сравнение.
  • Уверенные навыки реализации REST API и авторизации на основе JWT.
  • Знание и применение алгоритмов:
    Левенштейн, Cosine Similarity, TF-IDF, Embeddings, Jaccard, BM25.
  • Опыт построения RAG-систем и интеграции с популярными LLM-API (OpenAI, Gemini, Anthropic, Llama, и др.).
  • Навыки работы с векторными базами данных.
  • Опыт работы с RabbitMQ (очереди задач, брокеры сообщений, publish/subscribe-механизмы).
  • Понимание принципов контейнеризации и оркестрации: Docker, Docker Compose, CI/CD-процессы.
  • Уверенное владение Git, базовыми SQL-запросами.
  • Умение проектировать устойчивые и масштабируемые архитектуры ML-модулей.

Мы предлагаем

  • Участие в передовых ИИ-проектах: от речевой аналитики до умных агентов.
  • Возможность влиять на архитектурные решения и технологический стек.
  • Работу в команде сильных инженеров, где ценятся инициатива и инженерное мышление.
  • Гибкий формат (удалённо), современный стек, короткие итерации.