Вакансия: Data Scientist / ML Engineer для AI-агента (удалённо)

Зарплата

от 300 000 до 450 000 ₽

Местоположение и тип занятости

Полный рабочий деньМожно удаленно

Компания

Агрегация данных недвижимости

Описание вакансии

О компании и команде

Мы ищем опытного AWS-инженера / Data Engineer / ML-инженера, который разработает инфраструктуру узкоспециализированного AI-агента и ETL-пайплайн для обработки данных о недвижимости. Проект будет развернут в AWS, использовать vLLM, PostgreSQL, pgvector, OpenSearch, и Kubernetes (EKS).


    Ожидания от кандидата

    📌 Основные задачи

    1️⃣ Разработка и развертывание LLM-инфраструктуры на AWS (vLLM + DeepSeek R1)

    • Настроить vLLM на AWS EKS (Kubernetes) с GPU-узлами.
    • Оптимизировать модельное хранение (FSx for Lustre / EFS для загрузки моделей).
    • Настроить авто-масштабирование для vLLM-инференса (AWS Auto Scaling, Load Balancing).
    • API-интерфейс через FastAPI / Flask + Nginx + AWS ALB.

    2️⃣ Настройка базы данных и векторного поиска

    • Развернуть PostgreSQL (Aurora Serverless v2) + pgvector.
    • Оптимизировать индексирование и запросы к векторному поиску.
    • Настроить гибридный поиск (pgvector + OpenSearch) для улучшения поиска недвижимости.
    • Кеширование embedding-запросов через Redis (ElastiCache).

    3️⃣ Разработка ETL-пайплайна для загрузки и обработки данных

    • Настроить AWS Glue / Apache Airflow для обработки данных MLS, налоговых записей, кадастра.
    • Сохранение данных в S3 (сырые данные) → PostgreSQL (структурированные) → pgvector (embeddings).
    • Интеграция OCR-инструментов (Amazon Textract, Tesseract) для обработки документов.
    • Валидация данных, контроль качества и логирование.

    4️⃣ Мониторинг, безопасность и логирование

    • Настроить AWS CloudWatch + Prometheus + Grafana для мониторинга инференса vLLM.
    • Внедрить AWS X-Ray для трассировки AI-запросов.
    • Обеспечить безопасность API через AWS WAF, AWS Shield, PrivateLink.

    📌 Ожидаемый результат

    🔹 Полностью рабочая AI-инфраструктура с vLLM на AWS.
    🔹 Оптимизированный векторный поиск по недвижимости.
    🔹 Рабочий ETL-пайплайн, загружающий и обрабатывающий данные автоматически.
    🔹 Безопасная API-интеграция и отказоустойчивость сервиса.
    🔹 Мониторинг и логирование всех компонентов системы.

    💰 Бюджет обсуждается в зависимости от опыта кандидата и скорости выполнения проекта.
    📩 Если у вас есть опыт работы с AWS, AI-инференсом и обработкой данных, отправьте своё резюме и примеры проектов  🚀

    Условия работы

    📌 Что предлагаем

    Заработная плата: от 300 000 до 450 000 ₽ в месяц (или эквивалент в $).
    Формат работы: удалённая, гибкий график.
    AWS-ориентированный стек: доступ к передовым AI-инструментам и облачной инфраструктуре.
    Работа над инновационным AI-проектом в сфере недвижимости.
    Оплата: каждые две недели, банковским переводом (₽ или $ при наличии SWIFT).
    Карьерный рост и работа с cutting-edge AI в команде ML-инженеров.

    Если у вас опыт в AWS, NLP, LLM и AI-инфраструктуре и вы хотите разрабатывать AI-агента на cutting-edge технологиях, отправляйте резюме! 🚀

    Дополнительные инструкции

    📌 Требуемые навыки

    Опыт работы с AWS (EKS, EC2 GPU, S3, RDS/Aurora, FSx, Lambda, Fargate, Step Functions).
    Развертывание LLM (vLLM, DeepSeek R1, LlamaIndex, LangChain) на AWS.
    Опыт работы с PostgreSQL + pgvector (векторные запросы, индексация).
    Опыт работы с Kubernetes (EKS) и автоматическим масштабированием.
    Разработка API (FastAPI / Flask) + Nginx / AWS ALB.
    Навыки работы с семантическим поиском (OpenSearch, pgvector, Redis).
    Разработка ETL-пайплайнов (AWS Glue, Airflow, PySpark, Pandas).
    Опыт работы с NLP, OCR, LangChain, AWS Textract (будет плюсом).