Вакансия: Data Scientist / ML Engineer для AI-агента (удалённо)
Зарплата
Требования
Местоположение и тип занятости
Компания
Описание вакансии
О компании и команде
Мы ищем опытного AWS-инженера / Data Engineer / ML-инженера, который разработает инфраструктуру узкоспециализированного AI-агента и ETL-пайплайн для обработки данных о недвижимости. Проект будет развернут в AWS, использовать vLLM, PostgreSQL, pgvector, OpenSearch, и Kubernetes (EKS).
Ожидания от кандидата
📌 Основные задачи
1️⃣ Разработка и развертывание LLM-инфраструктуры на AWS (vLLM + DeepSeek R1)
- Настроить vLLM на AWS EKS (Kubernetes) с GPU-узлами.
- Оптимизировать модельное хранение (FSx for Lustre / EFS для загрузки моделей).
- Настроить авто-масштабирование для vLLM-инференса (AWS Auto Scaling, Load Balancing).
- API-интерфейс через FastAPI / Flask + Nginx + AWS ALB.
2️⃣ Настройка базы данных и векторного поиска
- Развернуть PostgreSQL (Aurora Serverless v2) + pgvector.
- Оптимизировать индексирование и запросы к векторному поиску.
- Настроить гибридный поиск (pgvector + OpenSearch) для улучшения поиска недвижимости.
- Кеширование embedding-запросов через Redis (ElastiCache).
3️⃣ Разработка ETL-пайплайна для загрузки и обработки данных
- Настроить AWS Glue / Apache Airflow для обработки данных MLS, налоговых записей, кадастра.
- Сохранение данных в S3 (сырые данные) → PostgreSQL (структурированные) → pgvector (embeddings).
- Интеграция OCR-инструментов (Amazon Textract, Tesseract) для обработки документов.
- Валидация данных, контроль качества и логирование.
4️⃣ Мониторинг, безопасность и логирование
- Настроить AWS CloudWatch + Prometheus + Grafana для мониторинга инференса vLLM.
- Внедрить AWS X-Ray для трассировки AI-запросов.
- Обеспечить безопасность API через AWS WAF, AWS Shield, PrivateLink.
📌 Ожидаемый результат
🔹 Полностью рабочая AI-инфраструктура с vLLM на AWS.
🔹 Оптимизированный векторный поиск по недвижимости.
🔹 Рабочий ETL-пайплайн, загружающий и обрабатывающий данные автоматически.
🔹 Безопасная API-интеграция и отказоустойчивость сервиса.
🔹 Мониторинг и логирование всех компонентов системы.
💰 Бюджет обсуждается в зависимости от опыта кандидата и скорости выполнения проекта.
📩 Если у вас есть опыт работы с AWS, AI-инференсом и обработкой данных, отправьте своё резюме и примеры проектов 🚀
Условия работы
📌 Что предлагаем
✔ Заработная плата: от 300 000 до 450 000 ₽ в месяц (или эквивалент в $).
✔ Формат работы: удалённая, гибкий график.
✔ AWS-ориентированный стек: доступ к передовым AI-инструментам и облачной инфраструктуре.
✔ Работа над инновационным AI-проектом в сфере недвижимости.
✔ Оплата: каждые две недели, банковским переводом (₽ или $ при наличии SWIFT).
✔ Карьерный рост и работа с cutting-edge AI в команде ML-инженеров.
Если у вас опыт в AWS, NLP, LLM и AI-инфраструктуре и вы хотите разрабатывать AI-агента на cutting-edge технологиях, отправляйте резюме! 🚀
Дополнительные инструкции
📌 Требуемые навыки
✅ Опыт работы с AWS (EKS, EC2 GPU, S3, RDS/Aurora, FSx, Lambda, Fargate, Step Functions).
✅ Развертывание LLM (vLLM, DeepSeek R1, LlamaIndex, LangChain) на AWS.
✅ Опыт работы с PostgreSQL + pgvector (векторные запросы, индексация).
✅ Опыт работы с Kubernetes (EKS) и автоматическим масштабированием.
✅ Разработка API (FastAPI / Flask) + Nginx / AWS ALB.
✅ Навыки работы с семантическим поиском (OpenSearch, pgvector, Redis).
✅ Разработка ETL-пайплайнов (AWS Glue, Airflow, PySpark, Pandas).
✅ Опыт работы с NLP, OCR, LangChain, AWS Textract (будет плюсом).