Data Scientist / Analytics в американском стартапе в сфере недвижимости

Зарплата

от 2000 до 3000 $

Местоположение и тип занятости

Полный рабочий деньМожно удаленно

Компания

Американский стартап в сфере маркетинга на рынке недвижимости. Помогаем риэлторам и их клиентам находить дома мечты.

Описание вакансии

О компании и команде

Меня зовут Максим, я — лид разработки в американском проекте в сфере недвижимости. Разрабатываем комплекс инструментов по автоматизации маркетинга для риэлторов и поиску новых клиентов.

Мы ищем Data Scientist в команду на ближайшие два года (планируем продаваться в 2025). Если кратко о нашей задаче: у нас есть несколько сотен гигабайт данных о недвижке США, их владельцах и пятилетняя история продаж. Нужно научиться определять, какие из объектов могут быть проданы в ближайшее время, чтобы агенты работали с этими владельцами прежде всего.

Мы недавно наняли консультанта — опытного специалиста по данным, который основал свою компанию и успешно её развивает уже 11 лет. Он будет вести подпроект и сможет помогать решать проблемы, но ему в помощь нужен опытный специалист, знающий R, Pyhton, работавший с TensorFlow и Keras, умеющий анализировать временные ряды.

Ожидания от кандидата

Basis:

  • R
  • SQL
  • Python

Skills:

  • Time Series Analysis: Real estate prices and sales often follow time-based patterns. Skills in time series forecasting can be invaluable.
  • Geospatial Analysis: Understanding the geographical aspects of real estate data can provide insights into location-based trends.
  • Feature Engineering: The ability to derive new variables from existing data can significantly improve model performance.

Libraries & Technologies:

  • Scikit-learn: A foundational Python library for machine learning that provides simple and efficient tools for data analysis.
  • Pandas: Essential for data manipulation and analysis in Python.
  • TensorFlow and Keras: For deep learning models, which can be especially useful when working with large datasets or considering neural network architectures.
  • Prophet: Developed by Facebook, it's a tool for forecasting time series data.
  • Geopandas & Folium: For geospatial data manipulation and visualization in Python.
  • XGBoost and LightGBM: Gradient boosting frameworks that are efficient and offer excellent out-of-the-box performance.

Approaches & Methodologies:

  • Cross-Validation: Especially time series cross-validation, to ensure your models generalize well to future data.
  • Ensemble Methods: Combining predictions from multiple models can often yield better results than any single model.
  • Regularization Techniques: Like Lasso and Ridge regression, to prevent overfitting, especially when working with high-dimensional data.
  • Transfer Learning: Especially when using deep learning, where pre-trained models can be fine-tuned for specific real estate tasks.

Domain-Specific Knowledge:

  • Macro and Microeconomic Indicators: Understanding economic factors that influence the real estate market can be crucial.
  • Local Real Estate Regulations: Different regions have different regulations that can significantly impact the real estate market.
  • Housing Market Cycles: Recognizing and understanding the phases of real estate market cycles can guide predictive modeling.

Soft Skills & Collaboration Tools:

  • Stakeholder Communication: The ability to communicate findings and insights to non-technical stakeholders using visualization tools or presentations.
  • Collaboration Tools: Familiarity with platforms like Jira, Trello, or Asana for project management, and Git for version control.
  • Good English writing. Speaking is a good advantage

Условия работы

  • Зарплата в долларах и индексируется
  • Опцион
  • Действительно гибкий график и удалёнка — можно работать в удобные дни и часы, главное договориться зараннее. У нас работают ребята из Коста-Рики, Румынии, Словакии, Казахстана и РФ.

Бонусы

  • Возможность поработать в американском стартапе с нуля и поучаствовать в создании компании на пару сотен миллионов долларов (владельцы бизнеса уже успешно создавали и продавали подобные проекты)
  • Работа в команде и под руководством техлида с огромным опытом в Data Science
  • Бизнес не давит на разработку, постоянно выделяем время на техничекий долг
  • Сможете подтянуть английский язык. Продуктовая команда и половина технической говорят только на английском.

Дополнительные инструкции

Первый этап собеседования — аудио со мной (30 минут)

Второй этап собеседования — аудио/видео на английском с техлидом (30-60 минут)

Третий этап собеседования — аудио/видео на английском с владельцем бизнеса (30 минут)