Python-разработчик (обработка облаков точек LAZ/LAS → классификация)
от 150 000 ₽
Требования
Условия
Компания
ИТ-компания, интегратор ИТ решений в сфере медицины
Описание вакансии
О проекте
Ищем Python-разработчика в команду геопространственных данных. Задача — автоматизировать классификацию объектов в облаках точек (форматы LAZ/LAS; в т.ч. «тяжёлые» файлы от 4 ГБ и выше) в соответствии с корпоративным классификатором предприятия и формировать на выходе 2D топографический план в формате DXF.
Чем предстоит заниматься
- Разработка пайплайна обработки облаков точек LAZ/LAS:
- чтение/индексация больших файлов (4+ ГБ), разбиение на блоки/тайлы;
- оптимизация памяти и времени выполнения (streaming/chunking, parallel).
- Классификация объектов по внутреннему классификатору предприятия:
- сопоставление/преобразование классов LAS (Classification) к корпоративной схеме;
- правила/эвристики и/или ML-подходы (если применимо).
- Извлечение геометрии для 2D топоплана:
- генерация контуров/линий/точек (например, рельеф, здания, дороги, растительность и т.п. — по ТЗ предприятия);
- генерализация/упрощение геометрии, фильтрация шумов.
- Формирование результата:
- DXF со слоями, атрибутами, типами линий по стандарту предприятия;
- контроль качества: отчёты/статистика по классам, проверка полноты/валидности.
Требования
- Уверенный Python 3.x: профилирование, оптимизация, работа с большими данными.
- Опыт работы с геоданными и/или 3D/point cloud:
- понимание структуры LAS/LAZ, классов, координатных систем.
- Практика написания надёжных пайплайнов:
- потоковая обработка, батчи, очереди задач, обработка ошибок, возобновление.
- Опыт с библиотеками/инструментами (что-то из):
- PDAL, laspy, LAStools (если есть), Open3D, NumPy, Shapely/GeoPandas, GDAL/OGR.
- Экспорт/генерация DXF (желательно опыт, но можно добрать в процессе):
- например, ezdxf + корректная работа со слоями/атрибутами.
Будет плюсом
- Опыт построения классификаторов (rule-based или ML), понимание метрик качества.
- Понимание топографических требований: слои, условные обозначения, допуски.
- Параллельные вычисления: multiprocessing, Dask/Ray, работа на сервере с ограничениями по RAM/IO.
- Опыт с PostGIS/ETL, построение индексной сетки/тайлинга, пространственные индексы.
Формат сотрудничества
- Полная/частичная занятость, удалённо.
- Рассматриваем устройство по ТК, ИП, самозанятых.
