Чтобы упростить и оптимизировать работу с большими данными, все больше компаний используют облачные PaaS-решения — они помогают облегчить работу с big data и получать готовые сервисы буквально за пару кликов. С чем еще связана популярность PaaS-сервисо…
Пару лет назад мы разработали решение spark-greenplum connector. Это многофункциональный коннектор с поддержкой параллельных операций чтения/записи между Apache Spark и базой данных Greenplum. А сейчас обновили его и выложили в открытый доступ. Решение…
Про инфраструктуру в облаках мы рассказываем на многих курсах Слёрма. Но, как правило, речь идёт о большой тройке: Microsoft Azure, Google Cloud, AWS. На новом курсе Spark-инженер мы с первого дня будем работать на российской системе Yandex C…
Работа с данными — это не только аналитика. В этой сфере есть инженерные роли. Инженеры разрабатывают и эксплуатируют системы, благодаря которым данные доступны, лежат в правильном формате в нужном хранилище, с заданными владельцами и описанной структу…
С чего начинается аналитика расскажет Андрей Вильмов, Data Engineer в «ПерилаГлавСнаб». Андрей — гость следующего выпуска шоу Слёрма «Заходят два архитектора в бар…», который выйдет в этот четверг, 22 июня, в 19:00 мск. Читать далее…
Привет, Хабр! Меня зовут Ван, я возглавляю отдел машинного обучения и матчинга торговой площадки Ozon. В нашем IT работает более ста DS-специалистов, чьи алгоритмы ежедневно обрабатывают сотни терабайтов данных для решения важных бизнес-задач и не толь…