Пару лет назад мы разработали решение spark-greenplum connector. Это многофункциональный коннектор с поддержкой параллельных операций чтения/записи между Apache Spark и базой данных Greenplum. А сейчас обновили его и выложили в открытый доступ. Решение…
Про инфраструктуру в облаках мы рассказываем на многих курсах Слёрма. Но, как правило, речь идёт о большой тройке: Microsoft Azure, Google Cloud, AWS. На новом курсе Spark-инженер мы с первого дня будем работать на российской системе Yandex C…