
Расширенная аналитика с PySpark. Практические примеры анализа больших наборов данных с использованием Python и Spark
Автор:
Книга посвящена практическим методам анализа больших объемов данных с использованием языка Python и фреймворка Spark, она знакомит с моделью программирования Spark и основами системы с открытым исходным кодом PySpark. Каждая глава описывает отдельный аспект анализа данных,...Ещё
Книга посвящена практическим методам анализа больших объемов данных с использованием языка Python и фреймворка Spark, она знакомит с моделью программирования Spark и основами системы с открытым исходным кодом PySpark. Каждая глава описывает отдельный аспект анализа данных, показаны основы обработки данных в PySpark и Python на примере очистки данных, подробно освещается машинное обучение с помощью Spark. Книга поможет читателю понять, как устроен и работает весь конвейер PySpark для комплексной аналитики больших наборов данных: от создания и оценки моделей до очистки, предварительной обработки и исследования данных с особым акцентом на производственные приложения. Отдельные главы посвящены обработке изображений и библиотеке Spark NLP.
- БХВ-Петербург
- 2022 г.
- 9785977517706
Материалы
Отзывы
Раз в месяц дарим подарки самому активному читателю.Оставляйте больше отзывов, и мы наградим вас!
Цитаты
Вы можете первыми опубликовать цитату
Где найти
-
349,00 ₽