Zaawansowana analiza danych w PySpark
praca zbiorowa
Wydawnictwo: Helion
Wysyłamy: W ciągu 48h + czas dostawy
Cena normalna: 69.00 zł
Cena promocyjna: 56.92 zł
Oszczędzasz: zł (-18%)
Najniższa cena z ostatnich 30 dni
przed wprowadzeniem obniżki: 54.21 zł
- bony o wartości do 50 zł na kolejne zakupy
- zakładkę do książki
- aromatyczną herbatę
- Paczkomaty InPost 12.90 zł
- Odbiór paczki w punkcie 12.90 zł
- Orlen Paczka 9.90 zł
- Kurier Pocztex 14.90 zł
- Kurier InPost 13.90 zł
- Kurier DPD 15.90 zł
- Kurier DPD 39.90 zł
- Kurier DPD 49.90 zł
- Kurier DPD 69.90 zł
- Kurier DPD 79.90 zł
- Kurier DPD 119.90 zł
- Kurier DPD 89.90 zł
- Wysyłka zagraniczna od 39,90 zł
Darmowa dostawa od 199 zł
Potrzeby w zakresie analizy dużych zbiorów danych i wyciągania z nich użytecznych informacji stale rosną. Spośród dostępnych narzędzi przeznaczonych do tych zastosowań szczególnie przydatny jest PySpark - interfejs API systemu Spark dla języka Python. Apache Spark świetnie się nadaje do analizy dużych zbiorów danych, a PySpark skutecznie ułatwia integrację Sparka ze specjalistycznymi narzędziami PyData. By jednak można było w pełni skorzystać z tych możliwości, konieczne jest zrozumienie interakcji między algorytmami, zbiorami danych i wzorcami używanymi w analizie danych.
Oto praktyczny przewodnik po wersji 3.0 systemu Spark, metodach statystycznych i rzeczywistych zbiorach danych. Omówiono w nim zasady rozwiązywania problemów analitycznych za pomocą interfejsu PySpark, z wykorzystaniem dobrych praktyk programowania w systemie Spark. Po lekturze można bezproblemowo zagłębić się we wzorce analityczne oparte na popularnych technikach przetwarzania danych, takich jak klasyfikacja, grupowanie, filtrowanie i wykrywanie anomalii, stosowane w genomice, bezpieczeństwie systemów IT i finansach. Dodatkowym plusem są opisy wykorzystania przetwarzania obrazów i języka naturalnego. Zaletą jest też szereg rzeczywistych przykładów dużych zbiorów danych i ich zaawansowanej analizy.
Dzięki książce poznasz:
model programowania w ekosystemie Spark
podstawowe metody stosowane w nauce o danych
pełne implementacje analiz dużych publicznych zbiorów danych
konkretne przypadki użycia narzędzi uczenia maszynowego
kod, który łatwo dostosujesz do swoich potrzeb
PySpark: systemowa odpowiedź na problemy inżyniera danych!
- Tytuł
- Zaawansowana analiza danych w PySpark
- Autor
- praca zbiorowa
- Wydawnictwo
- Helion
- EAN
- 9788383220697
- ISBN
- 9788383220697
- Kategoria
- Literatura, Informatyka
- Liczba stron
- 192
- Rok wydania
- 2023
- Oprawa
- broszurowa
Kod producenta: 9788383220697
Stan produktu: nowy
Ten produkt nie ma jeszcze opinii
Twoja opinia
aby wystawić opinię.