Spark błyskawiczna analiza danych

Apache Spark jest oprogramowaniem open source, przeznaczonym do klastrowego przetwarzania danych dostarczanych w różnych formatach. Pozwala na uzyskanie niespotykanej wydajności, umożliwia też pracę w trybie wsadowym i strumieniowym. Framework ten jest również świetnie przygotowany do uruchamiania z...

Full description

Bibliographic Details
Main Authors: Damji, Jules S., Wenig, Brooke (Author), Das, Tathagata (Author), Lee, Denny (Author)
Format: eBook
Language:Polish
Published: Gliwice Helion 2023
Edition:Wydanie II.
Subjects:
Online Access:
Collection: O'Reilly - Collection details see MPG.ReNa
LEADER 02887nmm a2200421 u 4500
001 EB002166690
003 EBX01000000000000001305705
005 00000000000000.0
007 cr|||||||||||||||||||||
008 230704 ||| pol
020 |a 9788328399150 
050 4 |a QA76.9.D343 
100 1 |a Damji, Jules S. 
130 0 |a Learning spark 
245 0 0 |a Spark  |b błyskawiczna analiza danych  |c Jules S. Damji, Brooke Wenig, Tathagata Das, Denny Lee ; przekład, Robert Górczyński 
250 |a Wydanie II. 
260 |a Gliwice  |b Helion  |c 2023 
300 |a 360 pages  |b illustrations 
653 |a Data mining / Computer programs 
653 |a Machine learning / http://id.loc.gov/authorities/subjects/sh85079324 
653 |a Big data / http://id.loc.gov/authorities/subjects/sh2012003227 
653 |a Spark (Electronic resource : Apache Software Foundation) / http://id.loc.gov/authorities/names/no2015027445 
653 |a Données volumineuses 
653 |a Exploration de données (Informatique) / Logiciels 
653 |a Spark (Electronic resource : Apache Software Foundation) / fast / (OCoLC)fst01938143 
653 |a Apprentissage automatique 
653 |a Big data / fast / (OCoLC)fst01892965 
653 |a Machine learning / fast / (OCoLC)fst01004795 
700 1 |a Wenig, Brooke  |e author 
700 1 |a Das, Tathagata  |e author 
700 1 |a Lee, Denny  |e author 
041 0 7 |a pol  |2 ISO 639-2 
989 |b OREILLY  |a O'Reilly 
776 |z 9788328399150 
776 |z 8328399156 
856 4 0 |u https://learning.oreilly.com/library/view/~/9788328399150/?ar  |x Verlag  |3 Volltext 
082 0 |a 006.3/12 
520 |a Apache Spark jest oprogramowaniem open source, przeznaczonym do klastrowego przetwarzania danych dostarczanych w różnych formatach. Pozwala na uzyskanie niespotykanej wydajności, umożliwia też pracę w trybie wsadowym i strumieniowym. Framework ten jest również świetnie przygotowany do uruchamiania złożonych aplikacji, włączając w to algorytmy uczenia maszynowego czy analizy predykcyjnej. To wszystko sprawia, że Apache Spark stanowi znakomity wybór dla programistów zajmujących się big data, a także eksploracją i analizą danych. To książka przeznaczona dla inżynierów danych i programistów, którzy chcą za pomocą Sparka przeprowadzać skomplikowane analizy danych i korzystać z algorytmów uczenia maszynowego, nawet jeśli te dane pochodzą z różnych źródeł. Wyjaśniono tu, jak dzięki Apache Spark można odczytywać i ujednolicać duże zbiory informacji, aby powstawały niezawodne jeziora danych, w jaki sposób wykonuje się interaktywne zapytania SQL, a także jak tworzy się potoki przy użyciu MLlib i wdraża modele za pomocą biblioteki MLflow. Omówiono również współdziałanie aplikacji Sparka z jego rozproszonymi komponentami i tryby jej wdrażania w poszczególnych środowiskach