Data-Science-Crashkurs Eine interaktive und praktische Einführung

Dieses Buch bietet einen praxisnahen Einstieg in Data Science, angereichert mit interaktiven Elementen, der die Breite der Mg̲lichkeiten der Datenanalyse aufzeigt und tief genug geht, um Vorteile, Nachteile und Risiken zu verstehen, aber dennoch nicht zu tief in die zugrunde liegende Mathematik eins...

Full description

Bibliographic Details
Main Author: Herbold, Steffen
Format: eBook
Language:German
Published: Heidelberg Dpunkt.verlag 2022
Subjects:
Online Access:
Collection: O'Reilly - Collection details see MPG.ReNa
Table of Contents:
  • 2 Der Prozess von Data-Science-Projekten
  • Abb. 2-1 Beziehung von Menschen, Techniken und Prozessen
  • 2.1 Der generische Data-Science-Prozess
  • Abb. 2-2 Überblick über den generellen Prozess von Data-Science-Projekten
  • 2.1.1 Discovery
  • 2.1.2 Datenvorbereitung
  • 2.1.3 Modellplanung
  • Abb. 2-3 Vergleich der Güte zweier fiktiver Modelle, bezogen auf die Datengröße
  • 2.1.4 Modellerstellung
  • 2.1.5 Kommunikation der Ergebnisse
  • 2.1.6 Operationalisierung
  • 2.2 Rollen in Data-Science-Projekten
  • 2.2.1 Anwenderin
  • 2.2.2 Projektsponsorin
  • 2.2.3 Projektmanagerin
  • 2.2.4 Dateningenieurin
  • Intro
  • Inhaltsverzeichnis
  • Vorwort
  • Inhaltsübersicht
  • Inhaltsverzeichnis
  • 1 Big Data und Data Science
  • 1.1 Einführung in Big Data
  • 1.1.1 Volumen
  • Abb. 1-1 Wachstum des Datenvolumens im Internetverkehr
  • 1.1.2 Velocity/Geschwindigkeit
  • 1.1.3 Variety/Vielfalt
  • Abb. 1-2 Datenpyramide
  • 1.1.4 Innovative Informationsverarbeitungsmethoden
  • 1.1.5 Wissen generieren, Entscheidungen treffen, Prozesse automatisieren
  • 1.1.6 Noch mehr Vs
  • 1.2 Einführung in Data Science
  • 1.2.1 Was gehört zu Data Science?
  • 1.2.2 Beispielanwendungen
  • 1.3 Fähigkeiten von Data Scientists
  • 2.2.5 Datenbankadministratorin
  • 2.2.6 Data Scientist
  • 2.3 Deliverables
  • 2.3.1 Sponsorenpräsentation
  • 2.3.2 Analystenpräsentation
  • 2.3.3 Quelltext
  • 2.3.4 Technische Spezifikation
  • 2.3.5 Daten
  • 3 Allgemeines zur Datenanalyse
  • 3.1 Das No-free-Lunch-Theorem
  • 3.2 Definition von maschinellem Lernen
  • 3.3 Merkmale
  • Abb. 3-1 Bild von einem Wal
  • Tab. 3-1 Skalen für Merkmale
  • 3.4 Trainings- und Testdaten
  • Tab. 3-2 Beispiel für Instanzen von Objekten mit ihren Merkmalen
  • 4.3.1 Anscombes Quartett
  • Tab. 4-1 Anscombes Quartett
  • 4.3.2 Einzelne Merkmale
  • 4.3.3 Beziehungen zwischen Merkmalen
  • 4.3.4 Scatterplots für hochdimensionale Daten
  • 4.3.5 Zeitliche Trends
  • 4.4 Übung
  • Deskriptive Statistiken
  • Visualisierungen einzelner Merkmale
  • Paarweise Beziehungen
  • 5 Assoziationsregeln
  • Abb. 5-1 Warenkörbe als Beispiel für Assoziationen
  • Abb. 5-2 Konzept der Assoziationsanalyse
  • 5.1 Der Apriori-Algorithmus
  • 5.1.1 Support und Frequent Itemsets
  • 5.1.2 Ableiten von Regeln
  • 5.1.3 Confidence, Lift und Leverage
  • 5.1.4 Exponentielles Wachstum
  • Tab. 3-3 Beispiel für Instanzen von Objekten mit ihren Merkmalen und Werten von Interesse. Diese werden häufig auch als Label bezeichnet.
  • Abb. 3-2 Verwendung von Daten zur Kreuzvalidierung
  • 3.5 Kategorien von Algorithmen
  • 3.6 Übung
  • Laden von CSV-Daten
  • Entfernen von Merkmalen
  • Entfernen von Instanzen mit fehlenden Werten
  • Rechnen mit Dataframes
  • Zusammenfügen von Dataframes
  • Auswahl von Teilmengen
  • 4 Erkunden der Daten
  • 4.1 Texteditoren und die Kommandozeile
  • 4.2 Deskriptive Statistik
  • 4.2.1 Lagemaße
  • 4.2.2 Variabilität
  • 4.2.3 Datenbereich
  • 4.3 Visualisierung