Was ist ein Histogramm?

Geschrieben von Coursera Staff • Aktualisiert am

Erfahren Sie, was ein Histogramm ist, wann Sie es zur visuellen Darstellung Ihrer Daten wählen sollten und wie Sie selbst ein Histogramm erstellen können.

[Hauptbild] Ein Datenanalyst steht vor seinem Arbeitsplatz, hinter ihm wird ein Histogramm auf dem Computermonitor angezeigt.

Read in English (Auf Englisch lessen).

Histogramme sind aussagekräftige grafische Darstellungen, mit denen sich die Häufigkeitsverteilung von Daten anzeigen lässt. Histogramme erleichtern die Darstellung großer Datenmengen in einem einfachen Modell und eignen sich daher hervorragend, wenn Sie einem breiten Publikum die Verteilung und die Muster Ihrer Daten vermitteln möchten. Im Folgenden werden wir dieses Datenvisualisierungstool genauer untersuchen, einschließlich der Frage, wann Sie es verwenden sollten, wie Sie Histogramme analysieren und wie Sie ein Histogramm mit Ihren eigenen Daten erstellen können.

Wann sollte man ein Histogramm verwenden?

Im Kern stellt ein Histogramm einen Datensatz dar, indem es die Daten in Bereiche unterteilt und dann die Anzahl der Daten in jedem dieser Bereiche oder "Bins" darstellt. Diese Bins fungieren im Wesentlichen als Container, und das resultierende Histogramm zeigt an, wie viele Datenpunkte durch die Höhe des Bins in jedes Bin fallen. 

Die Wahl eines Histogramms ist ebenso wichtig wie die Erstellung eines Histogramms. Die visuelle Darstellung Ihrer Daten kann ein leistungsfähiges Instrument sein, um Ihre Erkenntnisse einem breiten Publikum zu vermitteln, Ihre Annahmen zu bestätigen und auf der Grundlage Ihrer Analyse neue Erkenntnisse zu gewinnen. Wenn Sie wissen, wie Sie die richtige Art der Visualisierung auswählen, können Sie sicherstellen, dass Sie erfolgreich sind und während Ihres Analyseprozesses die richtigen Entscheidungen treffen. Für die folgenden Szenarien könnten Sie sich für die Verwendung eines Histogramms entscheiden.

Sie möchten sich die Verteilung Ihrer Daten ansehen

Histogramme bieten einen leicht zu erkennenden Einblick in die Form Ihrer Daten und etwaige Anomalien. Sie helfen Ihnen zu verstehen, wie Sie die Datenwerte auf die Bins verteilen sollten. Verwenden Sie Histogramme, um Einblicke in die Form Ihrer Daten zu gewinnen, Ausreißer zu identifizieren und die Verteilung zu untersuchen.

Sie möchten Datensätze vergleichen

Wenn Sie mehrere Datensätze oder -gruppen vergleichen möchten, bieten Histogramme ein visuelles Mittel, um deren Verteilungen nebeneinander zu betrachten. Sie ermöglichen schnelle Vergleiche und helfen, Abweichungen oder Ähnlichkeiten zwischen Gruppen zu erkennen.

Sie möchten Ihre Erkenntnisse einem allgemeinen Publikum vermitteln

Wenn Sie Daten und Erkenntnisse einem nicht-technischen Publikum oder Interessengruppen präsentieren müssen, bieten Histogramme eine benutzerfreundliche Möglichkeit, Informationen über Datenverteilungen und -muster zu vermitteln. Wenn Sie z. B. darstellen möchten, wann ein bestimmter Veranstaltungsort am stärksten frequentiert ist, kann ein Histogramm auf leicht verständliche Weise zeigen, wann die höchste Besucherzahl an einem bestimmten Ort herrscht.

Wie analysiert man ein Histogramm?

Bei der Analyse eines Histogramms sollten Sie auf einige wichtige Merkmale achten. Die folgenden Metriken helfen Ihnen, Ihren Datensatz besser zu verstehen.

  • Form der Verteilung: Anhand der Form des Histogramms können Sie wichtige Erkenntnisse über die Daten gewinnen. Zu den üblichen Formen gehören symmetrische (glockenförmige oder normale), schiefe (links oder rechts), multimodale (mehrere Spitzen) und gleichmäßige Verteilungen.

  • Zentrale Tendenz: Sie können die zentrale Tendenz der Daten verstehen, indem Sie sich den zentralen Peak und die Konzentration der Balken im Histogramm ansehen. Beide entsprechen oft dem Mittelwert, dem Median und dem Modus.

  • Streuung: Aus der Breite der Verteilung können Sie auf die Streuung oder Variabilität der Daten schließen. Wenn Ihr Histogramm breiter ist, zeigt dies eine größere Variabilität in Ihren Daten. Umgekehrt bedeutet eine geringere Streuung eine geringere Variabilität.

  • Ausreißer: Sie können ungewöhnliche Datenpunkte, so genannte Ausreißer, als alle Werte identifizieren, die außerhalb des typischen Bereichs des Histogramms liegen.

Vor- und Nachteile der Verwendung von Histogrammen

Wie jedes Werkzeug haben auch Histogramme Vor- und Nachteile, die Ihnen bei der Entscheidung helfen können, ob sie unter verschiedenen Umständen das geeignete Visualisierungswerkzeug sind. 

Vorteile von Histogrammen

Die Verwendung von Histogrammen für Ihren Datenbedarf hat mehrere Vorteile. Einige dieser Vorteile werden häufig genannt:

  • Einfache Darstellung großer Datenmengen: Histogramme fassen Daten in "Bins" zusammen, wodurch große Datenmengen in ein leicht verständliches Bild umgewandelt werden können. 

  • Einfach zu konstruieren: Histogramme sind benutzerfreundlich und ermöglichen es Personen mit unterschiedlichen statistischen Kenntnissen, die Informationen zu verstehen. 

  • Einfaches Erforschen von Daten: Histogramme sind ein wertvolles Instrument für die Untersuchung von Daten und die Gewinnung von Erkenntnissen aus ihnen, was bei Hypothesentests und der Entscheidungsfindung hilfreich sein kann.

Nachteile von Histogrammen

Während ihre Einfachheit für die einen ein Vorteil ist, kann sie für andere ein Nachteil sein. Wenn Sie entscheiden, ob Histogramme für Ihre Bedürfnisse geeignet sind, sollten Sie diese Nachteile berücksichtigen:

  • Subjektiv: Das Aussehen eines Histogramms kann je nach gewählter Bin-Breite variieren, was zu einer subjektiven Interpretation der Daten führen kann.

  • Vereinfachend: Histogramme bieten zwar einen wertvollen Überblick über die Datenverteilung, erfassen aber möglicherweise keine komplexeren Beziehungen zwischen Variablen oder Verteilungen, die nicht leicht zu kategorisieren sind.

  • Daten auf Gruppenebene: Histogramme gruppieren Daten in Bereiche, sodass sie normalerweise keine Daten auf individueller Ebene liefern.

Wie Sie Ihr eigenes Histogramm erstellen

Die Erstellung eines Histogramms für Ihre Daten ist unkompliziert, wenn Sie wissen, wie es geht. Üben Sie zunächst mit einfachen Daten, um zu verstehen, wie die Visualisierung funktioniert. Gehen Sie dabei wie folgt vor:

1. Sammeln und organisieren Sie den Datensatz, der Sie interessiert. 

Ihr Datensatz kann eine Vielzahl von Variablen enthalten, z. B. Prüfungsergebnisse, Temperaturmesswerte oder Produktpreise. Zu Übungszwecken können Sie Ihren eigenen Datensatz erstellen oder Online-Metriken verwenden. Sobald Sie Ihre Daten haben, ordnen Sie sie in absteigender oder aufsteigender Reihenfolge.

2. Legen Sie Ihre Achsen fest. 

Dieser Bereich dient als Grundlage für die Definition der Grenzen für die Bins Ihres Histogramms. Beschriften Sie die Achsen Ihres Histogramms mit der interessierenden Variable (z. B. Prüfungsergebnisse oder Temperatur) auf einer Achse und mit Zahlen zur Darstellung der Anzahl auf der anderen Achse. 

3. Wählen Sie Ihre Bin-Breite.

Wählen Sie anschließend eine geeignete Bin-Breite oder Intervallgröße. Die Auswahl der Bin-Breite muss gut überlegt sein, da sie die Interpretation der Daten beeinflusst. Kleinere Bin-Breiten liefern feinere Details, während größere Bin-Breiten einen breiteren Überblick über die Datenverteilung geben. 

4. Zählen Sie Ihre Datenpunkte. 

Sobald Sie Ihre Bin-Breite festgelegt haben, zählen Sie, wie viele Datenpunkte Sie in jede Bin aufnehmen sollten. Auf diese Weise können Sie die Datenwerte in die entsprechenden Felder einteilen und die Häufigkeit für jedes Feld ermitteln. 

5. Erstellen Sie Ihre Balken auf den Achsen.

Zeichnen Sie für jedes Bin einen Balken auf einer horizontalen oder vertikalen Achse. Die Breite jedes Balkens stellt die Breite des Bereichs dar, während die Höhe des Balkens die Anzahl der Werte angibt, die in den Bereich des Bereichs fallen.

Verwandte Begriffe

• Datenbank-Administrator

• Salesforce-Administrator

• Projektplan

• Computergrafik

• Betriebssystem

Platzhalter

Erfahren Sie mehr auf Coursera

Sie können sich mit spannenden Kursen auf Coursera weiter über Datenvisualisierung informieren. Anfängern helfen Kurse wie Spezialisierung Datenvisualisierung & Dashboarding mit R oder Datenvisualisierung mit erweitertem Excel dabei, komplexere Möglichkeiten der Datenvisualisierung zu erkunden, während Sie in Ihrem eigenen Tempo lernen.

Weiterlesen

Aktualisiert am
Geschrieben von:

Redaktion

Das Redaktionsteam von Coursera besteht aus äußerst erfahrenen professionellen Redakteuren, Autoren ...

Diese Inhalte dienen nur zu Informationszwecken. Den Lernenden wird empfohlen, eingehender zu recherchieren, ob Kurse und andere angestrebte Qualifikationen wirklich ihren persönlichen, beruflichen und finanziellen Vorstellungen entsprechen.