Erfahren Sie, was ein Histogramm ist, wann Sie es zur visuellen Darstellung Ihrer Daten wählen sollten und wie Sie selbst ein Histogramm erstellen können.
Read in English (Auf Englisch lessen).
Histogramme sind aussagekräftige grafische Darstellungen, mit denen sich die Häufigkeitsverteilung von Daten anzeigen lässt. Histogramme erleichtern die Darstellung großer Datenmengen in einem einfachen Modell und eignen sich daher hervorragend, wenn Sie einem breiten Publikum die Verteilung und die Muster Ihrer Daten vermitteln möchten. Im Folgenden werden wir dieses Datenvisualisierungstool genauer untersuchen, einschließlich der Frage, wann Sie es verwenden sollten, wie Sie Histogramme analysieren und wie Sie ein Histogramm mit Ihren eigenen Daten erstellen können.
Im Kern stellt ein Histogramm einen Datensatz dar, indem es die Daten in Bereiche unterteilt und dann die Anzahl der Daten in jedem dieser Bereiche oder "Bins" darstellt. Diese Bins fungieren im Wesentlichen als Container, und das resultierende Histogramm zeigt an, wie viele Datenpunkte durch die Höhe des Bins in jedes Bin fallen.
Die Wahl eines Histogramms ist ebenso wichtig wie die Erstellung eines Histogramms. Die visuelle Darstellung Ihrer Daten kann ein leistungsfähiges Instrument sein, um Ihre Erkenntnisse einem breiten Publikum zu vermitteln, Ihre Annahmen zu bestätigen und auf der Grundlage Ihrer Analyse neue Erkenntnisse zu gewinnen. Wenn Sie wissen, wie Sie die richtige Art der Visualisierung auswählen, können Sie sicherstellen, dass Sie erfolgreich sind und während Ihres Analyseprozesses die richtigen Entscheidungen treffen. Für die folgenden Szenarien könnten Sie sich für die Verwendung eines Histogramms entscheiden.
Histogramme bieten einen leicht zu erkennenden Einblick in die Form Ihrer Daten und etwaige Anomalien. Sie helfen Ihnen zu verstehen, wie Sie die Datenwerte auf die Bins verteilen sollten. Verwenden Sie Histogramme, um Einblicke in die Form Ihrer Daten zu gewinnen, Ausreißer zu identifizieren und die Verteilung zu untersuchen.
Wenn Sie mehrere Datensätze oder -gruppen vergleichen möchten, bieten Histogramme ein visuelles Mittel, um deren Verteilungen nebeneinander zu betrachten. Sie ermöglichen schnelle Vergleiche und helfen, Abweichungen oder Ähnlichkeiten zwischen Gruppen zu erkennen.
Wenn Sie Daten und Erkenntnisse einem nicht-technischen Publikum oder Interessengruppen präsentieren müssen, bieten Histogramme eine benutzerfreundliche Möglichkeit, Informationen über Datenverteilungen und -muster zu vermitteln. Wenn Sie z. B. darstellen möchten, wann ein bestimmter Veranstaltungsort am stärksten frequentiert ist, kann ein Histogramm auf leicht verständliche Weise zeigen, wann die höchste Besucherzahl an einem bestimmten Ort herrscht.
Bei der Analyse eines Histogramms sollten Sie auf einige wichtige Merkmale achten. Die folgenden Metriken helfen Ihnen, Ihren Datensatz besser zu verstehen.
Form der Verteilung: Anhand der Form des Histogramms können Sie wichtige Erkenntnisse über die Daten gewinnen. Zu den üblichen Formen gehören symmetrische (glockenförmige oder normale), schiefe (links oder rechts), multimodale (mehrere Spitzen) und gleichmäßige Verteilungen.
Zentrale Tendenz: Sie können die zentrale Tendenz der Daten verstehen, indem Sie sich den zentralen Peak und die Konzentration der Balken im Histogramm ansehen. Beide entsprechen oft dem Mittelwert, dem Median und dem Modus.
Streuung: Aus der Breite der Verteilung können Sie auf die Streuung oder Variabilität der Daten schließen. Wenn Ihr Histogramm breiter ist, zeigt dies eine größere Variabilität in Ihren Daten. Umgekehrt bedeutet eine geringere Streuung eine geringere Variabilität.
Ausreißer: Sie können ungewöhnliche Datenpunkte, so genannte Ausreißer, als alle Werte identifizieren, die außerhalb des typischen Bereichs des Histogramms liegen.
Wie jedes Werkzeug haben auch Histogramme Vor- und Nachteile, die Ihnen bei der Entscheidung helfen können, ob sie unter verschiedenen Umständen das geeignete Visualisierungswerkzeug sind.
Die Verwendung von Histogrammen für Ihren Datenbedarf hat mehrere Vorteile. Einige dieser Vorteile werden häufig genannt:
Einfache Darstellung großer Datenmengen: Histogramme fassen Daten in "Bins" zusammen, wodurch große Datenmengen in ein leicht verständliches Bild umgewandelt werden können.
Einfach zu konstruieren: Histogramme sind benutzerfreundlich und ermöglichen es Personen mit unterschiedlichen statistischen Kenntnissen, die Informationen zu verstehen.
Einfaches Erforschen von Daten: Histogramme sind ein wertvolles Instrument für die Untersuchung von Daten und die Gewinnung von Erkenntnissen aus ihnen, was bei Hypothesentests und der Entscheidungsfindung hilfreich sein kann.
Während ihre Einfachheit für die einen ein Vorteil ist, kann sie für andere ein Nachteil sein. Wenn Sie entscheiden, ob Histogramme für Ihre Bedürfnisse geeignet sind, sollten Sie diese Nachteile berücksichtigen:
Subjektiv: Das Aussehen eines Histogramms kann je nach gewählter Bin-Breite variieren, was zu einer subjektiven Interpretation der Daten führen kann.
Vereinfachend: Histogramme bieten zwar einen wertvollen Überblick über die Datenverteilung, erfassen aber möglicherweise keine komplexeren Beziehungen zwischen Variablen oder Verteilungen, die nicht leicht zu kategorisieren sind.
Daten auf Gruppenebene: Histogramme gruppieren Daten in Bereiche, sodass sie normalerweise keine Daten auf individueller Ebene liefern.
Die Erstellung eines Histogramms für Ihre Daten ist unkompliziert, wenn Sie wissen, wie es geht. Üben Sie zunächst mit einfachen Daten, um zu verstehen, wie die Visualisierung funktioniert. Gehen Sie dabei wie folgt vor:
Ihr Datensatz kann eine Vielzahl von Variablen enthalten, z. B. Prüfungsergebnisse, Temperaturmesswerte oder Produktpreise. Zu Übungszwecken können Sie Ihren eigenen Datensatz erstellen oder Online-Metriken verwenden. Sobald Sie Ihre Daten haben, ordnen Sie sie in absteigender oder aufsteigender Reihenfolge.
Dieser Bereich dient als Grundlage für die Definition der Grenzen für die Bins Ihres Histogramms. Beschriften Sie die Achsen Ihres Histogramms mit der interessierenden Variable (z. B. Prüfungsergebnisse oder Temperatur) auf einer Achse und mit Zahlen zur Darstellung der Anzahl auf der anderen Achse.
Wählen Sie anschließend eine geeignete Bin-Breite oder Intervallgröße. Die Auswahl der Bin-Breite muss gut überlegt sein, da sie die Interpretation der Daten beeinflusst. Kleinere Bin-Breiten liefern feinere Details, während größere Bin-Breiten einen breiteren Überblick über die Datenverteilung geben.
Sobald Sie Ihre Bin-Breite festgelegt haben, zählen Sie, wie viele Datenpunkte Sie in jede Bin aufnehmen sollten. Auf diese Weise können Sie die Datenwerte in die entsprechenden Felder einteilen und die Häufigkeit für jedes Feld ermitteln.
Zeichnen Sie für jedes Bin einen Balken auf einer horizontalen oder vertikalen Achse. Die Breite jedes Balkens stellt die Breite des Bereichs dar, während die Höhe des Balkens die Anzahl der Werte angibt, die in den Bereich des Bereichs fallen.
• Datenbank-Administrator
• Salesforce-Administrator
• Projektplan
• Computergrafik
• Betriebssystem
Sie können sich mit spannenden Kursen auf Coursera weiter über Datenvisualisierung informieren. Anfängern helfen Kurse wie Spezialisierung Datenvisualisierung & Dashboarding mit R oder Datenvisualisierung mit erweitertem Excel dabei, komplexere Möglichkeiten der Datenvisualisierung zu erkunden, während Sie in Ihrem eigenen Tempo lernen.
Redaktion
Das Redaktionsteam von Coursera besteht aus äußerst erfahrenen professionellen Redakteuren, Autoren ...
Diese Inhalte dienen nur zu Informationszwecken. Den Lernenden wird empfohlen, eingehender zu recherchieren, ob Kurse und andere angestrebte Qualifikationen wirklich ihren persönlichen, beruflichen und finanziellen Vorstellungen entsprechen.