Statistischer Mittelwert

Definition - Was bedeutet statistischer Mittelwert?

Der statistische Mittelwert ist eine bestimmte Art von mathematischem Durchschnitt, der in der Informatik und insbesondere beim maschinellen Lernen sehr nützlich ist.

Einfach ausgedrückt ist der statistische Mittelwert ein arithmetischer Mittelwertprozess, bei dem alle Zahlen in einem Datensatz addiert und dann die Summe durch die Anzahl der Datenpunkte dividiert wird.

Das ist einfach und unkompliziert, und so wurde das arithmetische Mittel oder statistische Mittel in der Neuzeit und im Zeitalter der Computerprogrammierung weit verbreitet verwendet.

Hier können wir den statistischen Mittelwert von zwei anderen Arten von Mitteln unterscheiden, die eine Gruppe von drei statistischen Methoden bilden, die als pythagoreische Mittel bezeichnet werden. Die anderen beiden Mittel werden harmonische und geometrische Mittel genannt.

Alle drei können beim maschinellen Lernen und bei neuen Arten der Entwicklung von Algorithmen für künstliche Intelligenz nützlich sein.

Technische.me erklärt den statistischen Mittelwert

Im Allgemeinen ist das statistische Mittel bei allen Arten von Klassifizierungs- und Entscheidungshilfeaufgaben für maschinelles Lernen hilfreich.

Stellen Sie sich das so vor: Das Programm zeichnet alle Datenpunkte auf und verwendet dann das statistische Mittel, um einen Durchschnitt zu ermitteln, mit dessen Hilfe der Computer durch seine maschinellen Lernprozesse lernen kann.

Das etwas komplexere harmonische Mittel und das geometrische Mittel können auch beim maschinellen Lernen für bestimmte Dinge verwendet werden.

Beispielsweise wird das harmonische Mittel häufig verwendet, um einen "F-Score" abzuleiten, mit dessen Hilfe der Datenabruf in einem bestimmten System bewertet werden kann.

Wenn Sie zum statistischen Mittelwert zurückkehren, nehmen Sie an, Sie haben fünf Datenpunkte und die Summe ist 25. Ihr statistischer Mittelwert wäre fünf, aber Sie sind sich nicht ganz sicher, was jede dieser fünf Zahlen ist. Sie könnten drei haben, zwei und zwanzig - oder Sie könnten perfekt symmetrische fünf Fünfer haben.

Sie haben einen Datensatz wie das erste oben erwähnte Beispiel, bei dem der statistische Mittelwert etwas schief ist. Möglicherweise haben Sie einen Datensatz mit den folgenden fünf Zahlen - zwei, drei, sechs, sieben und 38.

Die Summe beträgt 56, aber nur eine dieser Zahlen liegt über dem statistischen Mittelwert, was ein wenig täuscht.

Hier sprechen Ingenieure für maschinelles Lernen über Voreingenommenheit und darüber, wie verschiedene Arten von Mitteln und Durchschnittswerten Voreingenommenheit in einem Programm für maschinelles Lernen zeigen können.

Ohne zu komplex zu werden, können Ingenieure diese Art von Verzerrung berücksichtigen, indem sie Algorithmen noch ausgefeilter machen und Klassifizierungsdaten erraten oder überprüfen oder neu bewerten.

Das Zufallswaldmodell ist eine solche Technik, bei der anstelle eines einzelnen Datensatzes verschiedene Systeme, die als einzelne „Bäume“ bezeichnet werden, eine Reihe von Datensätzen erfassen und die Ergebnisse gemeinsam tabellieren.

Das Fazit ist, dass das statistische Mittel als Grundtyp des arithmetischen Mittels sehr nützlich ist, um die Vereinfachungen bereitzustellen, auf denen Algorithmen für maschinelles Lernen ausgeführt werden.

Wenn Sie ein Scattershot-Diagramm mit Daten haben und diese wie so viele Business-Dashboards in leicht verdauliche Erkenntnisse filtern möchten, ist der statistische Mittelwert eine hervorragende Möglichkeit, dies zu erleichtern.

Viele der zusätzlichen Details zu statistischen Mitteln und anderen Durchschnittswerten werden häufig von professionellen Mathematikern und Algorithmusingenieuren überarbeitet.

Ein arithmetisches Mittel wird unter Verwendung der folgenden Gleichung berechnet: