Bayes’scher Filter

Definition - Was bedeutet Bayesian Filter?

Ein Bayes'scher Filter ist ein Computerprogramm, das Bayes'sche Logik oder Bayes'sche Analyse verwendet, die synonym sind. Es wird verwendet, um den Header und den Inhalt von E-Mail-Nachrichten auszuwerten und festzustellen, ob es sich um unerwünschte Spam-E-Mails oder um das elektronische Äquivalent von Bulk-Mail oder Junk-Mail handelt. Ein Bayes'scher Filter wird am besten zusammen mit Antivirenprogrammen verwendet.

Technische.me erklärt Bayesian Filter

Ein Bayes'scher Filter arbeitet mit Wahrscheinlichkeiten bestimmter Wörter, die in der Kopfzeile oder im Inhalt einer E-Mail erscheinen. Bestimmte Wörter weisen auf eine hohe Wahrscheinlichkeit hin, dass es sich bei der E-Mail um Spam handelt, z. B. Viagra und Refinanzierung. Der Filter beginnt nicht damit, die Wahrscheinlichkeit zu kennen, dass ein Wort eine hohe Wahrscheinlichkeit für Spam anzeigt. Benutzer müssen die E-Mail manuell als Spam identifizieren. Wenn genügend Vorkommen des Wortes gefunden wurden und die E-Mail als Spam identifiziert wurde, „lernt“ der Bayes'sche Filter, das Wort mithilfe von Wahrscheinlichkeitsfunktionen zu identifizieren. Das Gleiche gilt für viele andere Wörter und Sätze. Mit der Zeit wird der Bayes'sche Filter immer effektiver bei der Identifizierung von Spam für einen bestimmten Benutzer. Wenn die Wahrscheinlichkeit einen bestimmten Schwellenwert erreicht, z. B. 95 Prozent, wird die E-Mail als Spam identifiziert und häufig in einen Junk-Ordner verschoben (oder manchmal sogar automatisch gelöscht). Der Benutzer kann es regelmäßig anzeigen und entscheiden, ob es gelöscht werden soll oder nicht. Alternativ wird es von einigen Spam-Programmen an einen Quarantänespeicherort verschoben, an dem Benutzer die E-Mail anzeigen und die Entscheidung der Software überprüfen können.

Das anfängliche „Training“ kann häufig verfeinert werden, um falsch positive oder falsch negative Ergebnisse zu reduzieren, wenn falsche Urteile gefunden werden. Dadurch kann sich der Bayes'sche Filter der Software an die sich ständig weiterentwickelnde Natur von Spam anpassen.

Einige Spamfilter verwenden neben dem Bayes'schen Filter auch Heuristiken. Vordefinierte Regeln werden vom Benutzer eingerichtet, um die Genauigkeit der Identifizierung von E-Mails als Spam weiter zu erhöhen. Diese Regeln können die Anzahl der Vorkommen eines bestimmten Wortes beinhalten, neutrale Wörter wie "das", "a" oder "einige" eliminieren oder ignorieren oder Folgen von Werken wie "Viagra ist gut für" identifizieren, anstatt eine Wahrscheinlichkeit anzuwenden Funktion auf alle vier einzelnen Wörter.

Spammer können eine als Bayes'sche Vergiftung bezeichnete Technik verwenden, um die Wirksamkeit von Spamfiltern mithilfe der Bayes'schen Filterung zu beeinträchtigen. Einige Techniken umfassen das Einfügen von legitimem Text aus Nachrichten oder literarischen Quellen, die Verwendung zufälliger harmloser Wörter, die selten in Spam vorkommen, oder sogar das Ersetzen von Text durch Bilder.

Viele E-Mail-Clients deaktivieren die Anzeige von Bildern aus Sicherheitsgründen. Somit kann der Spam weniger Empfänger erreichen.

Ein Bayes'scher Filter unter Verwendung der Bayes'schen Logik kann verwendet werden, um jede Art von Daten zu klassifizieren. Medizin, Wissenschaft und Technik haben alle Verwendung gefunden. Interessanterweise haben wissenschaftliche Forscher spekuliert, dass sogar das menschliche Gehirn die Bayes'sche Logikmethode verwenden könnte, um Reize zu klassifizieren und spezifische Reaktionsverhalten zu bestimmen.