URL-Codierung

Definition - Was bedeutet URL-Codierung?

Die URL-Codierung ist ein Mechanismus zum Übersetzen von nicht druckbaren oder Sonderzeichen in ein allgemein akzeptiertes Format von Webservern und Browsern. Die Codierung von Informationen kann auf URNs (Uniform Resource Names), URIs (Uniform Resource Identifiers) und URLs (Uniform Resource Locators) angewendet werden, und ausgewählte Zeichen in der URL werden durch ein oder mehrere Zeichentripletts ersetzt, die aus dem Prozentzeichen und zwei bestehen hexadezimale Ziffern. Die hexadezimalen Ziffern in den Zeichentripletts repräsentieren den numerischen Wert der Zeichen, die ersetzt werden. Die URL-Codierung wird häufig bei der Übermittlung von HTML-Formulardaten in HTTP-Anforderungen verwendet.

Die URL-Codierung wird auch als Prozentcodierung bezeichnet.

Technische.me erklärt die URL-Codierung

Gemäß RFC 3986 müssen in einer URL gefundene Zeichen in dem definierten Satz reservierter und nicht reservierter ASCII-Zeichen vorhanden sein. Die URL-Codierung ermöglicht jedoch die Darstellung von Zeichen, die ansonsten nicht mit Hilfe zulässiger Zeichen dargestellt werden könnten. Die URL-Codierung wird hauptsächlich für Nicht-ASCII-Steuerzeichen verwendet - Zeichen jenseits des ASCII-Zeichensatzes von 128 Zeichen und reservierte Zeichen wie Semikolon, Gleichheitszeichen, Leerzeichen oder Caret.

Bei der URL-Codierung wird normalerweise ein zweistufiger Prozess durchgeführt, der aus der Konvertierung der Zeichenfolge in eine Byte-Sequenz mit UTF-8-Codierung und der Konvertierung jedes Bytes, das kein ASCII-Zeichen ist, in "% HH" besteht HH ist die entsprechende hexadezimale Darstellung des ersetzten Bytes. Die URL-Codierung kann bei der Konvertierung von Nicht-ASCII-Zeichen in ein Format hilfreich sein, das über das Internet übertragen werden kann.