Archivübersicht | Impressum

THEMA:   ZeichenverschlŸsselung nach ISO 8859-1

 8 Antwort(en).

Johannes Michalowsky begann die Diskussion am 20.09.02 (09:49) mit folgendem Beitrag:

In der ISO Norm 8859-1 sind allen Zeichen eine Nummer zugeordnet. Diese Nummer zu kennen ist dann wichtig, wenn das zugehörige Zeichen auf der Tastatur nicht vorkommt, und das sind mehr, als man meinen sollte.

Als Beispiel diene das spanische kleine n mit Tilde: ñ

Das gebe ich hier ein mit Eingabe ALT und gleichzeitig 164 über die rechte Zifferntastatur.

Nach ISO ist dem ñ aber der numerische Wert 241 zugeordnet, und in einem html-Quellcode muß ich auch tatsächlich die 241 eingeben, um ñ angezeigt zu bekommen.

Wie ist dieser evt. nur scheinbare Widerspruch zu erklären? Unterschiedliche Interpretation eines Binärcodes, der dahinter steht?

Dazu noch die Frage: Wie kann man sich eine einfache Hilfe schaffen, um gewünschte Zeichen schnell auffinden zu können - etwa so wie die Sonderzeichensuche im Word? Merkbar sind die rund 220 Verschlüsselungen natürlich nicht! Die mnemonische Verschlüsselung - z.B. ntilde für das ñ - ist eine kleine Hilfe in dieser Richtung.

Bei dieser Gelegenheit habe ich festgestellt: Die Eingabe der 241 mit vorausgehendem &# oder ntilde mit & vorweg geht hier auch, es gibt hier also drei Alternativen für die Eingabe all dieser Zeichen!

Wahrscheinlich ist Einigen von Euch das alles bereits bekannt, ich hoffe aber, daß die Frage nicht ganz sinnlos scheint.

Internet-Tipp: https://selfhtml.teamone.de/inter/zeichensaetze.htm


Dirgni antwortete am 20.09.02 (11:29):

Hallo Jo,

ich klicke in der Zeichentabelle (habe ich in der Taskleiste stets verfügbar) auf das entsprechende Sonderzeichen - dann steht rechts unten die Zahl, die man mit Alt + eingeben kann.


Dirgni antwortete am 20.09.02 (11:31):

Ach quatsch - hab Deinen Beitrag noch mal gelesen - das wolltest Du ja gar nicht wissen.


Steini antwortete am 20.09.02 (13:10):

Hallo!

Die Antwort hierauf findet sich doch in dem Link, den du als Internet-Tipp angefügt hast:
"[...] Bei allen Zeichensätzen sind die ersten 128 Zeichen, also die Zeichen mit den Werten 0 bis 127, identisch mit dem ASCII-Zeichensatz. Das hat den Vorteil, dass die üblichen lateinischen Groß- und Kleinbuchstaben, die arabischen Ziffern und die üblichen Sonderzeichen wie Satzzeichen oder kaufmännische Zeichen in all diesen Zeichensätzen immer zur Verfügung stehen."

Somit hast du also die Erklärung, warum das ñ unterschiedlich interpretiert wird: Weil es als Steuer-Code hinter der 127 liegt.

Zu der Frage mit der einfachen Hilfe:
Man könnte sich ein Skript (beispielsweise in PHP) "selbst stricken", welches über ein Formular das umzuwandelnde Zeichen entgegennimmt und dann die Ausgabe entsprechend formatiert wieder darstellt. Der Monster-Anteil an Tipp-Arbeit macht hier die Interpretationen der Zeichen und Steuer-Codes aus - die eigentliche Funktion lässt sich allerdings in weniger als 10 Zeilen unterbringen.

Gruß,
Steini

[steini @ jung-senioren.de]


Johannes Michalowsky antwortete am 20.09.02 (14:32):

@Steini

herzlichen Dank für Deine Mühe mit einem alten Schädel, aber ich verstehe es nicht:

Lt. dem ISO-Standard hat das ñ - um bei dem Beispiel zu bleiben - den Wert 241. Warum muß ich 164 eintippen, wenn ich 241 meine, oder noch anders gefragt: Da muß es doch noch eine weitere Schlüsseltabelle geben?

Den Stefan Münz habe ich als Buch, und ich bilde mir ein, alles zu verstehen, habe mich genug in meinem Leben mit solchen Dingen herumgeschlagen, aber wieso da die Gleichung 241 = 164 gilt, das verstehe ich nicht.

Ich hätte die betreffende Tabelle gerne hier als Graphik eingefügt - eigentlich zum Glück geht das nicht. Aber man kann es ja nachgucken.


Steini antwortete am 20.09.02 (15:15):

Grüß dir, Jo!

Also, so wie ich das verstehe, verhält sich das wie folgt:
In den ISO-8859-Zeichensätzen und im ASCII-Zeichensatz sind die Werte 0 bis 127 identisch abgebildet.
Das bedeutet, dass du bei Eingabe eines Dollarzeichens im ASCII-Zeichensatz wie auch in den ISO-8859-Zeichensätzen den identischen Wert abbilden kannst - nämlich: 36 (an deiner "Gleichung" gemessen: 36 = 36).

Schaust du dir die ISO-Tabellen unter deinem angegebenen Link noch einmal an, so wirst du feststellen, dass die Werte erst bei 160 beginnen. Und zwar aus folgendem Grund:
Die Werte 0 bis 31 sind im ASCII-Zeichensatz für Steuerzeichen reserviert. Die Werte ab 32 bis 127 beinhalten die darstellbaren Zeichen. ALLE ISO-Zeichensätze beinhalten diese Werte (von 32 bis 127).

Das, was beim ASCII-Code der Wertebereich 0 bis 31 (für Steuerzeichen) darstellt, ist bei den ISO-Zeichensätzen der Wertebereich 128 bis 159. In diesem Bereich verfügen die ISO's über die Steuerzeichen. So ist es zu erklären, dass du die darstellbaren Zeichen erst ab einem Wert von 160 findest.

In den verschiedensten ISO's sind nun diese Bereiche ab 160 "frei definiert". Schaust du dir die Tabellen an, so wirst du feststellen, dass unter ISO-8859-1 (Latin-1) der Wert 193 ein anderes Zeichen darstellt als die übrigen ISO's. Je nach eingestellter Schriftart in deinem Browser wird nun dieser Wert (hier 193) unterschiedlich interpretiert. Ups, das führt jetzt zu weit...

Zurück zu deiner Frage (Zusammenfassung):
ASCII und ISO's bilden die Werte von 32 bis 127 absolut identisch ab. Erst ab dem Wert 128 variieren diese voneinander. Deswegen hast du auch verschiedene Werte für das ñ.

Hoffe, dass das einigermaßen verständlich rüberkam... Wenn nicht, einfach nochmal fragen.

Gruß,
Steini

[steini @ jung-senioren.de]


Johannes Michalowsky antwortete am 20.09.02 (19:01):

Also, jetzt kann ich nur noch den Schluß ziehen, daß wir am PC nach beiden Interpretationen parallel arbeiten - wenn ich mit ALT und Zifferntastatur etwas eingebe, dann ist es der ASCII-Code, ansonsten der ISO Latin-1 - richtig?

Ich müßte dann für die praktische Arbeit zwei Tabellen neben mir liegen haben - wo aber bekomme ich die ASCII-Tabelle her? Die ISO-Tabelle ist klar, die ist unter der von mir angegebenen URL zu finden.


klaus d. antwortete am 20.09.02 (20:20):

Schau mal hier nach, vielleicht hilfts dir.

Internet-Tipp: https://www.calo.de/lhtml_z.htm


Johannes Michalowsky antwortete am 20.09.02 (21:37):

@klaus d.

Herzlichen Dank für Deine Mühe, habe mir das angeschaut, aber auch da hat ntilde den Wert 241, ist also eine ISO-Tabelle.

Ich hoffe, Euch war die Frage nicht zu trivial, ich jedenfalls tue mich immer noch schwer damit, aber geholfen habt Ihr mir schon.