Der ANSI-Code - American National Standards Institute |
![]() |
![]() |
Letztmalig dran rumgefummelt: 06.04.11 17:25:28 |
![]() |
ANSI = American National
Standards Institute. Der genormte ANSI-Zeichensatz ist ist eine Erweiterung
des als veraltet geltenden ASCII-Codes, und wird unter anderem vom Windows-
und Macintosh-Betriebssystem als Standard verwendet. Diese Internetpräsenz verwendet auch den ANSI-Zeichensatz, zu erkennen an der Zeichensatz-Deklaration "iso-8859-1" für westeuropäische Sprachen (> rechte Maustaste > Quelltext anzeigen oder Seitenquelltext anzeigen) <meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">. Mit der Tastenkombination + [Ziffer mit vorangestellter 0] können die ANSI-Zeichen aufgerufen werden. Beispiele: [Alt]+[064] : @ ;[Alt]+[0128] : € ;[Alt]+[0137] : ‰ ; [Alt]+[0169] : © ; [Alt]+[0216] : Ø ; [Alt]+[0189] : ½. [Alt]+[0160] : geschütztes Leerzeichen (Dieses wird benötigt um Buchstaben, Zahlen oder Wörter bei einem Zeilenumbruch nicht auseinanderzureißen. Erscheint in einem Text z.B. die Angabe „800 km“, so kann es passieren, dass die Ziffer „800“ am Ende einer Zeile oder Seite und „km“ am Anfang der nächsten Zeile oder Seite erscheint. Beim Textprogramm MS Word wird das geschützte Leerzeichen auch durch die Tastenkombination [Strg]+[Umschalt]+[Leertaste] erzeugt. Bei Anzeige der Formatierungen ¶, erscheint dieses Zeichen: °). Soll verhindert werden, dass ein Trennstrich in einem Namen (z.B. Meier-Müller) oder einer Aufzählung (08-15) getrennt wird, muss mit der Tastenkombination [Strg]+[Umschalt]+[Trennstrich] ein geschützter Trennstrich erzeugt werden. Bei Anzeige der Formatierungen ¶, erscheint dieses Zeichen: -. |
||||||
![]() |
1. Zur Geschichte 2. Der ASCII-Code 3. ASCII-Code in der heute praktischen Anwendung 4. Marias Hinrichtung 5. Die historischen Quellen |
||||||
![]() |
|
1. Zur Geschichte |
![]() |
![]() |
![]() |
2. Der ASCII-Code |
![]() |
![]() |
![]() |
![]() |
Der Code Maria Stuarts war eine Mischung aus Chiffre und Codes, wobei er in sich und für seine Zeit ziemlich komplex war. Heute würden wir von einem mächtigen Algorithmus sprechen auch war der Schlüssel sehr sicher. Das Verfahren war jedoch monoalphabetisch und damit wiederum leicht angreifbar. | ||||
![]() |
|
3. ASCII-Code in der heute praktischen Anwendung |
![]() |
![]() |
![]() |
![]() |
Die ersten 32
ASCII-Zeichencodes (von 00 bis 1F) sind für Steuerzeichen (control character)
reserviert; siehe dort für die Erklärung der Abkürzungen in obiger Tabelle.
Das sind Zeichen, die keine Schriftzeichen darstellen, sondern die zur
Steuerung von solchen Geräten dienen (oder dienten), die den ASCII verwenden
(etwa Drucker). Steuerzeichen sind beispielsweise der Wagenrücklauf für den
Zeilenumbruch oder Bell (die Glocke); ihre Definition ist historisch
begründet. Code 20 (SP) ist das Leerzeichen (engl. space oder blank), das in einem Text als Leer- und Trennzeichen zwischen Wörtern verwendet und auf der Tastatur durch die Leertaste erzeugt wird. Die Codes 21 bis 7E sind alle druckbaren Zeichen, die sowohl Buchstaben, Ziffern und Satzzeichen (siehe Tabelle) enthalten. Code 7FH (alle sieben Bits auf eins gesetzt) ist ein Sonderzeichen, das auch als „Löschzeichen“ bezeichnet wird (DEL). Dieser Code wurde früher wie ein Steuerzeichen verwendet, um auf Lochstreifen oder Lochkarten ein bereits gelochtes Zeichen nachträglich durch das Setzen aller Bits, d. h. durch Auslochen aller sieben Markierungen, löschen zu können – einmal vorhandene Löcher kann man schließlich nicht mehr rückgängig machen. Bereiche ohne Löcher (also mit dem Code 00) fanden sich am Anfang und Ende eines Lochstreifens (NUL). Aus diesem Grund gehörten zum eigentlichen ASCII-Code nur 126 Zeichen, denn den Bitmustern 0 (0000000) und 127 (1111111) entsprachen keine Zeichencodes. Der Kodierung 0 wurde später in der Programmiersprache C die Bedeutung „Ende der Zeichenkette“ beigelegt; dem Zeichen 127 wurden verschiedene grafische Symbole zugeordnet. |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
![]() |
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
![]() |
ASCII-Tabelle [Bearbeiten]Die ASCII-Tabelle enthält alle Kodierungen des ASCII-Zeichensatzes; siehe Steuerzeichen für die Bedeutung der Abkürzungen in der rechten Spalte:
|
4. Erweiterungen des ASCII-Zeichensatzes |
![]() |
![]() |
![]() |
![]() |
ASCII enthält keine
diakritischen Zeichen, die in fast allen Sprachen auf der Basis des
lateinischen Alphabets verwendet werden. Der internationale Standard
ISO 646
(1972) war der erste Versuch, dieses Problem anzugehen, was allerdings zu
Kompatibilitätsproblemen führte. Er ist immer noch ein Sieben-Bit-Code, und
weil keine anderen Codes verfügbar waren, wurden einige Codes in neuen
Varianten verwendet. So ist etwa die ASCII-Position 93 für die rechte eckige Klammer (]) in der deutschen Zeichensatz-Variante ISO 646-DE durch das große U mit Trema (Umlaut) (Ü) und in der dänischen Variante ISO 646-DK durch das große A mit Ring (Kroužek) (Å) ersetzt. Bei der Programmierung mussten dann die in vielen Programmiersprachen benutzten eckigen Klammern durch die entsprechenden nationalen Sonderzeichen ersetzt werden. Das verringerte die Lesbarkeit des Programmcodes und führte oft zu ungewollt komischen Ergebnissen, indem etwa die Einschaltmeldung des Apple II von „APPLE ][“ zu „APPLE ÜÄ“ mutierte. Verschiedene Hersteller entwickelten eigene Acht-Bit-Codes. Der Codepage 437 genannte Code war lange Zeit der am weitesten verbreitete, er kam auf dem IBM-PC unter MS-DOS, und kommt heute noch in DOS- oder Eingabeaufforderungsfenstern von Microsoft Windows, zur Anwendung. Auch bei späteren Standards wie ISO 8859 wurden acht Bits verwendet. Dabei existieren mehrere Varianten, zum Beispiel ISO 8859-1 für die westeuropäischen Sprachen. Deutschsprachige Versionen von Windows (außer DOS-Fenster) verwenden die auf ISO 8859-1 aufbauende Kodierung Windows-1252 – daher sehen z. B. bei unter DOS erstellten Textdateien die deutschen Umlaute falsch aus, wenn man sie unter Windows ansieht. Viele ältere Programme, die das achte Bit für eigene Zwecke verwendeten, konnten damit nicht umgehen. Sie wurden im Laufe der Zeit oft den neuen Erfordernissen angepasst. Um den verschiedenen Anforderungen der verschiedenen Sprachen gerecht zu werden, wurde der Unicode (in seinem Zeichenvorrat identisch mit ISO 10646) entwickelt. Er verwendet bis zu 32 Bit pro Zeichen und könnte somit über vier Milliarden verschiedene Zeichen unterscheiden, wird jedoch auf etwa 1 Million erlaubte Code-Werte eingeschränkt. Damit können alle bislang von Menschen verwendeten Schriftzeichen dargestellt werden, sofern sie in den Unicode-Standard aufgenommen wurden. UTF-8 ist eine 8-Bit-Kodierung von Unicode, die zu ASCII abwärtskompatibel ist. Ein Zeichen kann dabei ein bis vier 8-Bit-Wörter einnehmen. Sieben-Bit-Varianten müssen nicht mehr verwendet werden, dennoch kann Unicode auch mit Hilfe von UTF-7 in sieben Bit kodiert werden. UTF-8 entwickelt sich zur Zeit (2005) zum einheitlichen Standard unter den meisten Betriebssystemen. So nutzen unter anderem Apples Mac OS X sowie einige Linux-Distributionen standardmäßig UTF-8 und immer mehr Webseiten werden in UTF-8 erstellt. ASCII enthält nur wenige Zeichen, die allgemein verbindlich zur Formatierung oder Strukturierung von Text verwendet werden; diese gingen aus den Steuerbefehlen der Fernschreiber hervor. Hierzu zählen insbesondere der Zeilenvorschub (Linefeed), der Wagenrücklauf (Carriage Return), der horizontale Tabulator, der Seitenvorschub (Form Feed) und der vertikale Tabulator. In typischen ASCII-Textdateien findet sich neben den druckbaren Zeichen meist nur noch der Wagenrücklauf oder der Zeilenvorschub, um das Zeilenende zu markieren, wobei in DOS- und Windows-Systemen üblicherweise beide nacheinander verwendet werden, bei älteren Apple- und Commodore-Rechnern (ohne Amiga) nur der Wagenrücklauf, auf Unix-artigen Systemen sowie Amiga-Systemen nur der Zeilenvorschub. Die Verwendung weiterer Zeichen zur Textformatierung ist bei verschiedenen Anwendungsprogrammen zur Textverarbeitung unterschiedlich. Zur Formatierung von Text werden inzwischen eher Markup-Sprachen wie z. B. HTML verwendet. |
![]() |
Kompatible Zeichenkodierungen [Bearbeiten]Viele Zeichenkodierungen sind so entworfen, dass sie für Zeichen im Bereich 0…127 den gleichen Code verwenden wie ASCII und den Bereich über 127 für weitere Zeichen benutzen. Kodierungen mit fester Länge (Auswahl) [Bearbeiten]Hier steht eine feste Anzahl Bytes für jeweils ein Zeichen. In den meisten Kodierungen ist das ein Byte pro Zeichen, bei den ostasiatischen Schriften zwei oder mehr Byte pro Zeichen.
Kodierungen mit variabler Länge [Bearbeiten]Um mehr Zeichen kodieren zu können, werden die Zeichen 0…127 in einem Byte kodiert, andere Zeichen werden durch mehrere Bytes mit Werten von über 127 kodiert. |
5. Die historischen Quellen |
![]() |
![]() |
![]() |
![]() |
|
![]() |
![]() zur Hauptseite |
© Samuel-von-Pufendorf-Gymnasium Flöha | © Frank Rost am 6. April 2011 um 19.07 Uhr |
... dieser Text wurde nach den Regeln irgendeiner Rechtschreibreform verfasst - ich hab' irgendwann einmal beschlossen, an diesem Zirkus nicht mehr teilzunehemn ;-) „Dieses Land braucht eine Steuerreform, dieses Land braucht eine Rentenreform - wir schreiben Schiffahrt mit drei „f“!“ Diddi Hallervorden, dt. Komiker und Kabarettist |
Diese Seite wurde ohne Zusatz irgendwelcher Konversationsstoffe erstellt ;-) |