Die korrekten Sonderzeichen
Wenn doch alles so einfach wäre wie in Word! Zwar ärgern sich viele Nutzer zurecht über die enervierende Eigendynamik, welche die Office-Software häufig an den Tag legt. Doch die Tatsache, dass zumindest "falsche" Anführungszeichen oder - zu kurz geratene - Gedankenstriche meist automatisch gegen die „korrekten“ Versionen – und zwar in Windeseile – ersetzt werden, tilgt schon einmal 70 % der Sonderzeichen-Sünden, die unbedarfte Hobbysetzer sonst verursachen würden.
Dass viele HTML-Editoren und Content-Management-Systeme noch nicht so weit sind, sieht man daran, dass selbst die Internet-Auftritte großer Zeitungen und Magazine bisweilen nicht in der Lage sind, elementare Satzregeln zu beachten. Dabei ist das doch gar kein Problem, wie wir gleich sehen werden.
Vom & zum ;
Eines haben alle Sonderzeichen gemeinsam: Sie lassen sich auf insgesamt vier Arten im HTML-Quelltext definieren. Zum einen ist es möglich und inzwischen auch üblich, das HTML-Dokument im UTF-8-Format (Unicode) anzulegen und die Sonderzeichen einfach ohne weitere Kodifizierung einzugeben.
In manchen altertümlichen Server/Datenbank-Umgebungen, wo UTF-8 noch nicht durchgängig verwendet wird, benötigt man jedoch eine sogenannte maskierte Schreibweise. Dafür muss eine spezielle Kennung des gewünschten Zeichens zwischen einem kaufmännischen &
und einem Semikolon ;
platziert werden. Diese Kennung kommt in drei möglichen Schreibweisen vor:
- HTML-Entity: Sie besteht aus maximal sechs Buchstaben und ist eine Abkürzung des englischen Ausdrucks für das entsprechende Zeichen. Zum Beispiel wird die öffnende spitze Klammer folgendermaßen maskiert:
<
(lower than = kleiner als) - Unicode: Hier darf man die Raute # nicht vergessen, welche vor dem eigentlichen Zahlencode gesetzt wird. Das „ß“ wird hier so erzeugt:
<
- Unicode (hexadezimal): Eine Raute # plus ein x kennzeichnen ein Unicode-Zeichen im hexadezimalen System. Unser „ß“ sieht dann so aus:
<
Alle drei Möglichkeiten sind legitim und können auch vermischt eingesetzt werden. Natürlich sind die HTML-Kennungen am leichtesten zu lernen. Die wichtigsten sollte man auch tatsächlich auswendig können, alles andere schlägt man bei SelfHTML9 nach. Wer mit einem HTML-Editor arbeitet, der Sonderzeichen automatisch in Codes umwandelt, muss aber eigentlich nur die richtigen Tastenkombination wissen, die ich auch hier in den Tabellen aufführe.
Umlaute und ß
Zu den deutschen Umlauten erspare ich mir weitschweifende Erklärungen, besondere Satzregeln gibt es hier nicht. Anders beim „scharfen s“ (oder „Eß-Zett“ für die norddeutschen Leser). Bis vor kurzem galt dies als der einzige Buchstabe des deutschen Alphabets, der ausschließlich als Kleinbuchstabe existiert. Er wurde scheinbar nicht benötigt, denn kein deutsches Wort beginnt mit einem ß. Die Tatsache aber, dass VERSALSATZ zur alltäglichen typografischen Realität gehört, und sich viele gelungene Beispiele von selbstgebauten Versal-ß nachweisen lassen, ließ progressive Typografen in den letzten Jahren umdenken und für die Standardisierung dieses neuen Buchstaben kämpfen.
Vor allem im Internet formierte sich eine kleine Bewegung von Experten, die schlüssig und nachvollziehbar die Notwendigkeit eines Versal-ß argumentieren konnten und letztlich auch Erfolge erzielten: Im Frühjahr 2008 wurde der Buchstabe offiziell in den Unicode aufgenommen, und immer mehr Fonts werden nun mit einem entsprechenden Zeichen ausgestattet bzw. nachgerüstet. Bis in die amtliche deutsche Rechtsschreibung hat es das große ß allerdings noch nicht geschafft. Da der Versalsatz jedoch eher eine typografische als eine orthografische Angelegenheit ist, sind wir darauf nicht wirklich angewiesen.
Leider müssen beide Versionen des ß, wie viele andere Sonderzeichen auch, beim Einsatz in Dokumenten mit veralteten Kodierungen vorher maskiert werden. Sie sollten sich allerdings grundsätzlich überlegen, ob das neue Versal‑ß im HTML-Quelltext überhaupt richtig aufgehoben ist. Wenn Sie ein Wort oder einen Abschnitt in Versalien setzen möchten, ist dies über die CSS-Eigenschaft text-transform:uppercase
wesentlich eleganter lösbar als über die irreversible und nicht-semantische Versalschreibweise direkt im Quelltext. Ob dann die Software wiederum so schlau ist, aus dem kleinen ß auch ein großes ß10 zu zaubern, darf hingegen bezweifelt werden. Manche Browser sind immerhin soweit an die deutsche Sprache angepasst, dass sie den im Duden empfohlenen „SS“-Fallback verwenden. In einer perfekten Welt würde der Browser bei der Anwendung der uppercase
-Eigenschaft jedoch erst nachsehen, ob in der gerade aktiven Schrift ein echtes Versal-ß vorhanden ist, und nur bei bei negativem Ergebnis auf SS zurückfallen. Doch erklären Sie das mal den amerikanischen Softwareentwicklern bei Apple, Mozilla und Microsoft! Selbst unseren direkten Nachbarn in der Schweiz ist das alles zu kompliziert; die Eidgenossen schreiben seit vielen Jahrzehnten überhaupt kein ß mehr – weder klein noch groß – und kommen mit ss und SS ganz gut über die Runden.
Name | HTML | Unicode | Unicode hex | Eingabe Windows |
Eingabe Mac |
|
---|---|---|---|---|---|---|
ä | a-Umlaut | ä | ä | ä | Ä | Ä |
Ä | A-Umlaut | Ä | Ä | Ä | ⇧ Ä | ⇧ Ä |
ö | o-Umlaut | ö | ö | ö | Ö | Ö |
Ö | O-Umlaut | Ö | Ö | Ö | ⇧ Ö | ⇧ Ö |
ü | u-Umlaut | ü | ü | ü | Ü | Ü |
Ü | U-Umlaut | Ü | Ü | Ü | ⇧ Ü | ⇧ Ü |
ß | scharfes s | ß | ß | ß | ß | ß |
ẞ | Versal-ß | ẞ | ẞ |
„Anführungszeichen“
In deutschsprachigen Texten gibt es genau drei korrekte Arten, Anführungszeichen zu setzen, nicht mehr und nicht weniger. Zunächst die „klassische“ Variante: immer erst unten, dann oben! Die Form der Zeichen lehnt sich an die Zahlen 99 und 66 an, weswegen dies eine beliebte Eselsbrücke ist. Das allgegenwärtige "Zollzeichen", mit ⇧ 2 schnell erzeugt, darf für Anführungen eigentlich nicht verwendet werden.11
Leider sieht diese korrekte Form der Anführungszeichen in einigen Schriften, darunter die Systemfonts „Verdana“ und „Courier“, etwas kurios aus. Das liegt mutmaßlich an der mangelnden Sorgfalt der englischsprachigen Schriftentwerfer, welche die deutsche Form der Anführungen keinem Ästhetik-Test zu unterziehen scheinen. Ein Ausweg aus dem Dilemma ist die Verwendung der «französischen Guillemets». In deutschen Texten üblicher sind aber die »umgekehrten Guillemets«. Beide haben den Vorteil, dass sie sich harmonischer in den Zeilenverlauf einfügen; sie sind von daher manchmal die bessere Wahl.
Bitte niemals mischen! Im Rahmen einer einzelnen Publikation sollten immer einheitliche Anführungszeichen verwendet werden. Und falls man, beispielsweise innerhalb einer wörtlichen Rede, weitere Anführungen benötigt, so müssen diese in der ‚abgespeckten‘ Form gesetzt werden:
„Ich glaube ihm nicht“, sagte Markus. „Dieser hinterhältige Lügner meinte doch glatt: ‚Ich bin dein Freund!‘ “ Betroffen wandte er sich ab.
Name | HTML | Unicode | Unicode hex | Eingabe Windows |
Eingabe Mac |
|
---|---|---|---|---|---|---|
„ | Anführungszeichen unten | „ | „ | „ | Alt 0132 | alt ^ |
“ | Anführungszeichen oben | “ | “ | “ | Alt 0147 | alt ⇧ ^ |
‚ | einfaches Anführungszeichen | ‚ | ‚ | ‚ | Alt 0130 | alt S |
‘ | einfaches Anführungszeichen | ‘ | ‘ | ‘ | Alt 0145 | alt # |
« | Guillemet | « | « | « | Alt 0171 | alt Q |
» | Guillemet | » | » | » | Alt 0187 | alt ⇧ Q |
‹ | einfaches Guillemet | ‹ | ‹ | ‹ | Alt 0139 | alt ⇧ B |
› | einfaches Guillemet | › | › | › | Alt 0155 | alt ⇧ N |
Horizontale Striche –
Es gibt – entgegen landläufiger Praxis – nicht nur den simplen Trennstrich. Nein, er hat noch zwei große Brüder! Zum einen den Gedankenstrich, auch Halbgeviert-Strich oder bis-Strich genannt. Im Englischen hat er sogar noch einen vierten Namen: n-dash, weil er ungefähr die Breite eines n hat. Nur logisch, dass der längste der drei Brüder der m-dash ist, oder auch Geviert-Strich.
Der kurze Trennstrich (Divis) -
- bei Silbentrennungen.
- um zusammengesetzte Wörter zu gliedern: Fußball-Weltmeisterschaft, Rheinland-Pfalz, Leutheusser-Schnarrenberger, Groß- und Kleinschreibung.
- zum Durchkoppeln von Namen: Matthias-Grünewald-Gymnasium, Willy-Brandt-Haus, Content-Management-System.
Der Gedankenstrich (n-Dash) –
- verrichtet bei Einschüben und Satzpausen – wenn es genehm ist – seinen Dienst. Bitte nicht vergessen, ein geschütztes Leerzeichen vor dem Strich zu setzen – sonst bricht dieser womöglich in die nächste Zeile um.
- als bis-Strich ohne Leerzeichen: 7–8 Uhr abends, 2–3 Runden über den Sportplatz, Ludwig van Beethoven (1770–1827).
- als Streckenstrich, maximal mit einem halben Leerzeichen:
Mainz–Hamburg, die Begegnung Leverkusen – Rostock. - als Auslassungsstrich: 299,– Euro.
Das Minuszeichen −
sieht in den meisten Schriften genauso aus wie der Gedankenstrich, besitzt aber eine andere Semantik und wird auch als eigenes Unicode-Zeichen geführt (siehe Tabelle weiter unten).
Der Geviert-Strich (m-Dash) —
stammt aus dem englischen Satz, wird aber auch dort als eher konservativ-altertümliche Form des Gedankenstriches—without surrounding spaces—verwendet. Er sieht für deutsche Augen ungewöhnlich aus und sollte hier nur der Vollständigkeit halber erwähnt werden.
Silbentrennung und Sollbruchstellen
Trennstriche werden in HTML niemals fest in den Code geschrieben. Theoretisch sollten die aktuellen Browser inzwischen in der Lage sein, deutsche Texte über das lang
-Attribut zu erkennen und dann mittels der CSS-Eigenschaft hyphens:auto
automatisch zu trennen.
Dies ist jedoch bisher noch Wunschdenken. Internet Explorer und Chrome scheren sich in den aktuellen Versionen gar nicht um eine automatische Trennung, und Firefox ist lediglich auf die englische Sprache eingeschossen. Einzig Safari bietet eine deutschsprachige Silbentrennung an.
Gezielt nachhelfen geht jedoch immer, und zwar über manuelle Sollbruchstellen innerhalb von langen Wörtern. Diese werden von allen Browsern akzeptiert und dienen als Trennstellen, wo immer es sinnvoll erscheint. Damit man sie im Quelltext wiederfindet, empfiehlt es sich, die maskierte Schreibweise ­
(soft hyphen) zu verwenden. Ansonsten ist dieses reine Steuerzeichen im Quelltext nämlich unsichtbar. Ein kleines Beispiel sei erlaubt:
Donau­dampf­schiff­fahrts­gesell­schaft
Suchmaschinen haben übrigens mit den soft hyphens kein Problem; sie werden bei der Indexierung ausgefiltert und zerstören nicht etwa das heilige Keyword-Konzept des SEO-Meisters, wie manchmal befürchtet.
Name | HTML | Unicode | Unicode hex | Eingabe Windows |
Eingabe Mac |
|
---|---|---|---|---|---|---|
- | kurzer Trennstrich | - | - | - | - | - |
– | Gedankenstrich | – | – | – | Alt 0150 | alt – |
— | langer Gedankenstrich | — | — | — | Alt 0151 | alt ⇧ — |
− | Minus | − | − | − | ||
- | Sollbruchstelle (soft hyphen) | ­ | ­ | ­ | Alt 0173 |
Weitere wichtige Sonderzeichen ’ × ...
Das geschützte Leerzeichen (non-breaking space)
ist nützlich, um unschöne Umbrüche zu vermeiden. Wer also sicher gehen will, dass bestimmte Wörter oder Zahlen nebeneinander stehen und nicht in die nächste Zeile abrutschen, setzt ein geschütztes Leerzeichen: 17 Grad im Schatten, Prof. Dr. Klaus Brinkmann, Er bekam die Note 6.
Das schmale Leerzeichen
gibt es in einer normalen und einer umbruchgeschützten Version, wobei die letztere deutlich nützlicher sein dürfte. Man kann das schmale Leerzeichen wunderbar in allen Situationen einsetzen, wo man sich nicht sicher ist, ob ein Leerzeichen tatsächlich angebracht ist oder nicht, beispielsweise: § 21, € 1.099, 128 kB/s, 38 cm.
Der Apostroph ’
Merket auf, hier ist Fehlerquelle Nr. 1. Es gibt definitiv nur eine einzige Möglichkeit, einen Apostroph korrekt zu setzen, egal in welcher Sprache. Der Apostroph hat die Form eines ganz normalen Kommas, befindet sich jedoch oben und nicht unten. Das war’s. So schwer? Ein Akzentzeichen, egal ob so ´ oder so `, hat damit nichts zu tun, genauso das einfache schließende Anführungszeichen ‘ oder gar das Minutenzeichen ′.
Die Ellipse …
Bei drei Punkten kann man nichts falsch machen, richtig? Falsch! Drei aufeinanderfolgende Punkte sind eine Ellipse und sollten immer durch ein entsprechendes Sonderzeichen ausgetauscht werden. Bei diesem sind dann die Abstände zwischen den Punkten meist etwas größer, was die ganze Sache hübsch macht. Wenn die Ellipse nicht gerade ein Wort unterbricht („Ich find’ dich sch…“), so sollte außerdem ein (geschütztes) Leerzeichen vor die Punkte gesetzt werden …
Das Malzeichen ×
Wer die Maße von etwas angibt, braucht das Malzeichen: 34 × 23 × 8 cm. Auch wenn es in vielen Schriften zunächst so wirken mag: Das Malzeichen ist nicht identisch mit dem kleinen x. Letzteres besitzt nicht zwingend einen rechten Winkel und hat in den entsprechenden Schriften sogar Serifen, ganz im Gegensatz zum rein geometrisch geformten Mal-Zeichen.
Name | HTML | Unicode | Unicode hex | Eingabe Windows |
Eingabe Mac |
|
---|---|---|---|---|---|---|
’ | Apostroph | ’ | ’ | ’ | Alt 0146 | alt ⇧ # |
× | Malzeichen | × | × | × | Alt 0215 | |
… | Ellipse | … | … | … | Alt 0133 | alt . |
geschütztes Leerzeichen | |   |   | Alt 0160 | alt <space> | |
schmales Leerzeichen |   |   |   | |||
geschütztes schmales Leerzeichen |   |   |
- de.selfhtml.org/html/referenz/zeichen.htm
- Ich verzichte im Rahmen dieses Buches weitestgehend auf eine native Darstellung des Versal-ß, da ich eine Vorahnung habe, was ein E-Book-Reader damit Schlimmes anzustellen in der Lage ist.
- Pragmatische Typografen haben jedoch nichts gegen den Einsatz der Zollzeichen in der informellen digitalen Korrespondenz per Mail oder auf Twitter.