The Web Design Group

Struktur eines HTML 4 Dokuments

Elemente und Tags

Elemente sind die Strukturen, die Teile eines HTML Dokuments beschreiben. Zum Beispiel repräsentiert das P Element einen Absatz, während das EM Element eine Hervorhebung des Inhalts zur Folge hat.

Eine Element hat drei Teile: einen Start Tag, Inhalt, und einen Schluß Tag. Ein Tag ist besonderer Text--"Textauszeichnung"--der von "<" und ">" begrenzt wird. Der Schluß Tag beinhaltet ein"/" nach dem "<". Das EM Element beispielsweise hat einen Start Tag, <EM>, und einen Schluß Tag, </EM>. Die Start und Schluß Tags umgeben den Inhalt des EM Elements:

<EM>Das ist hervorgehobener Text</EM>

Element Namen sind immer unabhängig von Groß- und Kleinschreibung, also sind <em>, <eM>, und <EM> alle gleichwertig.

Elemente können nicht überlappen. Wenn das Start Tag für ein EM Element in einem P auftaucht, dann muss der EM Schluß Tag ebenfalls im gleichen P Element auftauchen.

Einige Elemente erlauben das Weglassen von Start oder Schluß Tag. Zum Beispiel ist der LI Schluß Tag immer optional, weil das Ende des Elements durch das nächste LI Element oder das Ende der Liste impliziert wird:

<UL>
  <LI>Erste Zeile Element; kein Schluß Tag
  <LI>Zweite Zeile Element; optionaler Schluß Tag </LI>

  <LI>Dritte Zeile Element; kein Schluß Tag
</UL>

Einige Elemente haben keinen Schluß Tag, weil sie keinen Inhalt haben. Diese Elemente, wie das BR Element für Zeilenumbrüche, sind nur durch einen Start Tag repräsentiert und gelten als leer.

Attribute

Die Attribute eines Elements definieren vielfältige Eigenschaften für das Element. Das IMG Element zum Beispiel nimmt das SRC Attribut um den Ort des Bilds anzugeben und das ALT Attribut um alternativen Text anzugeben, falls das Bild nicht geladen wird:

<IMG SRC="wdglogo.gif" ALT="Web Design Group">

Ein Attribut steht nur im Start Tag --niemals im Schluß Tag--und folgt der Form Attribut-Name="Attribut-Wert". Der Attribut-Wert ist umgeben von einzelnen oder doppelten Anführungszeichen. Die Anführungszeichen sind optional, wenn der Attribut-Wert lediglich aus Buchstaben im Bereich von A-Z und a-z, Zahlen (0-9), Bindestrichen ("-"), Punkten ("."), Unterstrichen ("_"), und Doppelpunkten (":") besteht.

Attribut-Namen sind unabhängig von Groß- und Kleinschreibung, aber Attribut-Werte nicht unbedingt.

Sonderzeichen

Spezielle Zeichen in HTML HTML sind zum Gebrauch für Textauszeichnungen reserviert und müssen maskiert werden, um wirklich zu erscheinen. Das "<" Zeichen kann mit einem Entity ersetzt werden, &lt;. Auf die gleiche Weise wird ">" als &gt; maskiert, und "&" wird als &amp; maskiert. Wenn ein Attribut ein doppeltes Anführungszeichen enthält und von doppelten Anführungszeichen eingeschlossen wird, dann sollte das Anführungszeichen als &quot; maskiert werden.

Es gibt weitere Entities für Sonderzeichen, die über manche Tastatur nur schwer eingegeben werden können. Das Copyright Symbol ("©") zum Beispiel kann mit dem Entity &copy; dargestellt werden. Im Entities Bereich findest du eine komplette Liste der HTML 4 Entities.

Als Alternative zu Entities können Authoren auch nummernbasierte Zeichen Referenzen verwenden. Jedes Zeichen kann als nummernbasierte Zeichen Referenz dargestellt werden, basierend auf der "Code Position" im Unicode. Man kann zum Beispiel &#169; für das Copyright Symbol oder &#1575; für den arabischen Buchstaben alef verwenden.

Kommentare

Kommentare in HTML haben eine komplizierte Syntax, die durch die folgende Regel vereinfacht werden kann: Beginne einen Kommentar mit "<!--", schließe ihn mit "-->", und verwende kein "--" in einem Kommentar.

<!-- Ein Beispiel Kommentar -->

Ein komplettes HTML 4 Dokument

Ein HTML 4 Dokument beginnt mit einer DOCTYPE Deklaration welche die Version von HTML angibt, welche das Dokument betrifft. Das HTML Element kommt danach und enthält HEAD und BODY.HEAD enthält Informationen über das Dokument, wie den Titel und die Stichwörter, während BODY den eigentlichen Inhalt des Dokuments beinhaltet, aufgebaut aus Block-level Elementen und Inline Elementen. Ein grundlegendes HTML 4 Dokument hat folgende Form:

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN"
        "http://www.w3.org/TR/html4/strict.dtd">
<HTML>
  <HEAD>
    <TITLE>Der Titel des Dokuments</TITLE>
  </HEAD>
  <BODY>

    <H1>Hauptüberschrift</H1>
    <P>Ein Absatz.</P>
    <P>Ein anderer Absatz.</P>
    <UL>

      <LI>Ein Listeneintrag.</LI>
      <LI>Ein anderer Listeneintrag.</LI>
    </UL>
  </BODY>
</HTML>

In einem Frameset Dokument ersetzt das FRAMESET Element das BODY Element.

Validierung von HTML

Jedes HTML Dokument sollten validiert werden, um nach Fehlern wie fehlenden Anführungszeichens (<A HREF="oops.html>Oops</A>), falsch geschriebenen Elementen oder Attribut-Namen, oder fehlerhaften Strukturen zu suchen. Solche Fehler sind nicht immer ersichtlich, wenn das Dokument in einem Browser angezeigt wird, denn Browser werden so konstruiert, dass sie die Fehler der Authoren ausbügeln können. Allerdings korrigieren unterschiedliche Browser auf verschiedene Wege, so dass manchmal Text in einem Browser unsichtbar, in anderen Browsern sichtbar dargestellt wird.

Der WDG HTML Validator überprüft die Validität von HTML 4 Dokumenten.

Hinweis: Manche Programme behaupten fälschlicherweise Validatoren zu sein. Ein Validator überprüft ein Dokument gegen eine formelle Dokumenten Typ Definition (DTD), während andere Programme wie lints vor validem, aber unsicheren HTML warnen. Beide Arten von Progammen sind nützlich, aber Validierung sollte niemals vergessen werden.