doc/de_DE.ISO8859-1/books/fdp-primer/sgml-primer/chapter.sgml

<?xml version="1.0" encoding="iso-8859-1" standalone="no"?>
<!-- Copyright (c) 1998, 1999 Nik Clayton, All rights reserved.

     Redistribution and use in source (SGML DocBook) and 'compiled' forms
     (SGML, HTML, PDF, PostScript, RTF and so forth) with or without
     modification, are permitted provided that the following conditions
     are met:

      1. Redistributions of source code (SGML DocBook) must retain the above
         copyright notice, this list of conditions and the following
         disclaimer as the first lines of this file unmodified.

      2. Redistributions in compiled form (transformed to other DTDs,
         converted to PDF, PostScript, RTF and other formats) must reproduce
         the above copyright notice, this list of conditions and the
         following disclaimer in the documentation and/or other materials
         provided with the distribution.

     THIS DOCUMENTATION IS PROVIDED BY NIK CLAYTON "AS IS" AND ANY EXPRESS OR
     IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES
     OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE
     DISCLAIMED. IN NO EVENT SHALL NIK CLAYTON BE LIABLE FOR ANY DIRECT,
     INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES
     (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR
     SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
     HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
     STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN
     ANY WAY OUT OF THE USE OF THIS DOCUMENTATION, EVEN IF ADVISED OF THE
     POSSIBILITY OF SUCH DAMAGE.

     $FreeBSD$
     $FreeBSDde$
     basiert auf: r38826
-->

<!--?
o SGML-Kontext sollte besser mit Umgebung uebersetzt werden.

Oliver Fischer

-->

<chapter id="sgml-primer">
  <title>Die SGML-Fibel</title>

  <para>Die Mehrzahl der Dokumente des FDPs sind in SGML geschrieben.
    Ziel dieses Kapitels ist es, genau zu erklären, was
    das bedeutet und wie man die SGML-Quellen liest und versteht.
    Ebenso werden die in den Quellen genutzten Kniffe erklärt,
    auf die man beim Lesen der Dokumente stoßen wird.</para>

  <para>Teile dieses Kapitels basieren auf Mark Galassis <quote><ulink
    url="http://www.galassi.org/mark/mydocs/docbook-intro/docbook-intro.html">Get
    Going With DocBook</ulink></quote>.</para>

  <sect1 id="sgml-primer-overview">
    <title>Überblick</title>

    <para>In den guten alten Zeiten war der Umgang mit
      <quote>elektronischem</quote> Text einfach. Man musste
      lediglich wissen, welcher Zeichensatz (ASCII, EBCDIC oder ein
      anderer) vorlag. Text war einfach Text und sah so aus, wie man
      ihn sah. Keine Extras, keine Formatierungen und kein sonstiger
      Schnickschnack.</para>

    <para>Für viele Zwecke war dies allerdings nicht ausreichend.
      Von einem machinenlesbaren Text wird erwartet, dass er auch von
      Maschinen gelesen und intelligent weiterverarbeitet werden kann.
      Einzelne Stellen sollen hervorgehoben werden, andere sollen in ein
      Glossar aufgenommen werden oder auf andere Textstellen
      verweisen. Dateinamen wiederum sollen in einer
      <quote>schreibmaschinenähnlichen</quote> Schrift auf dem
      Bildschirm dargestellt werden, der Ausdruck soll jedoch in
      <quote>Schrägschrift</quote> oder in einer beliebigen anderen
      Darstellungsform erfolgen.</para>

    <para>Anfänglich gab es die Hoffnung, dass die
      Künstliche Intelligenz (KI) helfen würde, dieses Ziel
      zu erreichen. Computer sollte den Text lesen und dazu in der Lage
      sein, selbstständig wichtige Formulierungen, Dateinamen,
      Benutzereingaben oder Beispiele zu erkennen.  Leider verlief die
      Entwicklung in diesem Bereich nicht wie gewünscht und Computer
      benötigen nach wie vor etwas Unterstützung, bevor sie
      Texte vernünftig verarbeiten können.</para>

    <para>Genauer gesagt, man muss ihnen sagen, was was ist. Sehen
      wir uns folgende Zeilen an:</para>

      <blockquote>
	<para>Löschen Sie <filename>/tmp/foo</filename> mittels &man.rm.1;.</para>

	<screen>&prompt.user; <userinput>rm /tmp/foo</userinput></screen>
      </blockquote>

    <para>Es fällt uns leicht, zu erkennen, was ein Dateiname, ein
      einzugebender Befehl oder ein Verweis auf eine Hilfeseite ist. Das
      kann ein Computer, der einen Text verarbeitet, nicht. Aus diesem
      Grund ist es notwendig, Texte mit weiteren Informationen
      <quote>auszuzeichnen</quote>.</para>

    <para>Der Begriff <quote>Auszeichnung<footnote> <para>Im
            angelsächischschen Sprachraum wird von
            <quote>markup</quote>
            gesprochen.</para></footnote></quote> bedeutet, dass
      sich der Wert eines Textes erhöht, aber auch seine Kosten.
      Durch Auszeichnungen wird einem Dokument zusätzlicher Text
      hinzugefügt, der aber von dem eigentlichen Dokumenteninhalt
      auf eine bestimmte Art und Weise unterschieden werden kann, so
      dass Programme die Auszeichnung erkennen können und
      mittels dieser Informationen während der Verarbeitung in
      der Lage sind, Entscheidungen zu treffen. Texteditoren
      können diese Auszeichnungselemente vor dem Benutzer
      verbergen, um zu vermeiden, dass er durch sie abgelenkt
      wird.</para>

    <!--<para><quote>Markup</quote> is commonly used to describe <quote>adding
    value</quote> or <quote>increasing cost</quote>.  The term takes on both
    these meanings when applied to text.  Markup is additional text included
    in the document, distinguished from the document's content in some way,
    so that programs that process the document can read the markup and use
    it when making decisions about the document.  Editors can hide the
    markup from the user, so the user is not distracted by it.</para>-->


    <para>Die durch die Auszeichnungselemente im Textdokument
      zusätzlich abgelegten Informationen erhöhen den Wert
      des Dokuments. Allerdings muss diese Arbeit in den meisten
      Fällen von einem Menschen getan werden &ndash; wären
      Maschinen dazu fähig, wären zusätzliche
      Auszeichnungselemente unnötig. Der damit verbundene Aufwand
      <emphasis>erhöht die Kosten</emphasis>, die durch die
      Erstellung des Dokuments entstehen.</para>

    <para>Das etwas weiter oben gegebene Beispiel sieht im Quelltext
      so aus:</para>

    <programlisting><![CDATA[
<para>Löschen Sie <filename>/tmp/foo</filename> mittels &man.rm.1;.</para>

<screen>&prompt.user; <userinput>rm /tmp/foo</userinput></screen>]]></programlisting>

    <para>Die Auszeichnungselemente sind deutlich vom eigentlichen
      Inhalt zu unterscheiden.</para>

    <para>Die Einführung von Auszeichnungselementen setzt voraus,
      dass festgelegt wird, welche Bedeutung einzelne Elemente haben
      und wie diese interpretiert werden.  Sie brauchen daher eine
      Auszeichnungssprache, der Sie folgen, wenn Sie eigene
      Dokumente verfassen.</para>

    <para>Natürlich kann es keine universelle
      Auszeichnungssprache geben und eine einzige mag nicht
      ausreichend für alle möglichen Anwendungsfälle
      sein. Eine  Sprache für technische Dokumente wird sich
      wahrscheinlich stark von einer für Kochrezepte
      unterscheiden. Die universelle Lösung ist eine
      Basissprache, mit deren Hilfe weitere Sprachen entwickelt werden
      können &ndash; eine
      <emphasis>Meta-Auszeichungssprache</emphasis> also.</para>

    <para>Genau diese Anforderung wird von der Standard Generalized
      Markup Language (<abbrev>SGML</abbrev>) erfüllt. Mit ihrer
      Hilfe wurden viele andere Auszeichungssprachen wie
      beispielsweise HTML und DocBook, welche beide von FDP genutzt
      werden, entwickelt.</para>

    <para>Die eigentliche Sprachdefinition erfolgt in einer
      Dokumenten-Typ-Definition (DTD). Innerhalb dieser DTD werden die
      Namen der einzelnen Elemente, deren mögliche Reihenfolge
      und Verschachtelung sowie weitere Informationen
      festgelegt.</para>

      <!-- Der letzte Satz dieses Absatzes muss noch übersetzt werden.
      Ich habe keine gute Übersetzung dafür bis jetzt
      gefunden. Oliver Fischer -->

      <!--<para>Each language definition is more properly called a Document Type
      Definition (DTD).  The DTD specifies the name of the elements that can
      be used, what order they appear in (and whether some markup can be used
      inside other markup) and related information.  A DTD is sometimes
      referred to as an <emphasis>application</emphasis> of SGML.</para>-->

    <para id="sgml-primer-validating">Eine DTD ist eine
      <emphasis>vollständige</emphasis> Definition aller
      möglichen Sprachelemente, ihrer
      Reihenfolge<footnote><para>Bei natürlichen Sprachen spricht
          man vom Satzbau  &ndash; demjenigen Konstrukt, das unter
          anderem die Position des Subjekts, Objekts und
          Prädikats in einem Satz festlegt.</para></footnote>,
      optionaler Elemente und so weiter und so weiter. Dank dieser
      recht formalen Festlegung ist es möglich,
      SGML-<emphasis>Parser</emphasis> zu entwickeln, die sowohl ein
      Dokument  als auch seine DTD einlesen und anhand dieser DTD
      prüfen können, ob das Dokument allen Anforderungen der
      DTD entspricht. Dieser Vorgang wird allgemein als
      <emphasis>Validierung des Dokuments</emphasis>
      bezeichnet.</para>

    <note>
      <para>Das Validieren eines SGML-Dokuments gegen eine DTD
        überprüft lediglich die korrekte Syntax des
        Dokuments, dass heißt, ob nur gültige
        Auszeichnungselemente verwendet wurden und ihre Reihenfolge
        stimmt. Dabei wird <emphasis>nicht</emphasis> geprüft, ob
        die Elemente der DTD <emphasis>sinngemäß</emphasis>
        verwandt wurden. Sollten beispielsweise alle Dateinamen als
        Funktionsnamen ausgezeichnet worden sein, so würde der
        Parser keinen Fehler signalisieren. Formaler ausgedrückt:
        Der Parser prüft die Syntax, aber nicht die
        Semantik.</para>
      </note>

    <para>Es ist anzunehmen, dass, wenn man selber vor hat
      Dokumentation für das FDP zu schreiben, der
      größte Teil davon mit Hilfe von HTML oder DocBook
      geschrieben werden wird. Aus diesem Grunde wird an dieser Stelle
      nicht erklärt, wie eine DTD entwickelt wird.</para>
    </sect1>

    <sect1 id="sgml-primer-elements">
    <title>Von Elementen, Tags und Attributen</title>

    <!-- Bei der Übersetzung des ersten Satzes bin ich mir nicht
      sicher, ob es einee bessere gibt. Oliver Fischer -->

    <para>Alle in SGML geschriebenen DTDs haben bestimmte gemeinsame
      Eigenschaften. Das ist nicht verwunderlich, da sich die hinter
      SGML stehende Idee unweigerlich bemerkbar macht. <!--?
      Kandidat fuer ein Umformulierung. Oliver Fischer --> Zwei der
      markantesten Merkmale dieser Idee sind die Begriffe
      <emphasis>Inhalt</emphasis> und
      <emphasis>Element</emphasis>.</para>

    <!--<para>All the DTDs written in SGML share certain characteristics.  This is
    hardly surprising, as the philosophy behind SGML will inevitably show
    through. One of the most obvious manifestations of this philosophy is
    that of <emphasis>content</emphasis> and
    <emphasis>elements</emphasis>.</para>-->

    <!--? Vielleicht sollte man nicht von Elementen sondern von Teilen
    sprechen. Oliver Fischer -->

    <!--?
    Hier muss die endlose Rekursion noch besser zum Ausdruck kommen.
    -->
    <para>Von einem Dokument, unabhängig, ob es sich um  eine
      einzelne Webseite oder ein langes Buch handelt, wird angenommen,
      dass es einen wie auch immer gearteten Inhalt hat. Dieser
      lässt sich selbst wiederum in Teilelemente
      aufspalten, die ebenso zerlegbar sind. Durch die Aufnahme von
      Auszeichnungselementen in einen Text, werden diese einzelnen
      Elemente eindeutig benannt und voneinander abgegrenzt.</para>

      <!--<para>Your documentation (whether it is a single web page, or a lengthy
      book) is considered to consist of content.  This content is then divided
      (and further subdivided) into elements.  The purpose of adding markup is
      to name and identify the boundaries of these elements for further
      processing.</para>-->

    <!--? Begriff Element erscheint hier ploetzlich. Sollte
    besser eingefuehrt werden. Oliver Fischer -->

    <para>Nimmt man zum Beispiel ein typisches Buch, so kann man es
      auf der obersten Ebene als ein Ganzes, als ein Element
      betrachten. Dieses <quote>Buch</quote>-Element enthält nun
      Kapitel, die wiederum selbst als Elemente bezeichnet werden
      können. Jedes einzelne Kapitel enthält weitere
      Elemente. So gibt es beispielsweise Absätze, Zitate und
      Fußnoten. Jeder Absatz kann wiederum selbst Elemente
      enthalten, die helfen, den Absatzinhalt als direkte Rede oder
      als Namen eines der Protagonisten einer Geschichte zu
      identifizieren.</para>

    <para>Wenn man möchte, kann man sich das als
      <quote>Unterteilung</quote><footnote><para>Im
          angelsächsichen Sprachraum wird hier von
          <quote>chunking</quote> gesprochen.</para></footnote> des
      Inhalts vorstellen. Auf der obersten Ebene gibt es ein Element:
      das Buch selbst. Schaut man ein wenig tiefer, findet man weitere
      Teilelemente: die einzelnen Kapitel. Diese sind wiederum
      unterteilt in Absätze, Fußnoten, Namen und so weiter
      und so weiter.</para>

    <para>Anzumerken ist an dieser Stelle, dass das eben gesagte
      ohne weiteres auf jeden Inhaltstyp angewandt werden kann, auch
      ohne dass von <acronym>SGML</acronym> die Rede ist. Man
      könnte beispielsweise einfach verschiedene Stifte nehmen
      und einen Ausdruck dieser Fibel vor sich hinlegen und dann mit
      verschiedenen Farben die einzelnen Abschnitte des Buchinhalts
      markieren.</para>

    <para>Leider gibt es  keinen elektronischen Stift, um das zu tun.
      Deshalb muss ein anderer Weg gewählt werden, um zu
      bestimmen, zu welchem Element die einzelnen Inhalte
      gehören. In SGML-basierten Auszeichnungssprachen wie HTML
      und DocBook  werden dafür so genannte
      <emphasis>Tags</emphasis> eingesetzt.</para>

    <para>Mit einem solchen Tag wird eindeutig festgelegt, wo ein
      bestimmtes Element beginnt und wo es endet. <emphasis>Allerdings
        gehört der Tag selber nicht zum Element.</emphasis> Er
      legt lediglich die Grenzen des Elements fest. Da jede DTD mit dem Ziel
      entwickelt wurde, einen speziellen Inhaltstyp auszuzeichnen,
      wird jede DTD verschiedene Elemente kennen, die daher
      natürlich auch unterschiedlich benannt sein werden.</para>

    <para>Der Starttag für ein imaginäres Element mit dem
      Namen <replaceable>elementname</replaceable> ist
      <sgmltag>&lt;<replaceable>elementname</replaceable>&gt;</sgmltag>.
      Sein Gegenstück, der schließende Endtag, ist
      <sgmltag>&lt;/<replaceable>elementname</replaceable>&gt;</sgmltag>.</para>

    <example>
      <title>Verwendung eines Elements (Start- und Endtag)</title>

      <para>HTML kennt das Element <sgmltag>p</sgmltag>, um
        festzulegen, dass ein bestimmter abgegrenzter Bereich
        einen Absatz darstellt. Dieses Element hat sowohl einen Start-
        als auch einen Endtag.</para>

      <programlisting><![CDATA[<p>Das ist ein Absatz. Er beginnt mit Starttag
  für das Element 'p' und endet mit dem Endtag für
  das Element 'p'.</p>

<p>Das ist ein etwas kürzerer Absatz.</p>]]></programlisting>
    </example>

    <para>Elemente müssen nicht notwendigerweise einen Endtag
      haben. Ebenso ist es nicht notwendig, dass Elemente einen
      Inhalt haben. Beispielsweise kann in HTML-Dokumenten mittels
      eines speziellen Elements festgelegt werden, dass eine
      horizontale Linie an einer bestimmten Stelle erscheinen soll. Da
      dieses Element offensichtlich keinen Inhalt hat, wird auch kein
      Endtag benötigt.</para>

    <example>
      <title>Verwendung eines Elements (nur Starttag)</title>

      <para>In HTML kann man mit dem Element <sgmltag>hr</sgmltag>
        festlegen, dass an einer bestimmten Stelle eine
        horizontale Linie angezeigt werden soll. Da dieses Element
        keinen Inhalt umschließt, hat es nur einen
        Starttag.</para>

      <programlisting><![CDATA[<p>Das ist ein Abschnitt.</p>

<hr>

<p>Das ist ein weiterer Absatz. Eine horizontale Linie
  trennt ihn vom vorherigen Absatz.</p>]]></programlisting>
    </example>

    <para>Elemente können andere Elemente enthalten.  Im
      anfangs erwähnten Buch enthielt das Buch-Element
      alle Kapitel-Elemente, die wiederum alle Absatz-Elemente
      enthielten und so fort.</para>

    <example>
      <title>Verschachtelte Elemente: <sgmltag>em</sgmltag></title>

      <programlisting><![CDATA[<p>Das ist ein einfacher <em>Abschnitt</em>, in dem
  einige <em>Worte</em> <em>hervorgehoben</em> wurden.]]></programlisting>
    </example>

    <para>Welche Elemente andere Elemente enthalten können und
      welche das sind, wird innerhalb der DTD eines Dokuments
      festgelegt.</para>

    <!--
    <para>The DTD will specify the rules detailing which elements can contain
    other elements, and exactly what they can contain.</para>
    -->

    <important>
      <para>Viele Leute sind oft verwirrt, wenn es um die richtige
        Benutzung der Begriffe Tag und Element geht. Im Ergebnis werden
        sie oft so genutzt, als wären sie austauschbar.
        Allerdings sind sie das nicht.</para>

      <para>Ein Element ist ein konzeptioneller Teil eines Dokuments
        und hat einen festgelegten Anfang und ein festgelegtes
	Ende. Ein Tag hingegen markiert die Stelle, an der ein Element
	beginnt und endet.</para>

      <para>Wenn in diesem Dokument vom <quote>Tag <sgmltag>p</sgmltag></quote>
        gesprochen wird, ist damit der Text
        gemeint, der aus den drei Zeichen <literal>&lt;</literal>,
        <literal>p</literal> und <literal>&gt;</literal> besteht. Wird
        hingegen von dem <quote>Element <sgmltag>p</sgmltag></quote>
        gesprochen, ist damit das gesamte Element gemeint.</para>

      <para>Diese Unterscheidung ist sicherlich subtil. Trotzdem
        sollte man sie sich vergegenwärtigen.</para>
    </important>

    <para>Elemente können selber Attribute haben, die aus einem
      Namen und einem Wert bestehen.  Die Attribute haben die Aufgabe,
      dem Element zusätzliche Informationen hinzuzufügen.
      Denkbar sind hier Festlegungen über die Darstellung,
      Bezeichner, über die das Element eindeutig identifiziert
      werden kann, oder beliebige andere Informationen.</para>

    <para>Elementattribute werden in den <emphasis>Starttag</emphasis>
      eingefügt und haben die Form
      <literal><replaceable>Attributename</replaceable>="<replaceable>Wert</replaceable>"</literal>.</para>

    <para>Bei einigen HTML-Versionen kennt das Element
      <sgmltag>p</sgmltag> das Attribut <sgmltag>align</sgmltag>, mit
      dessen Hilfe die Textausrichtung eines Absatzes bestimmt werden
      kann.</para>

    <para><literal>align</literal> akzeptiert einen von vier
      vorgegebenen Werten: <literal>left</literal>,
      <literal>center</literal>, <literal>right</literal> und
      <literal>justify</literal>. Ist <literal>align</literal> nicht
      angegeben, wird vom Standardwert <literal>left</literal>
      ausgegangen.</para>

    <example>
      <title>Elemente mit Attributen nutzen</title>

      <programlisting><![CDATA[<p align="left">Die Verwendung des align-Attributs
  für diesen Absatz ist überflüssig, da left
  der Standardwert ist.</p>

<p align="center">Dieser Absatz wird hoffentlich mittig dargestellt.</p>]]></programlisting>
    </example>

    <para>Einige Attribute akzeptieren nur bestimmte Werte, wie
      beispielsweise <literal>left</literal> oder
      <literal>justify</literal>. Andere akzeptieren jeden beliebigen
      Wert. Enthält Attributwert doppelte Anführungszeichen
      (<literal>"</literal>), wird der Wert in einfachen
      Anführungszeichen eingeschlossen.</para>

    <example>
      <title>Attribute mit einfachen Anführungszeichen</title>

      <programlisting><![CDATA[<p align='right'>Ich stehe rechts!</p>]]></programlisting>
    </example>


    <para>Manchmal können die Anführungszeichen um den
      Attributwert weggelassen werden.  Allerdings sind die Regeln,
      die festlegen wann dies zulässig ist, sehr spitzfindig.
      Am besten schließen Sie Attributwerte
      <emphasis>immer</emphasis> in Anführungszeichen ein.</para>

    <para>Die Informationen über Attribute, Elemente und Tags
      sind in SGML-Katalogen abgelegt und werden von den verschiedenen
      Werkzeugen des Dokumentationsprojektes genutzt, um die
      geschriebenen Dokumente zu validieren. Die Programme die durch
      <filename role="package">textproc/docproj</filename> installiert
      werden, bringen ihre eigenen Katalogvarianten mit, zudem pflegt
      das FDP seine  eigenen Kataloge. Beide Katalogarten müssen
      von allen Programmen gefunden werden können.</para>

    <sect2>
      <title>Was dafür getan werden muss;&hellip;</title>

      <para>Damit die Beispiele dieser Fibel ausgeführt werden
        können, ist es notwendig, dass einige Programme auf
        dem Rechner installiert sind und das eine Umgebungsvariable
        korrekt gesetzt wird.</para>

      <procedure>
        <step>
          <para>Der erste Schritt ist die Installation des Ports
            <filename role="package">textproc/docproj</filename>
            über das FreeBSD-Portsystem. <filename
              role="package">textproc/docproj</filename> ist ein
            <emphasis>Metaport</emphasis>, der alle vom FDP
            benötigten Programme und Daten aus dem Netz laden und
            installieren sollte.</para>
        </step>

        <step>
          <para>Anschließend muss in den Shellkonfigurationsdateien die
            Variable <envar>SGML_CATALOG_FILES</envar>
            <footnote><simpara>Sofern man nicht an der deutschen
                Dokumentation arbeitet, müssen die
                Verzeichnisangaben entsprechend angepasst
                werden.</simpara>
              </footnote> gesetzt werden.</para>

            <example id="sgml-primer-envars">
              <title><filename>.profile</filename>, für &man.sh.1; und
                &man.bash.1; Benutzer</title>

	    <programlisting>SGML_ROOT=/usr/local/share/sgml
SGML_CATALOG_FILES=${SGML_ROOT}/jade/catalog
SGML_CATALOG_FILES=${SGML_ROOT}/docbook/4.1/catalog:$SGML_CATALOG_FILES
SGML_CATALOG_FILES=${SGML_ROOT}/html/catalog:$SGML_CATALOG_FILES
SGML_CATALOG_FILES=${SGML_ROOT}/iso8879/catalog:$SGML_CATALOG_FILES
SGML_CATALOG_FILES=/usr/doc/share/sgml/catalog:$SGML_CATALOG_FILES
SGML_CATALOG_FILES=/usr/doc/en_US.ISO8859-1/share/sgml/catalog:$SGML_CATALOG_FILES
export SGML_CATALOG_FILES</programlisting>
	  </example>
            <!--?
              Hier muesste geprueft werden, ob sich die letzten beiden Zeilen
              vertragen oder nicht. Gibt es Entitaeten, die in beiden
              vorhanden sind, aber unterschiedliche Uebersetzungen haben?

              Oliver Fischer
            -->

          <example>
            <title><filename>.cshrc</filename>, für &man.csh.1;- und
              &man.tcsh.1;-Benutzer</title>

            <programlisting>setenv SGML_ROOT /usr/local/share/sgml
setenv SGML_CATALOG_FILES ${SGML_ROOT}/jade/catalog
setenv SGML_CATALOG_FILES ${SGML_ROOT}/docbook/4.1/catalog:$SGML_CATALOG_FILES
setenv SGML_CATALOG_FILES ${SGML_ROOT}/html/catalog:$SGML_CATALOG_FILES
setenv SGML_CATALOG_FILES ${SGML_ROOT}/iso8879/catalog:$SGML_CATALOG_FILES
setenv SGML_CATALOG_FILES /usr/doc/share/sgml/catalog:$SGML_CATALOG_FILES
setenv SGML_CATALOG_FILES /usr/doc/en_US.ISO8859-1/share/sgml/catalog:$SGML_CATALOG_FILES
setenv SGML_CATALOG_FILES /usr/doc/de_DE.ISO8859-1/share/sgml/catalog:$SGML_CATALOG_FILES</programlisting>
            </example>

          <para>Damit die Änderungen wirksam werden, meldet man
            sich ab und anschließend wieder an &ndash; oder man
            führt die obigen Anweisungen direkt in der Shell
            aus und setzt so die benötigten Umgebungsvariablen.</para>

        </step>
      </procedure>

      <procedure>
        <step>
          <para>Nun sollte man eine Datei
            <filename>beispiel.sgml</filename> anlegen, die den
            folgenden Text enthält:</para>

            <programlisting><![CDATA[<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">

<html>
  <head>
    <title>Eine Beispieldatei in HTML</title>
  </head>

  <body>
    <p>Das ist ein Absatz mit etwas Text.</p>

    <p>Das ist ein Absatz mit anderem Text.</p>

    <p align="right">Dieser Absatz wird rechtsbündig
      ausgerichtet.</p>
  </body>
</html>]]></programlisting>
        </step>

        <step>
          <para>Nachdem die Datei abgespeichert wurde, kann sie
            mit Hilfe eines SGML-Parsers validiert werden.</para>

          <para>Bestandteil von <filename role="package">textproc/docproj</filename>
            ist <command>onsgmls</command> - ein <link
            linkend="sgml-primer-validating">validierender Parser</link>.
            <command>onsgmls</command> liest ein Dokument entsprechend einer SGML-DTD
            ein und gibt anschließend ein Element-Structure-Information-Set
            (ESIS) aus. Allerdings ist das an dieser Stelle nicht weiter
            wichtig.</para>

          <para>Wird <command>onsgmls</command> mit der Option <option>-s</option>
            aufgerufen, werden nur Fehlermeldungen ausgegeben. Dadurch
            kann leicht geprüft werden, ob ein Dokument gültig
            ist oder nicht.</para>

          <para>So prüft man mit <command>onsgmls</command>, ob die neuangelegte
            Beispieldatei gültig ist:</para>

            <screen>&prompt.user; <userinput>onsgmls -s beispiel.sgml</userinput></screen>

          <para>Sofern das Beispiel korrekt abgetippt wurde, wird sich
            <command>onsgmls</command> ohne jegliche Ausgabe beenden. Das bedeutet,
            dass das Dokument erfolgreich validiert werden konnte
            und somit gültig ist.</para>
        </step>

        <step>
          <para>Jetzt sollten die Tags <sgmltag>title</sgmltag> und
            <sgmltag>/title</sgmltag> aus dem Dokument gelöscht
            und das Dokument erneut validiert werden:</para>

            <screen>&prompt.user; <userinput>onsgmls -s beispiel.sgml</userinput>
onsgmls:beispiel.sgml:5:4:E: character data is not allowed here
onsgmls:beispiel.sgml:6:8:E: end tag for "HEAD" which is not finished</screen>

          <para>Die Fehlermeldungen, die von <command>onsgmls</command>
	    ausgegeben werden, sind in durch Doppelpunkte getrennte
	    Spalten unterteilt.</para>

          <informaltable frame="none" pgwide="1">
            <tgroup cols="2">
              <thead>
                <row>
                  <entry>Spalte</entry>
                  <entry>Bedeutung</entry>
                </row>
              </thead>

              <tbody>
                <row>
                  <entry>1</entry>
                  <entry>Der Name des Programms, das den Fehler
                    meldet. Hier wird immer <literal>onsgmls</literal>
                    stehen.</entry>
                </row>

                <row>
                  <entry>2</entry>
                  <entry>Der Name der fehlerhaften Datei.</entry>
                </row>

                <row>
                  <entry>3</entry>
                  <entry>Die Zeilennummer des Fehlers.</entry>
                </row>

                <row>
                  <entry>4</entry>
                    <entry>Die Spaltenummer des Fehlers.</entry>
                </row>

                <row>
                  <entry>5</entry>
                  <entry>Ein einbuchstabiger Code, der über die
                    Art des Fehlers informiert. <literal>I</literal>
                    steht für eine informelle Meldung,
                    <literal>W</literal> für eine Warnung und
                    <literal>E</literal> für Fehler<footnote>
                      <para>Nicht immer besteht eine Meldung aus
                        fünf Spalten. Die Ausgabe von
                        <command>onsgmls -sv</command> ist
                        beispielsweise <literal>onsgmls:I: SP version
                          "1.3"</literal> (natürlich
                        abhängig von der Version). Wie man sehen
                        kann, handelt es sich hier um eine informelle
                        Meldung.</para>
                    </footnote> und <literal>X</literal> für
                    einen Querverweis. Bei den oben stehenden Ausgaben
                    handelt es sich also um Fehlermeldungen.</entry>
                  </row>

                <row>
                  <entry>6</entry>
                  <entry>Die Meldung.</entry>
                </row>
              </tbody>
            </tgroup>
          </informaltable>

          <para>Durch das Weglassen des Tags <sgmltag>title</sgmltag>
            sind zwei unterschiedliche Fehler entstanden.</para>

          <para>Der erste Fehler besagt, dass Inhalt (in diesem
            Falle Zeichen anstatt eines Starttags) an einer Stelle
            gefunden wurde, an der der Parser etwas anderes erwartet
            hat. Genauer gesagt wurde der Starttag eines Elements
            erwartet, das innerhalb von <sgmltag>head</sgmltag>
            auftreten kann.</para>

          <para>Der zweite Fehler wurde dadurch verursacht, dass
            das Element <sgmltag>head</sgmltag> ein
            Element <sgmltag>title</sgmltag> enthalten
            <emphasis>muss</emphasis> und <command>onsgmls</command>
            nicht berücksichtigt, dass dieser Fehler auf dem
            vorhergehenden beruht. Es wird lediglich festgestellt,
            dass der Endtag von <sgmltag>head</sgmltag> auftritt,
	    obwohl nicht alle notwendigen Elemente vorhanden sind.</para>
        </step>

        <step>
          <para>Zum Schluß sollte der Tag
            <sgmltag>title</sgmltag> wieder in die Beispieldatei
            eingefügt werden.</para>
          </step>
        </procedure>
    </sect2>
  </sect1>

  <sect1 id="sgml-primer-doctype-declaration">
    <!--? Oliver Fischer: Man sollte mal feststellen, welche Bezeichung
    von w3c.de oder so hier verwendet wird.-->
    <title>Die DOCTYPE-Deklaration</title>

    <para>Am Anfang jedes Dokuments muss der Name der dem
      Dokument zugrundeliegenden DTD angegeben werden. Mit Hilfe
      dieser Information können SGML-Parser die verwendete DTD
      feststellen und prüfen, ob das Dokument zu ihr konform ist.</para>

    <para>Üblicherweise steht diese Information in einer Zeile,
      die als DOCTYPE-Deklaration bezeichnet wird.</para>


    <para>Eine Deklaration für ein HTML-Dokument, das nach den
      Vorgaben der DTD für HTML 4.0 geschrieben wurde, sieht so
      aus:</para>

    <programlisting><![CDATA[<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.0//EN">]]></programlisting>

    <para>und besteht aus verschiedenen Teilen.</para>

    <!--<para>That line contains a number of different components.</para>-->

    <!--?
    Hier bin ich mir nicht sicher, ob ich genau übersetzt habe oder
    das Orginal sprachlich ungenau ist. Man sollte hier mal
    in den Standardspezikationen nachschlagen und gegebenenfalls
    das Orginal korrigieren.
    Oliver Fischer
    -->

    <variablelist>
      <varlistentry>
        <term><literal>&lt;!</literal></term>

        <listitem>
          <para>Die Zeichenkette <literal>&lt;!</literal> dient hier
            als <emphasis>Indikator</emphasis>, dass es sich bei
            diesem Ausdruck um eine SGML-Deklaration handelt und diese
            Zeile den Dokumententyp festlegt.</para>
        </listitem>
      </varlistentry>

      <varlistentry>
        <term><literal>DOCTYPE</literal></term>

        <listitem>
          <para>Zeigt an, dass dies die SGML-Deklaration für
            den Dokumententyp ist.</para>
        </listitem>
      </varlistentry>

      <varlistentry>
        <term><literal>html</literal></term>

        <listitem>
          <para>Nennt das erste <link
              linkend="sgml-primer-elements">Element</link>, das im
            Dokument auftaucht.</para>
        </listitem>
      </varlistentry>

      <varlistentry>
        <term><literal>PUBLIC "-//W3C//DTD HTML 4.0//EN"</literal></term>

        <listitem>
          <para>Nennt den Formalen Öffentlichen Bezeichner
            <footnote>
              <simpara>auf Englisch <foreignphrase>Formal Public
                  Identifier (FPI) </foreignphrase></simpara>
            </footnote> der DTD des Dokuments. Diese Information wird
            von SGML-Parsern ausgewertet, um die von dem Dokument
            referenzierte DTD zu bestimmen.</para>

          <para>Das Schlüsselwort <literal>PUBLIC</literal>
            gehört nicht zum öffentlichen Bezeichner,
            sondern legt fest, wie ein SGML-Parser die DTD finden
            kann. Alternative Wege eine DTD zu referenzieren werden
            <link linkend="sgml-primer-fpi-alternatives">später
              gezeigt</link>.</para>
        </listitem>
      </varlistentry>

      <varlistentry>
        <term><literal>&gt;</literal></term>

        <listitem>
          <para>Schließt den mit <literal>&lt;!</literal> begonnenen
            Ausdruck ab.</para>
        </listitem>
      </varlistentry>
    </variablelist>

    <sect2>
      <title>Formale Öffentliche Bezeichner</title>

      <!--? -->
      <note>
        <para>Dieser Abschnitt braucht nicht unbedingt zu gelesen zu
          werden. Dennoch ist es empfehlenswert, da er nützliche
          Hintergrundinformationen enthält, die hilfreich sein
          können, falls der SGML-Prozessor die genutzte DTD nicht
          finden kann.</para>
      </note>

      <para>Jeder öffentliche Bezeichner muss eine bestimmte Syntax
        haben, die wie folgt lautet:</para>

      <!-- Oliver Fischer: Ich habe hier Owner mit Besitzer uebersetzt.
      Mein Gefühl sagt mir, dass dies nicht 100% richtig ist.
      Vielleicht ist Aussteller bessert? -->

      <programlisting>"<replaceable>Besitzer</replaceable>//<replaceable>Schlüsselwort</replaceable> <replaceable>Beschreibung</replaceable>//<replaceable>Sprache</replaceable>"</programlisting>

      <variablelist>
        <varlistentry>
          <term><replaceable>Besitzer</replaceable></term>

          <listitem>
            <para>Nennt den Besitzer des öffentlichen Bezeichners.</para>

            <para>Falls diese Zeichenkette mit <quote>ISO</quote>
              beginnt, gehört der Bezeichner dem ISO-Kommitee.
              Der Bezeichner <literal>"ISO 8879:1986//ENTITIES Greek
                Symbols//EN"</literal> nennt <quote>ISO
                8879:1986</quote> als den Besitzer des Satzes von
              Entitäten für griechische Zeichen. ISO
              8879:1986 ist die ISO-Bezeichnung für den
              SGML-Standard.</para>


            <!--? Die Formulierung gefällt mir nicht. Oliver Fischer -->
            <para>Beginnt die Zeichenkette nicht mit
              <quote>ISO</quote>, sieht sie entweder so
              <literal>-//<replaceable>Besitzer</replaceable></literal>
              oder so
              <literal>+//<replaceable>Besitzer</replaceable></literal>
              aus. Beide Varianten unterscheiden sich also nur durch
              das anfängliche <literal>+</literal> bzw.
              <literal>-</literal>.</para>

            <para>Sofern am Anfang ein <literal>-</literal> steht, ist
              der Bezeichner nicht öffentlich registriert, steht
              hingegen ein <literal>+</literal> am Anfang, ist er
              registriert.</para>


            <!--? Vielleicht besser: Wie Namen registeriert werden?
            Oliver Fischer -->
            <!--? Mit der Übersetzung des letzten Satzes bin ich mir
            nicht sicher.... Das muss irgendwie besser ausgedrückt
            werden.... -->

            <para>Im ISO-Standard ISO 9070:1991 wurde festgelegt, wie
              registrierte Namen erzeugt werden können. Unter
              anderem können sie von den Bezeichnungen von
              ISO-Publikationen, von ISBN-Nummern oder einer
              Organisationsbezeichnungen entsprechend ISO 6523
              abgeleitet werden. Anträge für neue offiziell
              registrierte Bezeichner werden vom ISO-Kommitee an das
              American National Standards Institute (ANSI)
              weitergeleitet.</para>


            <!--?
            Eine Zeichenkette kann kein Besitzer sein.
            Wie koennte man das besser ausdruecken?
            -->

            <para>Da das FreeBSD-Projekt seine Bezeichner nicht hat
              registrieren lassen, ist der Besitzer
              <literal>-//FreeBSD</literal>. Unter anderem kann man
              daran auch sehen, dass das W3C sich nicht hat
              registrieren lassen.</para>

          </listitem>
        </varlistentry>

        <varlistentry>
          <term><replaceable>Schlüsselwort</replaceable></term>

          <listitem>
            <para>Es gibt verschiedene Schlüsselwörter mit
              denen man die Art der gegebenen Informationen beschreiben
              kann. Einige der üblichsten sind
              <literal>DTD</literal>, <literal>ELEMENT</literal>,
              <literal>ENTITIES</literal> und <literal>TEXT</literal>.
              <literal>DTD</literal> wird nur für Dateien mit
              DTDs verwandt, <literal>ELEMENT</literal> findet
              für Dateien mit Fragmenten von DTDs Verwendung, die
              nur Deklarationen für Entitäten und Elemente
              enthalten. <literal>TEXT</literal> wird für
              SGML-Inhalte (Texte und Tags) verwendet.</para>
          </listitem>
        </varlistentry>

        <varlistentry>
          <term><replaceable>Beschreibung</replaceable></term>

          <listitem>
            <para>Eine frei wählbare Beschreibung des Inhalts der
              referenzierten Datei. Möglich sind hier
              Versionsnummern oder ein kurzer und sinnvoller Text, der
              innerhalb der SGML-Welt eindeutig ist.</para>

          </listitem>
        </varlistentry>

        <varlistentry>
          <term><replaceable>Sprache</replaceable></term>

          <listitem>
            <para>Ein ISO-Code aus zwei Buchstaben, der die für
              die Datei verwendete Sprache nennt.
              <literal>EN</literal> steht hier für Englisch,
              <literal>DE</literal> für Deutsch.</para>
          </listitem>
        </varlistentry>
      </variablelist>

      <sect3>
        <title>Die <filename>catalog</filename>-Dateien</title>

        <para>Wenn man die oben beschriebene Syntax für
          Bezeichner verwendet und ein Dokument durch einen
          SGML-Prozessor schickt, muss dieser die
          Möglichkeit haben, den Bezeichner auf eine real
          existierende Datei abzubilden, die die benötigte DTD
          enthält.</para>

        <para>Einer der möglichen Wege hierfür sind
          Katalogdateien. Eine solche Datei, die üblicherweise
          <filename>catalog</filename> heißt, besteht aus
          einzelnen Zeilen, die Bezeichner auf Dateinamen abbilden.
          Enthält ein Katalog beispielsweise die Zeile</para>

        <programlisting>PUBLIC "-//W3C//DTD HTML 4.0//EN"             "4.0/strict.dtd"</programlisting>

        <para>kann ein SGML-Prozessor darüber feststellen, dass die
          benötigte DTD in der Datei <filename>strict.dtd</filename>
          im Unterverzeichnis <filename class="directory">4.0</filename>
          des Verzeichnisses des Katalogs zu finden ist.</para>

        <para>Ein gutes Beispiel für einen Katalog ist
          <filename>/usr/local/share/sgml/html/catalog</filename>.
          Diese Datei enthält den Katalog für alle HTML
          DTDs, die im Zuge der Installation von <filename
            role="package">textproc/docproj</filename> installiert
          wurden.</para>

      </sect3>

      <sect3>
        <title>Die Variable <envar>SGML_CATALOG_FILES</envar></title>

        <para>Natürlich muss einem SGML-Prozessor noch
          mitgeteilt werden können, wo er seine Kataloge finden
          kann. Viele Programme bieten hierfür
          Kommandozeilenoptionen an, über die man einen oder
          mehrere Kataloge angeben kann.</para>

        <para>Zusätzlich besteht noch die Möglichkeit mit
          der Umgebungsvariablen <envar>SGML_CATALOG_FILES</envar> auf
          SGML-Kataloge zu verweisen. Die Einträge von
          <envar>SGML_CATALOG_FILES</envar> müssen aus den
          vollständigen Pfadnamen der Kataloge, jeweils durch
          Komma getrennt, bestehen.</para>


        <!--? Stimmt die Formulierung? Oliver Fischer -->
        <para>Üblicherweise werden die folgenden Kataloge über
            <envar>SGML_CATALOG_FILES</envar> für
          die Arbeit an den Dokumenten des FDPs eingebunden:</para>

        <itemizedlist>
          <listitem>
            <para><filename>/usr/local/share/sgml/docbook/4.1/catalog</filename></para>
          </listitem>

          <listitem>
            <para><filename>/usr/local/share/sgml/html/catalog</filename></para>
          </listitem>

          <listitem>
            <para><filename>/usr/local/share/sgml/iso8879/catalog</filename></para>
          </listitem>

          <listitem>
            <para><filename>/usr/local/share/sgml/jade/catalog</filename></para>
          </listitem>
        </itemizedlist>

        <para>Allerdings sollte das
          <link linkend="sgml-primer-envars">schon geschehen
            sein</link>.</para>

      </sect3>
    </sect2>

    <sect2 id="sgml-primer-fpi-alternatives">
      <title>Alternativen zu Formalen Öffentlichen Bezeichnern</title>

      <para>Anstatt mit einem Bezeichner die zum Dokument
        gehörende DTD zu referenzieren, kann auch explizit auf
        die Datei der DTD verwiesen werden.</para>

      <para>Die Syntax des DOCTYPE-Deklaration ist in diesem Falle
        anders:</para>
      <!--<para>The syntax for this is slightly different:</para>-->

      <programlisting><![CDATA[<!DOCTYPE html SYSTEM "/pfad/zur/dokumenten.dtd">]]></programlisting>

      <para>Das Schlüsselwort <literal>SYSTEM</literal> legt
        fest, dass ein SGML-Prozessor die DTD auf
        <quote>systemspezifische</quote> Art und Weise bestimmen soll.
        Meistens, aber nicht immer, wird so auf eine Datei im
        Dateisystem verwiesen.</para>

      <para>Allerdings sollte man öffentliche Bezeichner aus
        Gründen der Portabilität bevorzugen, da man so
        nicht eine Kopie der DTD mit dem Dokument selber verteilen
        muss, beziehungsweise da man, wenn man mit
        <literal>SYSTEM</literal> arbeitet, nicht davon ausgehen kann,
        dass  die benötigte DTD auf anderen Systemen genau
        unter dem gleichen Pfad verfügbar ist.</para>

    </sect2>
  </sect1>

  <sect1 id="sgml-primer-sgml-escape">
    <title>Die Rückkehr zu SGML</title>

    <para>An einer früheren Stelle wurde erwähnt, dass
      man SGML nur benötigt, falls man selbst eine DTD entwickeln
      möchte. Genaugenommen ist das nicht 100%ig richtig. Einige
      Teile der SGML-Syntax können auch in normalen Dokumenten
      verwendet werden, falls dies gewünscht oder notwendig
      ist.</para>

    <para>In diesem Falle muss dafür Sorge getragen werden,
      dass ein SGML-Prozessor feststellen kann, dass ein
      bestimmter Abschnitt des Inhalts SGML ist, das er verarbeiteten
      muss.</para>

    <para>Solche SGML-Abschnitte werden mittels
      <literal>&lt;!&nbsp;...&nbsp;&gt;</literal> in Dokumenten
      besonders gekennzeichnet. Alles, was sich zwischen diesen
      Begrenzungen befindet, ist SGML, wie es auch in DTDs gefunden
      werden kann.</para>

    <para>Demnach ist die <link
        linkend="sgml-primer-doctype-declaration">DOCTYPE-Deklaration</link>
      ein gutes Beispiel für SGML, das in Dokumenten verwendet
      werden muss&hellip;</para>

  </sect1>

  <sect1 id="sgml-primer-comments">
    <title>Kommentare</title>

    <para>Kommentare sind SGML-Konstrukte, die normalerweise nur
      in DTDs gültig sind. Dennoch ist es, wie in
      <xref linkend="sgml-primer-sgml-escape"/> gezeigt,
      möglich Fragmente mit SGML-Syntax in Dokumenten zu
      verwenden.</para>

    <para>Zum Abgrenzen von SGML-Kommentaren wird ein doppelter
      Bindestrich <quote><literal>--</literal></quote> verwendet. Mit
      seinem ersten Auftreten öffnet er einen Kommentar, mit
      seinem zweiten schließt er ihn wieder.</para>

    <example>
      <title>Beispiele für Kommentare in SGML</title>

      <programlisting>&lt;!-- Testkommentar --></programlisting>

      <programlisting><![CDATA[
<!-- Text innerhalb eines Kommentars -->

<!-- Ein anderer Kommentar    -->

<!-- So können mehrzeilige Kommentare
     genutzt werden -->

<!-- Eine andere Möglichkeit für --
  -- mehrzeilige Kommentare.     -->]]></programlisting>
    </example>

    <!--? Noch zu uebersetzen. Oliver Fischer -->
    <![%output.print;[
      <important>
	<title>Es sind zwei Bindestriche</title>

	<para>Es gibt ein Problem mit den PostScript- oder
	  PDF-Versionen dieses Dokuments.  Das obige Beispiel
	  zeigt vielleicht nur einen Bindestrich (<literal>-</literal>)
	  hinter <literal>&lt;!</literal> und vor
	  <literal>&gt;</literal>.</para>

	<para>Es <emphasis>müssen</emphasis> zwei Bindestriche
	  und <emphasis>nicht</emphasis> nur einer benutzt werden.
	  Die PostScript- und PDF-Versionen haben vielleicht
	  beide Bindestriche zu einem längeren Strich, dem
	  <emphasis>em-dash</emphasis>, zusammengefasst.</para>

	<para>Die HTML-, nur-Text und RTF-Versionen dieses Dokuments
	  sind nicht von diesem Problem betroffen.</para>
      </important>
    ]]>

    <para>Hat man früher schon Erfahrungen mit HTML gesammelt,
      wird man vielleicht andere Regeln für den Gebrauch von
      Kommentaren kennengelernt haben. Beispielsweise wird oft
      angenommen, dass Kommentare mit <literal>&lt;!--</literal>
      begonnen und nur mit <literal>--&gt;</literal> beendet
      werden.</para>

    <para>Dies ist <emphasis>nicht</emphasis> der Fall. Viele
      Webbrowser haben fehlerhafte HTML-Parser, die dies akzeptieren.
      Die SGML-Parser, die vom FDP verwendet werden, halten sich
      strenger an die SGML-Spezifikation und verwerfen Dokumente mit
      solchen Fehlern.</para>

    <example>
      <title>Fehlerhafte SGML-Kommentare</title>

      <programlisting><![CDATA[
<!-- Innerhalb eines Kommentars --

     DIES IST NICHT TEIL EINES KOMMENTARS

  -- Wieder innerhalb eines Kommentars -->]]></programlisting>

      <para>SGML-Parser würden die mittlere Zeile wie folgt
        interpretieren:</para>
      <!--<para>The SGML parser will treat this as though it were actually;</para>-->

      <programlisting>&lt;!DIES IST NICHT TEIL EINES KOMMENTARS&gt;</programlisting>

      <para>Da es sich hierbei nicht um gültiges SGML handelt, kann
        diese Zeile zur verwirrenden  Fehlermeldungen führen.</para>

      <programlisting><![CDATA[<!--------------- Eine wirklich schlechte Idee  --------------->]]></programlisting>

      <para>Wie das Beispiel zeigt, sollten solche Kommentare
        tunlichst vermieden werden.</para>

      <!--<para>As the example suggests, <emphasis>do not</emphasis> write
      comments like that.</para>-->

      <programlisting><![CDATA[<!--===================================================-->]]></programlisting>

      <para>Ein solcher Kommentar ist (ein wenig) besser, kann aber
        jemanden, der mit SGML noch nicht so vertraut ist,
        verwirren.</para>

    </example>

    <sect2>
      <title>Fingerübungen&hellip;</title>

      <procedure>
        <step>
          <para>Zur Übung können Sie einige Kommentare in
            die Datei <filename>beispiel.sgml</filename> einfügen
            und überprüfen, ob die Datei nun noch erfolgreich
            von <command>onsgmls</command> validiert werden kann.</para>
        </step>

        <step>
          <para>Zu Testzwecken sollten Sie
            auch noch ein paar fehlerhafte Kommentare hinzufügen
            und sich die resultierenden Fehlermeldungen von
	    <command>onsgmls</command> ansehen.</para>
        </step>
      </procedure>
    </sect2>
  </sect1>

  <sect1 id="sgml-primer-entities">
    <title>Entitäten</title>

    <para>Entitäten stellen einen Mechanismus dar, mit dem
      einzelnen Dokumententeilen  ein Name zugewiesen werden kann.
      Findet ein SGML-Parser während des Parsens eine
      Entität, ersetzt er diese durch den ihr zugewiesenen
      Inhalt.</para>

    <para>Dadurch steht eine einfache Möglichkeit zur
      Verfügung, mit der  variabler Inhalt in SGML-Dokumenten
      eingebunden werden kann. Zusätzlich sind Entitäten der
      einzige Weg, über den eine Datei in eine andere Datei mit
      SGML-Mitteln eingebunden werden kann.</para>

    <para>Es werden zwei Arten von Entitäten unterschieden:
      <emphasis>Allgemeine Entitäten</emphasis> und
      <emphasis>Parameterentitäten</emphasis>.</para>

    <sect2 id="sgml-primer-general-entities">
      <title>Allgemeine Entitäten</title>

      <para>Allgemeine Entitäten können nur in
	Dokumenten benutzt werden.  Sie können zwar im
	SGML-Kontext definiert aber dort nicht benutzt
	werden.  Vergleichen Sie dies mit
        Im <link linkend="sgml-primer-parameter-entities">Parameterentitäten</link>.</para>

      <para>Jede allgemeine Entität hat einen Namen, über
        den sie angesprochen werden kann, um den von ihr
        referenzierten Inhalt in ein Dokument einzubinden. Dafür
        muss an der betreffenden Stelle der Namen der
        Entität per
        <literal>&amp;<replaceable>entitaetenname</replaceable>;</literal>
        einfügt werden. Eine Entität
        <literal>current.version</literal> könnte beispielsweise
        durch die aktuelle Versionsnummer eines Programms ersetzt
        werden. Man könnte also schreiben:</para>

      <!--?
      Der vorhergehende Satz ist nicht 100% sinngemaeß uebersetzt.
      Klingt zudem doof.
      Oliver Fischer
      -->

      <!--<para>Each general entity has a name.  When you want to reference a
      general entity (and therefore include whatever text it represents in
      your document), you write
      <literal>&amp;<replaceable>entity-name</replaceable>;</literal>.  For
      example, suppose you had an entity called
      <literal>current.version</literal> which expanded to the current
          version number of your product.  You could write;</para>-->

      <programlisting><![CDATA[<para>Die aktuelle Version des
  Programms ist &current.version;.</para>]]></programlisting>

      <para>Wenn sich die Versionsnummer ändert, muss
	nur die Entität angepasst und anschließend
	das Dokument neu erzeugt werden.</para>

      <para>Eine weitere Einsatzmöglichkeit für Allgemeine
        Entitäten ist das Einbinden von Zeichen, die auf andere
        Weise nicht in ein SGML-Dokument eingefügt werden
        könnten. Ein Beispiel für solche Zeichen sind
        <literal>&lt;</literal> und <literal>&amp;</literal>, die
        normalerweise nicht direkt in
        SGML-Dokumenten erlaubt sind. Stößt ein SGML-Parser
        bei seiner Arbeit auf das Symbol <literal>&lt;</literal>,
        nimmt er an, dass der Anfang eines Start- oder Endtags
        gefunden wurde. Bei einem <literal>&amp;</literal> wird er
        annehmen, den Anfang einer Entität gefunden zu haben.</para>

      <para>Wenn eines der beiden Zeichen benötigt wird, werden
	daher die allgemeinen Entitäten <literal>&amp;lt;</literal>
	und <literal>&amp;amp;</literal> verwendet.</para>

      <para>Allgemeine Entitäten können nur in einem
        SGML-Kontext definiert werden. Üblich ist es, dies direkt
        nach der DOCTYPE-Deklaration zu tun:</para>

      <example>
        <title>Allgemeine Entitäten festlegen</title>

        <programlisting><![CDATA[<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.0//EN" [
<!ENTITY current.version    "3.0-RELEASE">
<!ENTITY last.version       "2.2.7-RELEASE">
]>]]></programlisting>

        <para>Wichtig ist an dieser Stelle, dass die
          DOCTYPE-Deklaration durch eine eckige Klammer am Ende der
          ersten Zeile erweitert wurde. Die beiden Entitäten
          selber werden in den folgenden zwei Zeilen definiert, bevor
          in der letzten Zeile die eckige Klammer und die
          DOCTYPE-Deklaration wieder geschlossen werden.</para>

        <!--?
        UEbersetzung mit dem Orginal vergleichen und nach einer
        besseren UEbersetzung suchen.
        -->

        <para>Die eckigen Klammern sind notwendig um festzulegen, dass
          man die über DOCTYPE genannte DTD erweitern möchte.</para>

      </example>
    </sect2>

    <sect2 id="sgml-primer-parameter-entities">
      <title>Parameterentitäten</title>

      <para>Genau wie <link
          linkend="sgml-primer-general-entities">Allgemeine
          Entitäten</link> werden Parameterentitäten
        eingesetzt um wiederverwendbare Inhaltsteile mit Namen zu
        versehen. Im Gegensatz zu Allgemeinen Entitäten
        können sie aber nur innerhalb eines <link
          linkend="sgml-primer-sgml-escape">SGML-Kontextes</link>
        genutzt werden.</para>

      <para>Die Definition von Parameterentitäten erfolgt
        ähnlich zu der Allgemeiner Entitäten. Sie werden
        lediglich mit
        <literal>%<replaceable>entitaetenname</replaceable>;</literal>
        anstelle von
        <literal>&amp;<replaceable>entitaetenname</replaceable>;</literal>
        referenziert<footnote>
          <para>Es wird das Prozentzeichen anstelle des
            kaufmännischen Unds verwendet.</para>
        </footnote>. Wichtig ist, dass das
        <literal>%</literal>-Zeichen zwischen
        <literal>ENTITY</literal> und dem Entitätennamen ein Teil
        der Definition ist.</para>

      <example>
        <title>Parameterentitäten festlegen</title>

        <programlisting><![CDATA[<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.0//EN" [
<!ENTITY % param.etwas "etwas">
<!ENTITY % param.text "Text">
<!ENTITY % param.neu  "%param.etwas mehr %param.text">

<!-- %param.neu ist jetzt "etwas mehr Text" -->
]>]]></programlisting>
        </example>

        <!--? Noch nicht übersetzt. Oliver Fischer -->
        <!--<para>This may not seem particularly useful.  It will be.</para>-->
      </sect2>

    <sect2>
      <title>Fingerübungen&hellip;</title>

      <procedure>
        <step>
          <para>Fügen Sie in <filename>beispiel.sgml</filename>
            eine Allgemeine Entität ein.</para>

            <programlisting><![CDATA[<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN" [
<!ENTITY version "1.1">
]>

<html>
  <head>
    <title>Eine HTML-Beispieldatei</title>
  </head>

  <body>
    <p>Das ist ein Absatz mit etwas Text.</p>

    <p>Das ist ein Absatz mit anderem Text.</p>

    <p align="right">Dieser Absatz wird rechtsbündig
      ausgerichtet.</p>

    <p>Die aktuelle Version ist: &amp;version;</p>
  </body>
</html>]]></programlisting>
        </step>

        <step>
          <para>Validieren Sie diese Datei mit
            <command>onsgmls</command></para>
        </step>

        <step>
          <para>Öffnen Sie nun <filename>beispiel.sgml</filename>
            mit Ihrem Webbrowser. Es kann notwendig sein, dass
            Sie die Datei vorher in <filename>beispiel.html</filename>
            umbenennen müssen, damit die Datei auch als
            HTML-Dokument erkannt wird.</para>

          <para>Nur wenn Sie einen sehr modernen Browser haben, werden
            Sie sehen können, dass
            <literal>&amp;version;</literal> durch die Versionsnummer
            ersetzt wurde. Leider haben die meisten Webbrowser
            sehr einfache SGML-Parser, die nicht richtig mit SGML
            umgehen können<footnote>
              <para>Eigentlich ist das eine Schande. Man stelle sich
                vor, welche Probleme und Hacks, wie beispielsweise
                Server Side Includes, man an dieser Stelle hätte
                vermeiden können.</para>
            </footnote>.</para>
        </step>

        <step>
          <para>Die Lösung hierfür ist, das Dokument zu
            <emphasis>normalisieren</emphasis>. Zu diesem Zweck liest
            ein Normer <!--? Sehr freie Übersetzung. Oliver -->
            das Dokument ein und gibt anschließend semantisch
            gleichwertiges SGML wieder aus, dass auf verschiedene
            Arten transformiert worden sein kann. Eine dieser
            möglichen Transformationen ist das Ersetzen der
            Referenzen auf Entitäten mit dem von ihnen
            präsentierten Inhalt.</para>

          <para>Versuchen Sie, die Beispieldatei mittels
            <command>osgmlnorm</command> zu normalisieren:</para>

            <screen>&prompt.user; <userinput>osgmlnorm beispiel.sgml > beispiel.html</userinput></screen>

          <para>Anschließend sollten Sie eine normalisierte
            Version, dass heißt eine, bei der die
            Entitäten gegen ihren Inhalt ersetzt wurden, in der
            Datei <filename>beispiel.html</filename> finden. Diese
            Datei können Sie sich nun mit Ihrem Browser
            ansehen.</para>

        </step>

        <step>
          <para>Wenn Sie sich die Ausgaben von <command>osgmlnorm</command>
            ansehen, werden Sie feststellen, dass
            die DOCTYPE-Deklaration am Anfang der Datei nicht mehr
            enthalten ist. Möchten Sie die Deklaration behalten,
            muss <command>osgmlnorm</command> mit der Option
            <option>-d</option> aufrufen werden:</para>

          <screen>&prompt.user; <userinput>osgmlnorm -d beispiel.sgml > beispiel.html</userinput></screen>
        </step>
      </procedure>
    </sect2>
  </sect1>

  <sect1 id="sgml-primer-include">
    <title>Dateien mit Entitäten einbinden</title>

    <!--?
    Dieser kleine Absatz klingt ziemlich hölzern.
    Oliver Fischer
    -->

    <para>Sowohl <link
        linkend="sgml-primer-general-entities">Allgemeine</link> als
      auch <link
        linkend="sgml-primer-parameter-entities">Parameterentitäten</link>
      sind nützliche Helfer, wenn es darum geht, eine Datei in
      eine andere einzubinden.</para>

    <sect2 id="sgml-primer-include-using-gen-entities">
      <title>Dateien mit Allgemeinen Entitäten einbinden</title>

      <para>Angenommen man hat ein Buch geschrieben, dessen Inhalt
        auf mehrere Dateien aufgeteilt und mittels SGML
        ausgezeichnet. Jedes Kapitel wurde dazu in einer eigenen Datei
        (<filename>kapitel1.sgml</filename>,
        <filename>kapitel2.sgml</filename> usw.) abgelegt und
        über eine Datei <filename>buch.sgml</filename> sollen
        alle physischen Dateien wieder mit der Hilfe von
        Entitäten zu einem logischen Dokument
        zusammengeführt werden.</para>

      <para>Damit der Inhalt der Dateien mit Entitäten
	eingebunden werden kann, muss die Deklaration der
        Entitäten das Schlüsselwort
        <literal>SYSTEM</literal> enthalten. SGML-Parser werden so
        angewiesen, den Inhalt der referenzierten Datei als Wert
        für die jeweilige Entität zu nehmen.</para>

      <example>
        <title>Dateien mit Allgemeinen Entitäten einbinden</title>

        <programlisting><![CDATA[<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.0//EN" [
<!ENTITY kapitel.1 SYSTEM "kapitel1.sgml">
<!ENTITY kapitel.2 SYSTEM "kapitel2.sgml">
<!ENTITY kapitel.3 SYSTEM "kapitel3.sgml">
<!-- Und so weiter... -->
]>

<html>
  <!-- Jetzt werden die Kapitel über die Entitäten eingebunden -->

  &amp;kapitel.1;
  &amp;kapitel.2;
  &amp;kapitel.3;
</html>]]></programlisting>
      </example>

      <warning>
        <para>Wenn man Allgemeine Entitäten benutzt, um andere
          Dateien einzubinden, dürfen diese Dateien
          (<filename>kapitel1.sgml</filename>,
          <filename>kapitel2.sgml</filename>, ...)
          <emphasis>keine</emphasis> eigene DOCTYPE-Deklaration
          haben.</para>
      </warning>
    </sect2>

    <sect2>
      <title>Dateien mit Parameterentitäten einbinden</title>

      <para>Wie bereits festgestellt, können
        Parameterentitäten nur innerhalb eines SGML-Kontexts
        genutzt werden. Warum möchte man aber Dateien innerhalb
        eines SGML-Kontexts einbinden? Der Vorteil liegt in der
        Möglichkeit, die Deklaration von Entitäten in eine
        andere Datei auslagern zu können, wodurch diese leichter
        wiederverwendbar sind.</para>

      <para>Angenommen das Buch aus dem vorherigen Kapitel besteht aus
        sehr vielen Kapiteln und diese sollen auch in einem anderen
        Buch, aber in einer anderen Reihenfolge, verwendet werden.
        Eine Möglichkeit wäre es, die dafür notwendigen
        Entitäten am Anfang jedes Buches einzeln festzulegen
        &ndash; was allerdings mit der Zeit unhandlich und
        fehlerträchtig wird.</para>

      <para>Alternativ bietet sich dazu an, die Deklarationen in eine
        separate Datei auszulagern und deren Inhalt anschließend
        in beide Bücher über Parameterentitäten
        einzubinden.</para>

      <example>
        <title>Dateien mit Parameterentitäten einbinden</title>

        <para>Zuerst werden die Entitäten in einer separaten
          Datei namens <filename>kapitel.ent</filename> deklariert.
          <filename>kapitel.ent</filename> enthält für
          dieses Beispiel die folgenden Zeilen:</para>

        <programlisting><![CDATA[<!ENTITY kapitel.1 SYSTEM "kapitel1.sgml">
<!ENTITY kapitel.2 SYSTEM "kapitel2.sgml">
<!ENTITY kapitel.3 SYSTEM "kapitel3.sgml">]]></programlisting>

        <para>Im zweiten Schritt fügt man in beide Bücher
          eine Parameterentität ein, die den Inhalt von
          <filename>kapitel.ent</filename> referenziert, und lädt
          über diese dann die Deklarationen. Anschließend
          können die so geladenen Entitäten wie gewohnt
          genutzt werden.</para>

	<programlisting><![CDATA[<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.0//EN" [
<!-- Definieren einer Parameterentität um die Allgemeinen Entitäten für -->
<!-- die Kapitel laden zu können                                        -->
<!ENTITY % kapitel SYSTEM "kapitel.ent">

<!-- Nun wird der Inhalt der referenzierten Datei geladen -->
%kapitel;
]>

<html>
  &amp;kapitel.1;
  &amp;kapitel.2;
  &amp;kapitel.3;
</html>]]></programlisting>
      </example>
    </sect2>

    <sect2>
      <title>Fingerübungen&hellip;</title>

        <sect3>
          <title>Binden Sie Dateien über Allgemeine Entitäten ein</title>

          <procedure>
            <step>
              <para>Legen Sie drei Dateien (<filename>absatz1.sgml</filename>,
                <filename>absatz2.sgml</filename> und <filename>absatz3.sgml</filename>)
                mit jeweils einer Zeile wie

                <!--     <para>Create three files, <filename>para1.sgml</filename>,
                <filename>para2.sgml</filename>, and
                <filename>para3.sgml</filename>.</para>-->

                <!--<para>Put content similar to the following in each file;</para>-->

                <programlisting><![CDATA[<p>Erster Absatz.</p>]]></programlisting>
                an.</para>
	  </step>

	  <step>
	    <para>Ändern Sie <filename>beispiel.sgml</filename> so
              ab, dass sie wie folgt aussieht:</para>

              <programlisting><![CDATA[<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.0//EN" [
<!ENTITY version "1.1">
<!ENTITY absatz1 SYSTEM "absatz1.sgml">
<!ENTITY absatz2 SYSTEM "absatz2.sgml">
<!ENTITY absatz3 SYSTEM "absatz3.sgml">
]>

<html>
  <head>
    <title>Eine HTML-Beispieldatei</title>
  </head>

  <body>
    <p>Die aktuelle Version dieses Dokuments ist &version;</p>

    &absatz1;
    &absatz2;
    &absatz3;
  </body>
</html>]]></programlisting>
	  </step>

	  <step>
	    <para>Erzeugen Sie nun die Datei
              <filename>beispiel.html</filename>, indem Sie
              <filename>beispiel.sgml</filename> normalisieren:</para>

            <screen>&prompt.user; <userinput>osgmlnorm -d beispiel.sgml > beispiel.html</userinput></screen>
          </step>

          <step>
            <para>Öffnen Sie <filename>beispiel.html</filename>
              nun mit einem Webbrowser und vergewissern Sie sich,
              dass der Inhalt der Dateien
              <filename>absatz<replaceable>N</replaceable>.sgml</filename>
              in <filename>beispiel.html</filename> übernommen
              wurde.</para>
          </step>
	</procedure>
      </sect3>

      <sect3>
	<title>Binden Sie Dateien mit Parameterentitäten ein</title>

	<note>
	  <para>Hierfür müssen Sie die vorherige Fingerübung gemacht haben.</para>
	</note>

	<procedure>
	  <step>
	    <para>Ändern Sie <filename>beispiel.sgml</filename> so
              ab, dass es wie folgt aussieht:</para>

	    <programlisting><![CDATA[<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.0//EN" [
<!ENTITY % entitaeten SYSTEM "entitaeten.sgml"> %entitaeten;
]>

<html>
  <head>
    <title>Eine HTML-Beispieldatei</title>
  </head>

  <body>
    <p>Die aktuelle Version dieses Dokuments ist &version;</p>

    &absatz1;
    &absatz2;
    &absatz3;
  </body>
</html>]]></programlisting>
	  </step>

          <step>
            <para>Legen Sie eine weitere Datei <filename>entitaeten.sgml</filename> an,
                die folgenden Inhalt hat:</para>

            <programlisting><![CDATA[<!ENTITY version "1.1">
<!ENTITY absatz1 SYSTEM "absatz1.sgml">
<!ENTITY absatz2 SYSTEM "absatz2.sgml">
<!ENTITY absatz3 SYSTEM "absatz3.sgml">]]></programlisting>
          </step>

          <step>
            <para>Erzeugen Sie die Datei
              <filename>beispiel.html</filename>, indem Sie
              <filename>beispiel.sgml</filename> normalisieren:</para>

            <screen>&prompt.user; <userinput>osgmlnorm -d beispiel.sgml > beispiel.html</userinput></screen>
          </step>

          <step>
            <para>Öffnen Sie <filename>beispiel.html</filename>
              nun mit einem Webbrowser und vergewissern Sie sich,
              dass der Inhalt der Dateien
              <filename>absatz<replaceable>N</replaceable>.sgml</filename>
              in <filename>beispiel.html</filename> übernommen
              wurde.</para>
          </step>
        </procedure>
      </sect3>
    </sect2>
  </sect1>

  <sect1 id="sgml-primer-marked-sections">
    <title>Markierte Bereiche</title>

    <para>SGML erlaubt es, dass bestimmte Dokumentabschnitte
      während der Verarbeitung besonders behandelt werden sollen.
      Diese Abschnitte werden als <quote>markierte Bereiche</quote>
      <footnote><para>auf Englisch <foreignphrase>marked
            sections</foreignphrase>
        </para></footnote>
        bezeichnet.</para>

    <example>
      <title>Aufbau eines markierten Bereiches</title>

      <programlisting>&lt;![ <replaceable>SCHLÜSSELWORT</replaceable> [
  Inhalt des markierten Bereiches
]]&gt;</programlisting>
    </example>

    <para>Da es sich bei markierten Bereichen um SGML-Konstrukte
      handelt, werden sie mit <literal>&lt;!</literal> eingeleitet.
      Der eigentliche Anfang des markierten Bereiches wird von der
      folgenden eckigen Klammer bestimmt. Das darauf folgende
      <replaceable>SCHLÜSSELWORT</replaceable> legt fest, wie der
      <quote>markierte Inhalt</quote> durch einen SGML-Prozessor
      während der Verarbeitung behandelt werden soll. Der
      <quote>markierte</quote> Inhalt selbst beginnt erst nach der
      zweiten eckigen Klammer und erstreckt sich bis zu den zwei
      schließenden eckigen Klammern am Ende des Bereiches. Mit
      Hilfe des <literal>&gt;</literal> Zeichens wird der mit
      <literal>&lt;!</literal> begonnene SGML-Kontext wieder
      verlassen.</para>

    <sect2>
      <title>Schlüsselworte für markierte Bereiche</title>

      <sect3>
        <title><literal>CDATA</literal> und <literal>RCDATA</literal></title>

        <para>Die Schlüsselworte <literal>CDATA</literal> und
          <literal>RCDATA</literal> bestimmen das
          <emphasis>Inhaltsmodell</emphasis> für markierte
          Bereiche. Dadurch ist es möglich, vom Standardmodell
          abzuweichen.</para>

        <para>Ein SGML-Prozessor muss während der
          Verarbeitung eines Dokuments zu jedem Zeitpunkt wissen,
          welches <emphasis>Inhaltsmodell</emphasis> gerade anzuwenden
          ist.</para>

        <para>Was ist ein Inhaltsmodell? Kurz gesagt beschreibt das
          Inhaltsmodell, welche Art von Inhalt der Parser zu erwarten
          und wie er damit umzugehen hat.</para>

        <para>Bei <literal>CDATA</literal> und
          <literal>RCDATA</literal> handelt es sich wahrscheinlich um
          die nützlichsten Inhaltsmodelle. <!--? Die richtige
          Uebersetzung ist Buchstabendaten. Oliver Fischer -->
          <literal>CDATA</literal> steht für
          Zeichendaten<footnote>
            <para>auf Englisch <foreignphrase>character
                data</foreignphrase></para></footnote>. Trifft ein
          Parser auf dieses Inhaltsmodell, wird er annehmen, dass
          sich im zugehörigen Dokumentenbereich nur
          <quote>gewöhnliche</quote> Zeichen befinden. Das
          bedeutet, dass <literal>&lt;</literal> und
          <literal>&amp;</literal> ihre besondere Bedeutung
          verlieren und als einfache Zeichen behandelt werden.</para>

        <para><literal>RCDATA</literal> steht für
          Entitätenreferenzen und Zeichendaten<footnote><para>auf
              Englisch
              <foreignphrase>Entity references and character
                data</foreignphrase></para></footnote>. Für einen
          Bereich mit diesem Inhaltsmodell, wird ein Parser davon
          ausgehen, dass er sowohl Zeichen als auch
          Enitätenreferenzen finden kann. <literal>&lt;</literal>
          verliert hier zwar auch seine besondere Bedeutung, doch
          <literal>&amp;</literal> wird weiterhin als Anfang einer
          Entität interpretiert.</para>

        <para>Nützlich ist das <literal>CDATA</literal>-Modell
          vor allem dann, wenn es darum geht Texte eins-zu-eins zu
          übernehmen, in denen <literal>&lt;</literal> und
          <literal>&amp;</literal> gehäuft
          auftreten. Zwar kann man solche Texte überarbeiten und
          jedes <literal>&lt;</literal> durch ein
          <literal>&amp;lt;</literal> und jedes
          <literal>&amp;</literal> durch ein <literal>&amp;amp;</literal>
          ersetzen, doch es wird in den meisten Fällen
          einfacher sein, für den betreffenden Text
          <literal>CDATA</literal> als Inhaltsmodell festzulegen. Ein
          SGML-Parser wird dann, sobald er auf
          <literal>&lt;</literal> oder <literal>&amp;</literal> trifft,
          diese als  Zeichen in einem Text betrachten.</para>

        <note>
          <para>Bei der Verwendung von <literal>CDATA</literal> und
            <literal>RCDATA</literal> als Inhaltsmodell für
            SGML-Beispiele, wie sie in diesem Dokument enthalten sind,
            muss bedacht werden, dass der Inhalt eines
            <literal>CDATA</literal>-Bereiches nicht validiert wird.
            dass das SGML in diesen Bereichen gültig ist,
            muss auf andere Weise sichergestellt werden. Denkbar ist
            beispielsweise, es in einem separaten Dokument zu
            erstellen, dort zu prüfen und erst dann in das
            eigentliche Dokument einzufügen.</para>
        </note>
          <!-- The nesting of CDATA within the next example is disgusting -->

        <example>
          <title>CDATA als Inhaltsmodell für markierte Bereiche</title>

          <programlisting>&lt;para>Das ist ein Beispiel, wie man einen Text,
  der viele <literal>&amp;lt;</literal>- und <literal>&amp;amp;</literal>-
  Entitäten enthält, in ein Dokument einbinden kann.
  Das Beispiel selbst, das sich innerhalb des markierten Bereiches befindet,
  ist ein HTML-Fragment. Der diesen Text umschließende Tag, beginnend mit
  mit <sgmltag>para</sgmltag> und endend mit <sgmltag>/para</sgmltag>, stammt aus der DocBook DTD.&lt;/para>

&lt;programlisting>
  &lt;![RCDATA[  <![CDATA[
    <p>Dieses Beispiel demonstriert die Verwendung von HTML-Elementen.
      Da spitze Klammern so oft vorkommen, ist es einfacher, das
      gesamte Beispiel als CDATA Abschnitt auszuweisen, als die
      entsprechenden Entitäten zu nutzen.</p>

    <ul>
      <li>Das ist ein Listenelement.</li>
      <li>Das ist ein zweites Listenelement.</li>
      <li>Das ist ein drittes Listenelement.</li>
    </ul>

    <p>Und das hier, das ist das Ende des Beispiels.</p>]]>
  ]]&gt;
&lt;/programlisting></programlisting>

          <para>Liest  man die Quellen dieser Fibel, wird man
            feststellen, dass diese Technik durchgängig
            angewandt wurde.</para>

        </example>
      </sect3>

      <sect3>
	<title><literal>INCLUDE</literal> und
	  <literal>IGNORE</literal></title>

        <para>Das Schlüsselwort <literal>INCLUDE</literal> legt
          fest, dass der Inhalt des betreffenden Abschnittes
          mitverarbeitet wird. Demgegenüber bestimmt
          <literal>IGNORE</literal>, dass er ignoriert wird,
          dass heißt, dass er bei der Verarbeitung
          übergangen wird und in der Ausgabe nicht enthalten
          ist.</para>

	<example>
	  <title>Anwendung von <literal>INCLUDE</literal> und
            <literal>IGNORE</literal> in markierten
            Abschnitten</title>

	  <programlisting>&lt;![ INCLUDE [
  Dieser Text wird verarbeitet und eingebunden.
]]&gt;

&lt;![ IGNORE [
  Dieser Text wird weder verarbeitet noch eingebunden.
]]&gt;</programlisting>
          </example>

        <para>Für sich alleine ist <literal>IGNORE</literal> als
          Anweisung nicht besonders nützlich, da ein Bereich, der
          von der Verarbeitung ausgenommen sein soll, auch
          auskommentiert werden kann.</para>

        <para>Kombiniert man <literal>IGNORE</literal> hingegen mit
          <link
            linkend="sgml-primer-parameter-entities">Parameterentitäten</link>,
          steht so ein  Weg zur Verfügung, um dessen Anwendung
          besser  steuern zu können. Zwar können
          Parameterentitäten nur in einem SGML-Kontext einsetzt
          werden, da aber markierte Bereiche ebenfalls SGML-Konstrukte
          sind, ist diese Einschränkung irrelevant.</para>

        <para>Soll beispielsweise ein und dasselbe Dokument in zwei
          unterschiedlichen Varianten produziert werden, einer
          gedruckten und einer digitalen, und soll nur die digitale
          zusätzliche Informationen enthalten, kann dies mit
          einem Trick erreicht werden.</para>

        <para>Man definiert eine Parameterentität, der man als
          Wert die Zeichenkette <literal>INCLUDE</literal> zuweist und
          deklariert den betreffenden Bereich, der nur in der
          digitalen Variante erscheinen soll, als markierten Abschnitt
          und setzt als Schlüsselwort die zuvor definierte
          Parameterentität ein.</para>

        <para>Soll anstelle der digitalen die gedruckte Variante
          produziert werden, muss lediglich der Entität
          <literal>IGNORE</literal> als Wert zugewiesen und das
          Ursprungsdokument erneut durch den SGML-Prozessor geschickt
          werden.</para>

        <example>
          <title>Kontrolle von markierten Bereichen über
            Parameterentitäten</title>

	  <programlisting>&lt;!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.0//EN" [
&lt;!ENTITY % digitale.kopie "INCLUDE">
]]&gt;

...

&lt;![ %digitale.kopie [
  Dieser Satz sollte nur in der digitalen Version enthalten sein.
]]&gt;	  </programlisting>

          <para>Bei der Produktion der gedruckten Variante muss
            der Wert der Entität geändert werden.</para>

	  <programlisting>&lt;!ENTITY % digitale.kopie "IGNORE"></programlisting>

          <para>Bei der Verarbeitung wird als Schlüsselwort in
            beiden Fällen der von
            <literal>%digitale.kopie</literal> repräsentierte
            Wert verwendet. Im ersten Fall wird der Inhalt des
            markierten Bereichs mitverarbeitet, im zweiten Fall
            nicht.</para>

	</example>
      </sect3>
    </sect2>

    <sect2>
      <title>Fingerübung&hellip;</title>

      <procedure>
	<step>
          <para>Legen Sie eine neue Datei
            <filename>abschnitt.sgml</filename> an, die folgenden
            Inhalt hat:</para>

	  <programlisting>&lt;!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.0//EN" [
&lt;!ENTITY % text.ausgabe "INCLUDE">
]&gt;

&lt;html>
  &lt;head>
    &lt;title>Ein Beispiel mit markierten Abschnitten&lt;/title>
  &lt;/head>

  &lt;body>
    &lt;p>Dieser Absatz &lt;![CDATA[beinhaltet viele &lt;
      Zeichen (&lt; &lt; &lt; &lt; &lt;). Weshalb es einfacher ist,
      ihn als CDATA Bereich auszuweisen. ]]&gt;&lt;/p>

    &lt;![ IGNORE [
    &lt;p>Dieser Absatz wird NICHT in der Ausgabe enthalten sein.&lt;/p>
    ]]&gt;

    &lt;![ <![CDATA[%text.ausgabe]]> [
     &lt;p>Dieser Absatz wird in Abhängigkeit von <literal>%text.ausgabe</literal>
       mitausgegeben.&lt;/p>
    ]]&gt;
  &lt;/body>
&lt;/html></programlisting>
        </step>

        <step>
          <para>Normalisieren Sie den Inhalt dieser Datei mit Hilfe
            von <command>osgmlnorm</command> und sehen Sie sich das
            Ergebnis an.  Achten Sie dabei darauf, welche Absätze
            enthalten beziehungsweise nicht enthalten sind und was aus
            den <literal>CDATA</literal>-Bereichen geworden ist.</para>
	</step>

        <step>
          <para>Ändern Sie die Definition von
            <literal>text.ausgabe</literal> so, dass es den
            Wert <literal>IGNORE</literal> zugewiesen bekommt.
            Verarbeiten Sie dann die Datei erneut mit
            <command>osgmlnorm</command> und vergleichen die Ausgabe mit
            der vom ersten <command>osgmlnorm</command> Lauf.</para>

        </step>
      </procedure>
    </sect2>
  </sect1>

  <sect1 id="sgml-primer-conclusion">
    <title>Schlußbemerkung</title>

    <para>Aus Platzgründen, und um der Verständlichkeit
      Willen, wurden viele Gesichtspunkte nicht in aller Tiefe
      beziehungsweise gar nicht besprochen. Trotzdem sollte in den
      bisherigen Kapiteln genügend Wissen über SGML
      vermittelt worden sein, um den Aufbau der Dokumentation des FDPs
      zu verstehen.</para>

  </sect1>
</chapter>
No results found.