HTML-Tags, die noch fehlen

Dave Shea hat’s mal wieder auf den Punkt gebracht, aber auch Konstantin denkt drüber nach: Es fehlen eine ganze Menge sinnige, semantische HTML-Elemente.

Ursprünglich diente HTML ja dazu, es den Physik-Fuzzis am CERN zu ermöglichen, ihre Forschungsergebnisse und Messdaten auszutauschen. Hier hatte man es also im Wesentlichen mit wissenschaftlichen Texten zu tun, die – aufgrund ihrer Natur – eine sehr tiefe, aber dabei stets konsequent hierarchive Gliederung aufweisen. Jeder kennt ja dieses »2.1.2.1 – 2.1.2.2« Abschnittsgedöhns bei Doktorarbeiten und ähnlichem.

Nun hat sich das Web seit 1993 ziemlich stark verändert. Und eine extrem wichtige Rolle spielen dabei die journalistischen Textformen. Dass diese jedoch eine ganz andere Gliederung und Struktur aufweisen, dürfte klar sein. HTML hat sich dieser Veränderung jedoch nicht angepasst und hat auch heute noch einen starken Fokus auf wissenschaftlichen Texten.

Und somit haben alle Web-Designer, die motiviert sind, alle ihre Textfragmente korrekt in die passenden Elemente zu setzen, ein Problem. Folgende fehlende redaktionelle Ebenen/Elemente fallen mir spontan ein, auch gleich schon mit einem von mir ausgedachten Vorschlag zur Behebung des Problems:

Soweit mein kleiner Gedankenanstoß. Ich denke, vieles würde leichter, wenn es bei HTML ein paar Korrekturen im Hinblick auf journalistische Textformen geben würde.

18 Kommentare

René

ich denke, es fehlt auch noch ein title im head-Bereich.
Die meisten Seiten (auch deine und meine) verwenden ein h1 dafür – aber eigentlich ist das eine Überschrift …
bei einem Experiment vor einiger zeit: Opera war damals der einzige Browser gewesen, bei dem ich den title-Tag mit CSS sichtbar machen konnte …

Nick Blume

Wird HTML langsam vertextpattert? Aber interessante Ansätze, die eine sinnvolle Erweiterung bieten…

Gerrit

Das hat mit Textpattern nichts zu tun, Nick. Und ja, auch ich verwende aus semantischer Sicht völlig bescheuerte Tags hier auf praegnanz.de. Herr, lass Zeit regnen, dann baue ich meinen Code um und räume bei der Gelegenheit auch mein CSS auf. :-)

mr. s.

schau dir mal die xhtml2 specs an:
http://www.w3.org/2005/Talks/05-steven-xtech/
da sind schöne neue sachen drin, bzw. dinge, die neue tags überflüssig machen.

Boris

Gerade das Beispiel mit den Sub-Headlines leuchtet mir gar nicht recht ein. Was ist eine Sub-Headline? Ich bin auch ausgebildeter (Geistes-)Wissenschaftler, und ich kenne nur Überschriften in klarer hierarchischer Beziehung zueinander.
Hauptüberschrift des Artikels = h1
Dann für jede Ebene darunter 1 dazuzählen = h2,h3,h4… mehr brauchts eigentlich nicht.
Damit ist der semantische Zusammenhang wie der formal-logische jederzeit hergestellt. Falls ein anderer (noch engerer?) Zusammenhang hergestellt werden sollte, müsste man das Konstrukt eher analog den Definitionslisten in ein Containertag einbauen (h):
(h)
(h2)Überschrift…(/h2)
(subh)Unter-Überschrift…(/subh)
(/h)
Das oben im Artikel angegebene Beispiel (die Schreckenstat des Familienvaters) lese ich eher als »missbrauchte« Überschrift, denn es ist ganz eindeutig ein Teaser. Damit wird nicht das in der Headline ausgedrückte Thema weiter differenziert bzw. kategorisiert, was aber die Aufgabe untergeordneter Überschriften ist.
»Zwischenüberschriften« werden nach meiner Zeitungs-Erfahrung meist gar nicht inhaltlich strukturierend, sondern so verwendet, dass mal eben eine fette Auflockerungszeile inhaltlich einigermaßen passend in den Fließtext gesetzt wird, damit es keine einheitsgraue Bleiwüste wird. Sollte die Zeile dagegen semantisch/formal strukturieren, naja, dann haben wir ja die Elemente hx…
Andere der genannten Elemente könnte ich mir dagegen schon als sinnvoll vorstellen.
Jetzt kommt, damits nicht zu lang wird, noch ein weiterer Kommentar mit einem neuen Aspekt…

Boris

Anderer Aspekt:
Wäre es nicht vielleicht sinnvoll, anstatt XHTML immer weiter mit Tags vollzustopfen und damit irgendwann zu einem unhandlichen Universalmonster zu machen (was dann bald zuverlässig zur Neu-Definition als XXHTML führen wird), langsam wirklich in Richtung XML zu blicken. Da definieren wir die Tags, die wir für unsere Veröffentlichungen brauchen, im Rahmen einer DTD, legen die quasi öffentlich aus oder liefern sie samt Stylesheet mit. Ich weiß, da fehlt uns noch Software usw…
Anderer Aspekt:
Wäre es nicht vielleicht sinnvoll, anstatt XHTML immer weiter mit Tags vollzustopfen… mal zu überlegen, ob wir nicht an der anderen Seite schrauben können: Vielleicht mal unsere Texte etwas einfacher aufbauen, mit wenigen Mitteln klar und leicht lesbar strukturieren. Web-gerecht und nicht wie die vermeintlichen Vorbilder Zeitung und wiss. Arbeiten. Da brauchte es meist nur ein paar wenige Tags zu, und Screenreader (bzw. deren Nutzer!) wie XML-Parser freuten sich auch darüber.

Gerrit

Du hast Recht: Zwischenüberschriften strukturieren den Text nicht, sondern lockern ihn optisch auf und geben einen schnellen ersten Eindruck vom Inhalt. Ich finde, das Web hat seine Bleiwüstenzeit hinter sich und sollte auch längere Texte in leicht verdaulicher Form anbieten. Zwischenüberschriften eigenen sich hervoragend, und ich sehe kaum einen Grund, warum man sie nicht auch im Web einsetzen sollte.
Dass man generell auf XML umsteigt und somit entscheiden kann, welche Elemente es gibt, ist zwar prinzipiell eine feine Idee. Leider wird es jedoch in einem Chaos enden, wenn jeder seine eigene Definition von Semantik verwendet. Soll das »semantische Web« tatsächlich funktionieren, muss man sich auf einen einheitlichen Satz von Elementen einigen. Ob da jetzt meine Vorschläge im einzelnen sinnig sind, ist völlig egal: Es sind ja nur Beispiele, die zeigen sollen, worum es mir geht.

Tim

Mal einen Haufen Anmerkungen hier, ich sollte mir doch endlich mal wieder ein Weblog anlegen.
René: title zu visualisieren habe ich auch schon in in anderen Browsern geschafft. Bei Verwendung des XML-Modus sollte das eigentlich auch im IE gehen.
Gerrit: Nicht wirklich. HTML ist eigentlich nur ein Dokument-Format. Wäre es wirklich für wissenschaftliche Publikationen gedacht, wären da auf jeden Fall mathematische Elemente vorhanden. Aber dafür gibt es ja seit Jahrzehnten als Quasi-Standard LaTeX und PDF. Ich sehe HTML eher als sehr generelles Dokumentformat, das sich weder in die Richtung »wissenschaftlich« noch in die Richtung »journalistisch« lehnt.
Boris: Dann fehlen Deinen selbst definierten Elementen aber allgemeingültige semantische Bedeutung. Diese liefert nur eine Spezifikation, die an irgendeinem Punkt wieder auf menschenlesbares Zeug rausläuft. Auch RDF – der heilige Gral des Semantic Webs – hilft da nur bedingt, mal abgesehen davon, dass das a pain in the ass ist, wenn man wie weiterhin in Texteditoren damit arbeiten will. Was will irgendein HTML-verarbeitendes Programm mit Elementen anfangen, die nur Dir selbst etwas sagen?
Allgemein zur Lage der Weiterentwicklung von (X)HTML: Das ganze Projekt rund um XHTML 1 diente nur dazu, HTML in XML neu zu formulieren und zu modularisieren. (Gemessen an der realen Situation des Webs sind wir noch nicht mal soweit, dank des Marktführers ist es unmöglich XHTML 1.1 auszuliefern.) Deswegen gab es außer dem notwendigen ruby-Modul bislang keine Weiterentwicklung von (X)HTML, deswegen sind wir noch beim Stand von HTML 4.
Wirkliche Weiterentwicklung wird es bei XHTML 2 geben. Und weil die XHTML 2 Familie »HTML richtig gemacht« sein soll, wird das etwas komplizierter, nicht abwärtskompatibel zu vorherigen HTML-Versionen aber dennoch praktischer. Mr. S.‹ Link zeigt da einige Beispiele, noch mehr findet man, wenn man sich den Working Draft durchliest. Nur wird das noch dauern. Eingebaut in Browser wird so etwas erst, wenn die Spezifikation den Status Candidate Recommendation haben wird, ich hab neulich als frühesten Termin 2006 dafür gelesen. Und wir alle kennen den IE.
Es gibt noch eine weitere Gruppe. Die WHAT WG ist eine Arbeitsgruppe von innovativen Browserentwicklern, also Opera, Mozilla, Apple, natürlich nicht Microsoft. Diese hat sich zusammengeschlossen, weil sie mit einigen nicht abwärtskompatiblen Spezifikationen (Luftschlössern) des W3Cs nicht wirklich zufrieden war. XForms wäre da zu nennen, das die bisherigen Formulare in XHTML 2 ersetzen wird. Stattdessen haben sie Features aus XForms abwärtskompatibel zu HTML 4 weiterentwickelt, das relativ geschickt. Inzwischen haben sie auch andere Spezifikationen in Arbeit, inbesondere Web Applications 1.0. Letztere wird auf der Mailingliste schon intern als »HTML 5« bezeichnet, sie ist im gewissen Sinn auch eine Weiterentwicklung von HTML 4 bzw. XHTML 1.0. Diese wird auch mehr Elemente bieten.
Ich halte diese Gruppe aus diversen Gründen relevant: – Es sind mehrere (sic!) Browserhersteller, die nicht nur ihr eigenes Süppchen köcheln. – Sie wollen nicht am W3C vorbei arbeiten, tatsächlich sind mehrere ihrer Mitglieder auch dort aktiv, langfristig ist es wohl geplant WHAT WG Spezifikationen in den W3C Spezifikationsprozess einzureichen. – Beim der WHAT WG spzifizierte Innovationen finden sich bereits jetzt schon in Browsern, z.B. einiges Dashboard-spezifische von Apple wie das canvas-Element, für das es auch schon einer Firefox-Patch gibt.
Wieauchimmer, auf jedem Fall sind das zwei Möglichkeiten der Webinnovation im Sinne neuerer und mehr semantischer HTML-Elemente. Hilft natürlich noch kaum was derzeit, aber langfristig interessant.
Mal Gerrits Ideen in XHTML 2 bzw. Web Applications 1.0 gedacht:
Subheadline:
Würde ich in XHTML 2 mit dem generischen h-Element gestalten, eventuell verschachtelt für CSS. Eine weitere Möglichkeit wäre das neu eingeführte meta-Element mit entsprechenden property, z.B. dc:description – man könnte Dein Beispiel auch gut als Metadaten interpretieren.
In Web Applications 1.0 wäre das dann das header-Element vor einem section-Element, darin verschachtelt h(x) und h(x-1).
Ähnlich würde ich bei der Zwischenüberschrift vorgehen – auch die ist eine Überschrift, für die ein h- bzw. hX-Element ausreicht. Das seperator-Element in XHTML 2 hat leider keinen Inhalt und ist damit der legitime Nachfolger des kaputten hr-Elementes. In WA würde sich evtl. das aside-Element anbieten, so wie diese Überschriften oft genutzt werden.
Infobox: In XHTML 2 ein section-Element, in WA 1 das aside-Element.
Bildunterschrift: Bereits in derzeitigem HTML soll jedes Bild ein aussagekräftiges title-Attribut haben. In modernen Browsern kann man dieses jetzt schon über CSS (mit :after und content) bequem als so etwas nutzen.
(So beim durcharbeiten von Gerrits Beispielen bin ich dann doch eher bei Sebastian und Boris: HTML als begrenzte generelle Dokumentensprache gefällt mir dann doch besser als als eierlegende Wollmilchsau)
Die beiden Spezifikationen, beides noch sehr bewegliche Ziele:
XHTML 2: http://www.w3.org/TR/xhtml2
WA 1.0: http://whatwg.org/specs/web-apps/current-work/
(Sorry, Textile finde ich unbenutzbar)

AD

Na, dann gibt es ja auch noch die wunderbaren CCS-Klassen, oder? Oder eben XML, wie oben beschrieben.

Jens Meiert

Puh. Moechte mich kurzhalten: Die ersten beiden Faelle werden absolut ausreichend durch bestehendes Markup abgedeckt – die Subheadline wuerde durch »h1«/«h2« abgebildet werden (nicht »h2«/«subh«), die Zwischenueberschrift durch (»h1«/)«p«/«h2«/«p«.
Zu den anderen Vorschlaegen – schmeiss(t) sie der W3C-HTML-Arbeitgruppe vor. Und ohne unromantisch sein zu wollen, ist davon auszugehen, dass keiner von den bereits angedachten es weit bringen wuerde (Stichworte sind mindestens »object«-Element sowie Klassensemantik).

Gerrit

@Jens: Die Subheadline kann nicht durch ein hx-Element beschrieben werden, weil sie eigentlich nur ein Zusatz zur eigentlichen Überschrift darstellt und eben keine neue Hierarchie-Ebene aufmacht.
Gleiches gilt für die Zwischenheadline. Das sind eigentlich Einschübe, keine Überschriften. Wenn man so möchte, sind das sogar Kurzzusammenfassungen von Textteilen, die mitten in den Text eingeschossen werden. In manchen Layouts sogar unabhängig vom Lauftext (»Pullquote«)

Sebastian Werner

Jupp. das hast du Recht Gerrit. Außerdem würde man sonst, ohne ›echte‹ Subheadline, schnell ein ganz anderes Problem bekommen: Es gäbe einfach nicht genug Überschrift-Wertungen (nur 6).

Jens Meiert

Ah, okay, zu schnell unterwegs gewesen.
Aendert allerdings meiner Ansicht nach wenig: XHTML 2 (»section«-, »h2«, »h1«- bis »h6«-Elemente) sowie HTML 5 (»aside«, »header«...) adressieren bereits einige der (oder deiner) angesprochenen Punkte.
Und zum anderen: Legt die deutsche »Jammermentalitaet« ab und engagiert euch…! Meine ich absolut ernst, bringt eure Ideen in den W3C- und WHAT-Arbeitsgruppen ein. (Ein deutscher Blogeintrag wird – bei allem Respekt – hier eh nicht weit kommen.)

Jens Meiert

Errata: »section«-, »h«-, [...]

vanto

Naja, mit der Semantik ist das immer so ne Sache.
Ich sehe da 3 Möglichkeiten:
1) Man benutzt eine domänen-spezifische Sprache (z.B. für Weblogs, Portale, Artikel) und transformiert sie dann zu HTML. Dann kann man seine Dokumente sehr einfach syntaktisch und semantisch korrekt haben (guckst du z.B. docbook).
2) Man fügt sich in eine reine Darstellungssprache (HTML ohne CSS)
3) Man sucht einen Kompromiss zwischen Beiden. Das problem hier ist die Abstraktion. Da man den gemeinsamen Nenner beider Konzepte finden muss, geht ein Großteil der dabei Semantik drauf. Bei (X)HTML+CSS ist es ja auch so. Man gliedert den Inhalt zwar mit (hx/),(p/),(ul/),(ol/) und (div/),(span/) – sematische Infos wie »Text mit Bild und Teaser« u.ä. müssen hier aber der Generizität Tribut zollen.
Im Grunde muss man sehr dankbar sein, das sich der letzte Punkt langsam durchsetzt. Man muss sich aber auch bewusst sein, warum er so ist, wie er ist.
Top ist sicher eine Mischung aus 1) und 3). Tolle moderne Browser können inzwischen XSL-Stylesheets anwenden. So wird aus der domänenspezifischen Sprache dann XHTML. Das CSS tut dann sein übriges.
my 2 cents

Eric

Zu der Subheadline und der Zwischenüberschrift wurde ja bereits alles gesagt, deshalb zu den anderen Elementen:
Infobox: Warum nicht so:
[dl class=«addinfo«]
[dt]Was ist eigentlich ein Mord?[dt]
[dd]Hier stehen Zusatzinformationen, oder auch additional info, zum aktuellen Thema.[dd]
[/dl]
Bildunterschriften: Sind als title-Attribut vorhanden, der mit CSS in sichbargemacht werden kann (außer IE, ist ja klar.)
Den Sinn eines Teaser-Elements kann ich so nicht nachvollziehen. Könnte man da dann draufklicken und dann erscheint der gesamte Text auf der selben Seite?

Kommentar verfassen

Mit dem Absenden dieses Formulars erklären Sie sich damit einverstanden, dass ich die von Ihnen eingegeben Daten auf meinem Webserver speichere. Ihr Name, der Kommentartext und die angegeben Website werden für die anderen Besucher von praegnanz.de angezeigt. Ich gebe jedoch insbesondere Ihre E-Mail-Adresse nicht an Dritte weiter und nutze diese auch nicht zu Marketing- oder Statistik-Zwecken. Sie können alle Daten zu einem späteren Zeitpunkt wieder entfernen lassen.