Informationsaufbereitung für das World Wide Web
Übersicht
- Einführung und Grundlagen zum Medium World Wide Web
- Wissen vs. Information
- Das Internet und das World Wide Web
- XML als Basis zu HTML und Datenstrukturierung
- Redaktionelle und technische Aufbereitung von Texten und Bildern
- Usability und Accessabillity
Einführung und Grundlagen zum Medium World Wide Web
Das Medium
Jedes Medium besitzt seine "Metapher", es formt bzw.
"färbt" in gewisser Weise den präsentierten
Inhalt. Dies wird durch Marshall McLuhans Spruch
"The Medium is the massage" pointiert
ausgedrückt. Dieser Spruch wurde oft zu
"The Medium is the message"
umgewandelt, der diesen Sachverhalt deutlicher zum
Ausdruck bringt.
Die meistgenannten Metaphern des WWW sind:
- gleichzeitig
- hektisch
- interaktiv
- multimedial
- unzuverlässig
- "Alles ist Kommunikation"
Weitere Eigenschaften des WWW als Medium sind:
- Verschmelzen "klassischen" Schreibens mit anderen (kreativen) Medien
- Vollständige Trennung des Wissens von seinem Erzeuger
- Hypertext ist nicht-linear, offen
- gleichzeitige Darbietung und Vermischung der Bilder und Botschaften (siehe Punkt "Metapher")
Wissen vs. Information
Information enthält Inhalte, die vermittelt werden. Dies geschieht auf 3 Ebenen:
- Syntax: Regeln für Code, bei einer Sprache ist dies die Rechtschreibung und die Grammatik
- Semantik: Bedeutungsgehalt des Codes; basiert auf Vereinbarung zwischen Sender und Empfänger
- Pragmatik: Beschreibt die "Randbedingungen" der Kommunikation: Ironie bzw. "Zwischen den Zeilen lesen".
Auch ist zwischen Informationsmenge und Informationsgehalt zu unterscheiden. Dazu ein Beispiel: Fragt jemand in einem Hotel nach freien Zimmern (es fasst insgesamt 50 Zimmer), so kann ihm der Portier die Zimmernummern der 45 besetzten Zimmer nennen oder die 5 der noch freien. Der Informationsgehalt ist in beiden Fällen gleich, die Informationsmenge im ersten Fall 9 mal so hoch wie im zweiten.
Die Begriffe "Wissen" und "Information"
werden häufig im gleichen Sinn verwendet, das soll auch im
Folgenden so geschehen. Prinzipiell sollte man sich aber des
Unterschiedes der beiden Begriffe bewusst sein, wenn es um
Wissensorganisation geht.
"Information" wird hier sozusagen Grund-Einheit verstanden, "Wissen" ist die subjektive Sammlung und
Verknüpfung dieser "Informationseinheiten" mit dem Ziel, diese unabhängig vom ursprünglichen
Kontext anwenden zu können. Durch die Abhängigkeit des "Wissens" von internen, individuellen
Lernprozessen, bleibt seine wahre Repräsentation im Gehirn
dem äußerlichen Betrachter allerdings völlig
verborgen. Wissen und Wissen muss also nicht unbedingt das selbe bedeuten, auch wenn es auf den selben
Informationen aufbaut.
Wortpaare wie Wissen & Information gibt es viele, von denen das eine Wort die unzugängliche, nicht messbare Grösse beschreibt, und das andere die praktisch greifbare, aber nicht den eigentlichen Kern der Sache beschreibende Äusserung des Ungreifbaren erfasst. Etwa in der Informatik, der Wissenschaft über die Verarbeitung von Informationen, kommen auch Begriffe aus den Sprachwissenschaften wie Semantik und Syntax vor, ebenso in den Wirtschaftswissenschaften, wo man die persönlichen Bedürfnisse der Kunden mit dem Mittel des Bedarfes zu beschreiben versucht.
Das Internet und das World Wide Web
Das World Wide Web Consortium (W3C),
das Gremium, das sich um
Standardisierung des WWW bemüht, definiert es
folgendermassen:
"W3C defines the Web as the universe of network-accessible
information."
Das Web wird auch als ein Medium der Zusammenarbeit definiert
("collaborative Medium").
Grundsätzlich kann gesagt werden, dass Websurfer/innen im
Internet unterwegs sind, Probleme zu lösen bzw. bestimmte
Ziele zu erreichen, wobei Unterhaltung und Kommunikation auch als
Ziele gelten.
Webseiten sind graphische Schnittstellen, das Mittel zum Zweck
für diese Aufgabenstellung und dienen in erster Linie der
Informationsaufbereitung bzw. dem Informationsgewinn in irgendeiner
Form.
Mehr zu den Zielen und Erwartungen von Websurfer/innen und wie diese erfüllt werden können, findet sich im Abschnitt über "Usabillity" weiter unten.
Begriffe, Namen, Geschichte
Folgende Begriffe sind in unserem Zusammenhang mit dem WWW und Informationsaufbereitung zu erwähnen. Die angeführten Links führen zu externen Seiten!):
- Ein erster Ausblick auf das WWW
- Hypertext
- HTTP:Hypertext Transfer Protocoll
- URL
- URI
- ftp
- Server und Client
- ARPANet
- Internet
- Tim Berners Lee: Biographie
- Das W3C, die Standards im WWW
XML als Basis zu HTML und Datenstrukturierung
Einleitung
Jeder, der mit Computern zu tun hat, kennt wahrscheinlich das Problem, daß Dateien des eines Programms mit einem anderen Programm nicht geöffnet werden können oder dass Daten dabei "verstümmelt" werden.
Diese Problematik war ein Teil der Idee, die hinter der
Schaffung von HTML steckte. Im Zuge der (rasanten) Entwicklung,
die das WWW nahm stellte sich jedoch bald heraus, das HTML
für eine reine (automatisierte) Datenhaltung und
Datenverarbeitung bzw. Übermittlung nicht ausgefeilt genug
war und zuviele Interpretationen zulies. Es fehlte eine solide
Grundlage für Auszeichnungssprachen, die die Grundsätze
der Informationsverarbeitung sauber implementiert.
Einer (wenn nicht der wichtigste) dieser Grundsätze ist die
Trennung der eigentlichen Daten (Code) vom Layout, denn damit
wird eine stabile, automatisierte Datenverarbeitung erst
möglich. Diese Trennung war (bzw. ist) mit HTML eigentlich
nicht oder nur bis zu einem gewissen Grad möglich.
Formate und Sprachen
Ein Datenformat beschreibt die Art und Struktur wie ein Programm Daten auf der Festplatte ablegt. Solche Formate sind alltäglich gebrauchten Anwendungen bekannt: Zum Beispiel das ".doc"-Format von Word (sprich Word-Format, genauer z.B.: Word 2000-Format) oder analog das ".xls-Format" des Tabellenkalkulationsprogramms Excel. Diese Formate sind speziell für diese Programme entwickelt worden und man ist im Großen und Ganzen von diesen oder zumindest damit kompatiblen Programmen abhängig um zu den Informationen, die in den Dateien gespeichert sind, zu kommen. Die Information ist mit Steueranweisungen vermischt und für Menschen nicht oder zumindest kaum lesbar.
Für das World Wide Web ist dieser Ansatz nicht verwertbar. Die Dateien, in denen die Webseiten abgelegt werden, besitzen daher das einfachste Format, nämlich das jedes Zeichen nach dem sogenannten ASCII-Standard (eine der grundlegendsten Standards in der gesamten Computertechnik)ohne weiteren Zusatz abgelegt wird - es ist "reiner" Text. Man spricht hier auch von einem "Klartextformat". Damit sind keine "speziellen" Programme zur Erstellung dieser Dateien notwendig. Jeder Computer der Zeichen von einer Tastatur einlesen und auf einem Datenträger speichern kann, würde grundsätzlich reichen.
Für eine etwas höhere Benutzerfreundlichkeit verwendet man dann doch nicht die oben beschriebene Basisfunktionalität des Betriebssystems sondern einen sogenannten Texteditor. Zur HTML-Erstellung gibt es spezialisierte, die Funktionen anbieten, die einem die Erstellung erleichtern. Aber grundsätzlich gilt: HTML ist nicht an irgendein bestimmtes, kommerzielles Software-Produkt gebunden!
Eine Programmiersprache stellt Anweisungen zur Verfügung, um die Datenverarbeitung auf einem Rechner zu steuern. HTML oder auch XML ist keine Programmiersprache im eigentlichen Sinne, da HTML "nur" die Darstellung von Text mit Hilfe eines Web-Browsers (z. B. Firefox, Internet-Explorer oder Opera) steuert. Noch etwas anders ist die Sache bei XML.
XML - Extended Markup Language
Grundlegendes
XML ist dazu da, um Auszeichnungssprachen bzw. Datenstrukturen zu definieren. XML-Dateien werden wie HTML-Dateien als reiner ext abgespeichert und ist somit Plattform-unabhängig (also vom Betriebssystem) und universell einsetzbar. Zusätzlich bietet XML die Möglichkeit diese Daten automatisiert verarbeiten zu lassen. Es kann Syntax und Semantik für Computer(programme) "verständlich" gemacht werden (siehe erste Einheit). Es wird die semantische Datenstruktur quasi mitgeliefert.
Damit wird aber klar, was XML nicht ist bzw. kann: Die Art der Darstellung kann nicht gesteuert werden. Dazu gibt es spezielle sogenannte Style-Sprachen, die Elemente einer Auszeichnungssprache mit gewissen Lay-out-Eigenschaften versehen. Für HTML ist dies ein sogenannter CSS - Cascading Style Sheet.
Details
XML definiert jetzt nicht selbst Auszeichnungselemente wie etwa HTML (<br>, <h1>...), es stellt im Prinzip die Rahmenbedingungen für die Schaffung solcher Auszeichnungselemente zur Verfügung. Es stellt die Syntax-Regeln (die "Grammatik") auf. XML ist einfach und XML-Dokumente sind sowohl für Menschen wie auch für Computern lesbar.
HTML wird auf der Basis der XML-Spezifikationen neu formuliert (spezifiziert). Diese "neue" Variante von HTML wird XHTML genannt und wird jetzt bei den neuesten Programmen (Browsern) verwendet. Der gebräuchlichste HTML-Standard ist jedoch noch 4.01. Zusätzlich unterscheiden sich diese beiden nicht sehr stark und es werden von den Programmen beide unterstützt.
Grundvorraussetzung für die Verwendung von XML als Datenquelle ist eine konsequent verfolgte Strukturierung bzw. logische Gliederung meiner Daten. Genauso wie ein Schriftstück bzw. Textdokument in Kapitel, Abschnitte, Absätze usw. gegliedert werden kann, lassen sich auch Daten gliedern.
Dafür erhalte ich eine gut auf Anhieb erfassbare Webseite, die mit einfachen Mitteln ansprechend einheitlich gestaltet werden kann, was wiederum auf die Lesbarkeit sich positiv auswirkt.
Aufbau, Struktur
XML-Dateien sind wie HTML-Dateien reine Text-Dateien. Die Auszeichnung erfolgt über
selbstbestimmbare Tags, die in einer Dokumentdefinition (englisch Document Type Definition - DTD) oder
einem Schema (jeweils in einer externen Datei abgelegt) festgelegt werden und näher beschrieben
(spezifiziert) werden können. Es gibt für bestimmte Anwendungen bereits auch vorgefertigte
Dokumentdefinitionen bzw. Schemata.
Man spricht hier dann von gültigen XML (englisch: valid XML). Legt man kein Schema oder keine DTD
an spricht man von wohlgeformten XML (englisch: well-formed XML).
Ein Tag ist in spitze Klammern einzuschließen (<>) und kann Parameter aufnehmen. Die Bezeichnung sollte "lesbar" also reproduzierbar und mit dem Inhalt zu tun haben. Jeder Tag muß abgeschlossen werden, indem er mit vorangestellten Schrägstrich wiederholt wird (<tag>...</tag>).Tags können ineinander verschachtelt werden(<tag1><tag2>...</tag2></tag1>).
Ein Beispiel
Die Grundprinzipien von XML sollen jetzt anhand eines Beispieles (ein Kochbuch) erläutert werden: Die Daten eines Kochbuches lassen sich in verschiedene Bereiche gliedern. Ein Kochbuch besteht aus einzelnen Rezepten, diese wiederum haben einen Titel, eine Liste von Zutaten, eine Beschreibung der einzelnen Zubreitungsschritte... Konkret sieht dann das etwa so aus (es wird keine externe Dokumentdefinition verwendet - es handelt sich also um eine "wohlgemformte" XML-Datei):
<?xml version="1.0" standalone="yes">
<kochbuch>
<rezept kategorie="italienisch">
<titel>Spaghetti alla Cabonara</titel>
<zutaten>
<zutat>350g Spaghetti</zutat>
<zutat>2 große Eier</zutat>
<zutat>4 Scheiben Speck</zutat>
<zutat>1 Knoblauchzehe</zutat>
<zutat>3 Esslöffel Olivenöl</zutat>
</zutaten>
<vorgehensweise>
<schritt>Öl und Speck in großer Bratpfanne bei mittlerer Hitze
anbraten, bis der Speck braun und knusprig ist&</schritt>
<schritt>Eier in Schüssel verquirlen</schritt>
<schritt>Nudeln in großen Topf mit kochendem Wasser geben und bei
gelegentlichen Umrühren kochen, nach Belieben Salz
hinzugeben</schritt>
<schritt>Wasser abgießen und Nudeln zurück in
den Topf geben</schritt>
<schritt>Eier hinzufügen</schritt>
<schritt>Bei mittlerer bis geringer Hitze 2-3 Minuten
verrühren</schritt>
<schritt>Speck daruntermischen, nach Belieben würzen</schritt>
</vorgehensweise>
</rezept>
<rezept kategorie="französisch">
<titel>Flan á la Bourgogne</titel>
...
</rezept>
</kochbuch>
Um das Kochbuch zuvervollständigen gehören natürlich noch weitere Rezepte hinein. Wenn wir uns den XML-Code ansehen, sehen wir auch wo, um der Gliederung entsprechen: Wir haben "Kochbuch" als Wurzelelement, das sich in mehrere "Rezepte" verzweigt, die wiederum aus den Abschnitt "Zutaten" mit einer Liste der verschiedenen Ingredenzien besteht. Daran schließt sich die Vorgehensweise mit den einzelnen Schritten an.
Diese XML-Datei kann nun über entsprechende Dokumentvorlagen für eine Bildschirmausgabe optimiert, als Druckvorlage aufbereitet oder als Datensammlung verwendet werden.
Das Ziel ist also, mit einer in XML standardisierten Datenquelle verschiedene Aufgaben zu erfüllen: Mit Layout-Anweisungen verknüpft wird daraus eine Präsentation (z. B. Web-Seite), mit anderen Programmen werden Analysen /Auswertungen durchgeführt, mit Suchmaschinen können verwandte Daten gefunden und mit eigenen zusammengeführt werden...
Dahinter steht auch die Vision von Tim Berners Lee ein "Semantisches Web" zu bauen. Das bedeutet auch formal die Beziehungen bzw. Bedeutung der Inhalte von Computern verarbeitbar zu spezifizieren. Kurz: Eine "semantische" Suchmaschine soll "wirkliche" Fragen beantworten können (z. B.: "Welcher Zahnarzt hat am Mittwoch bis 21 Uhr Ordination?")
XML wird in Zukunft sicher einer große Rolle spielen, da es ein flexibles, viellseitig einsetzbares offenes und plattformunabhängiges Format darstellt. Es gibt ein Konsortium, welches sich um ein offenes, vollständig dokumentiertes Dokumentenformat bemüht mit dem Namen OASIS. Neueste Office-Programme, zum Beispiel OpenOffice (Offen und frei verfügbar!) oder Star Office von SUN (Textverarbeitung, Tabellenkalkulation...) verwenden bereits dieses rein auf XML basierende Datenformat.
Redaktionelle und technische Aufbereitung von Texten und Bildern
Redaktionelle Bearbeitung
Lesen am Bildschirm ist für viele Menschen ungewohnt und ungleich schwieriger als eines Textes auf Papier. Daher sind beim Verfassen von Texten verstärkt journalistische Grundlagen zu beachten, bzw. ist dies der Grund, warum "Papiertexte" nur bedingt web-tauglich sind.
Ein und der selbe Inhalt wird am Papier schneller gelesen, besser
gemerkt und damit leichter verarbeit als beim Lesen am Monitor. Nicht
zuletzt durch die höhere Beanspruchung der Augen und der Nackenmuskulatur
beim Bildschirmlesen.
Gut lesbare Texte berücksichtigen die technischen Rahmenbedingungen und
Einschränkungen des Mediums! (Karin Büchner:
Die Lesbarkeit von Bildschirmtext)
Wichtig ist hier nochmals anzumerken, dass im Web die Schrift in harter Konkurenz zu Farben, Bildern steht, mehr als in einem gedrucktem Werk: Die geöffnete Webseite ist oft nur ein geöffnestes Fenster unter vielen am Monitor, der Mensch als visuelles Wesen orientiert sich an Farben und Bildern. Bei dieser ersten "Kontaktaufnahme" werden die Grundlagen für Sympathie oder auch Antipathie gegenüber der Seite bereits gelegt - unbewusst. Die Wahrnehmung des Textes erfordert höheren Aufwand, diese Schwelle muss so niedrig wie möglich gehalten werden.
Dies kann durch erstens sprachliche und zweitens durch gestalterische Mittel erreicht werden.
Textgestaltung, Gliederung, Sprache
- "In der Kürze liegt die Würze"
- Klare, deutliche Gliederung
- Zwischenüberschriften, "Eyecatcher"
- Griffiger Titel ("Dreier-Schmäh")
- Das wichtigste zuerst! (Vorreiter oder Teaser als Zusammenfassung des Testes vorangestellt)
- Saubere Sprache
- Klar, lebendig, anschaulich
- Knapp, angemessen
- Passiv vermeiden, keine Nominalkonstruktionen
- "lebendige" Sprache
- Füllwörter vermeiden
- Kurze Sätze, keine Schachtelsätze
Bekannte Begriffe und überschaubare Sätze machen Text leichter,
schneller, müheloser lesbar und verständlich. Welche Begriffe bekannt und
verständlich sind, hängt jedoch stark von der Zielgruppe ab. Je
exakter die Sprache der Zielgruppe getroffen wird, umso höher die
Akzeptanz des Gelesenen.
(Karin Büchner:
Die Lesbarkeit von Bildschirmtext)
Auch die Zeilenlänge hat Einfluss auf die Lesbarkeit. Durch die immer weiter fortschreitende technische Entwicklung bei Bildschirmen mit höherer Auflösung und längerer Bildschirmdiagonale werden jedoch die Zeilen am Bildschirm immer länger, was dazu führen kann, dass der Leser die Zeile nicht halten kann und "springt". Eine Zeilenlänge zwischen 60 und maximal 72 Zeichen soll beachtet werden!
Lesbarkeit durch Gestaltung
Texte sollen nicht nur durch ihre Sprache, sonder auch durch optische Elemente zum Lesen einladen bzw. soll die Gliederung auch visuell leicht erfassbar sein.
Erinnern wir uns: Websurfer/innen sind im Internet unterwegs, um Probleme zu lösen bzw. bestimmte Ziele zu erreichen. Die Orientierung erfolgt visuell. Was wir zur Problemlösung in unserer Website anzubieten haben, muss sozusagen "ins Auge springen".
Diese optische Aufteilung beginnt bei der ausgiebigen Verwendung von
Absätzen, geht weiter zu Zwischenüschriften und führt zur
Platzierung von "Eye-Catchern" etwas abgesetzt vom Text.
Generell sind hier Grenzen nur durch die eigene Kreativität gegeben.
Zwischenüberschriften können durch geschickte Formulierung auch
den Wiedereinstieg in einen Text ermöglichen wenn ein Leser bereits
weiter oben ausgestiegen ist bzw. ermöglichen auch ein schnelles
optisches Scannen des Textes. Die Überschriften sind sozusagen das
inhaltliche Rückgrat des Textes, das Inhaltsverzeichnis. Dies zu
erreichen ist wiederum eine Frage der inhaltlichen Gliederung, der
Dokumentenstruktur.
Usability und Accessabillity
Die Beriffe der Usability und Accessability beschreiben die Benutzbarkeit und Zugänglichkeit eines Programmes oder hier in unserem Fall einer Website.
Im Deutschen werden diese Begriffe meist mit dem Wort "Benutzerfreundlichkeit" zusammengefasst. Die generelle Idee ist, die Oberfläche (GUI - Graphical User Interface) eines Programmes bzw. einer Website ist zum Beispiel für den Benutzer schnell erfassbar ("intuitiv"), Gleichartiges reagiert immer gleich und der Benutzer weiß wo er sich befindet, wo er sich bewegt und wie er wieder zum Ausgangspunkt zurückkommt, um ein paar der wichtigsten Punkte zu nennen.
Accessability beschreibt die Möglichkeiten, ein Programm oder eine Website auch mit gewissen Einschränkungen oder Behinderungen bedienen zu können. Das Spektrum reicht hier zum Beispiel von einem Gips duch einen gebrochenen Arm, geht weiter zur Farbenblindheit und erstreckt sich zu schwerwiegenden Behinderungen.
- Nutzen schaffen
- Zusatznutzen schaffen
- Infotainment statt Selbstinszenierung
- Für Bedienungskomfort sorgen
- Die Kund/innen nicht warten lassen
- Niemanden selektiv behindern
- Sagen, was drinnen ist
- Produkt und Verpackung nicht verwechseln
- Technische Probleme ausmerzen
- Wünsche der Kund/innen beachten
- eMail ernst nehmen und komfortabel gestalten
