Die Grundfunktionen: ein Gedankenexperiment |
Wir stellen uns einen Herbstabend 1998 vor, eine Begegnung im Cyberspace. Dieser Abend bei Anna ist (noch) eine Phantasie - bewußt dafür konstruiert, um die Anforderungen einer Cyberspace-Infrastruktur aufzuspüren. Drei Menschen unterhalten sich, tauschen einige Informationen aus und gehen schließlich ihre Wege. Annas aktualisierbare Kunstwerke, Bernds digitales Brettspiel und Claras ungezogener Kanarienvogel spielen hier in aller Bescheidenheit die Rolle von Einsteins Trambahn oder Schrödingers Katze: Sie sollen möglichst plastisch etwas darstellen, das wegen seiner Komplexität sonst ziemlich schwierig zu visualisieren ist, nämlich die vielfältigen Anforderungen, die eine GevU an ihre technische Infrastruktur stellt.
Dabei halten wir fest: Die notwendige Technologie, um die Story von Anna und ihrem Besuch zu realisieren, ist entweder schon vorhanden oder eifrig in Arbeit; höchstwahrscheinlich wird auch dieses Geschichtchen noch vor Ende 1998 in der Vergangenheitsform berichtet werden können. Aber hier, wie in den anderen Beispielen, sind die einzelnen Details nicht von Bedeutung. Es geht um die Basisfunktionalität, die solche Szenarien implizieren.
Anna ist allein zu Hause in ihrem neu eingerichteten digitalen Wohnzimmer. Die Stereoanlage spielt eine Nocturne, während Anna langsam im Zimmer herumschlendert, die neuen Radierungen an den Wänden betrachtend, die, wie immer Freitag nachmittags, vom Service-Unternehmen in Kassel gerade automatisch erneuert wurden.
Tatsächlich sitzt Anna in einem Hotel in Aachen und wählt sich bei einem Netzbetreiber ein, der ihr den Zugang zu ihrem virtuellen Zuhause per Laptop, Modem und Telefonnetz verschafft. Die VRML-Dateien, in denen Annas Wohnzimmer definiert werden, stehen nämlich auf einem Server in Stuttgart.
Die Grundstruktur des Zimmers wurde von einem Cyberarchitekten entworfen, im Auftrag von Annas Internet-Provider. Die Bilderrahmen wurden mitgeliefert, nicht aber die von ihnen umrahmten Bilder. Jeder Rahmen enthält nämlich einen Anchor, der auf eine URL beim Kassler Kunstvermieter zeigt. Freitags braucht dieser lediglich seine Bilder umzubenennen, damit seine Kunden neue Werke an ihre Online-Wände bekommen. Architekt und Kunstvermieter haben weiterhin vereinbart, für jedes Bild mehrere Detailebenen (LoD) zu liefern; Anna kann so ihre Online-Bilder tatsächlich näher und genauer betrachten, als sie die Originale im Museum je könnte.
Nicht mehr ,,allein zu Hause" |
So weit, so gut. Nur etwas einsam ist es - wie jeder Besuch in das WWW, wo man zwar jede Menge Bilder zu bestaunen bekommt, aber andere Menschen nur sozusagen aus zweiter Hand - d.h. durch ihre Exponate - erlebt. Dies ist das etablierte Revier von VRML97. Um die Grenzen dieses Reviers zu überwueren und so die Aufgabe der Living-Worlds-WG aufzuspüren, müssen wir Annas abendliche Ruhe stören.
Es klopft bei Anna an der Tür. Per Mausklick macht sie die Tür auf und sieht ihre bekannte Nachbarschaft, eine Straße mit vielen anderen Häusern diverser Stilrichtungen. Anna merkt, daß beim Nachbar ein neues Auto in der Einfahrt steht. Vor ihrer Tür stehen zwei menschenähnliche Figuren.
Zunächst hört sich dies noch simpel genug an. Das Anklopfen ist ein Klang wie vom Stereo, und das Türöffnen ziemlich ähnlich wie das Austauschen eines Bildes, wenn man sich ihm annähert. Da gibt es aber einen alles entscheidenden Unterschied: dieses Mal hat jemand anders geklopft.
Bernd sitzt vor seinem PC in Berlin, auf dem er das Außenbild von Annas virtuellem Eigenheim sieht. Wenn er mit der Maus auf Annas Haustür klickt, sendet das Türobjekt in seinem PC eine Nachricht an Annas Server in Stuttgart, der das Klopfsignal an Annas Laptop weiterleitet. Dort kommt es beim Türobjekt auf Annas Laptop an, das daraufhin sein Klopfgeräusch für Anna abspielt und gleichzeitig veranlaßt, daß der ISP diesen Klang auch an alle andere Benutzer sendet, die sich zur Zeit im vordefinierten Hörbereich des Klopfklangs befinden (zur Zeit stehen die Kennungen von Bernd und Clara auf dieser Liste). Als Anna dann selbst die Tür anklickt, erkennt das Türobjekt ihren Klick als von ,,innen" kommend, und statt nochmal das Klopfgeräusch zu erzeugen, ruft sein Script Tür_öffnen auf.
Das Script, das die Tür öffnet n, hat sowohl lokale als auch Netzfunktionen. Lokal ruft es den Klang zum Aufsperren und Öffnen der Tür auf, samt der Animation, mit der die Tür aufschwingt. Aber zuerst fordert es die Ansicht von Annas digitaler Nachbarschaft aus dem lokalen Cache auf und bittet den Umgebungsserver um alle relevanten Updates (so wird das neue Auto in der gegenüberliegenden Einfahrt plaziert). Auch die Avatare von Bernd und Clara müssen von ihren jeweiligen Servern geladen und vor Annas Tür plaziert werden. All dies muß so schnell passieren, daß Anna, wenn die Tür aufschwingt, nicht in einen leeren Raum blickt.
Und das ganze muß gleichzeitig komplementär auf Bernds und Claras Rechner nachvollzogen werden: Kopien des Skripts zum Öffnen von Annas Tür müssen besorgt und abgespielt werden sowie lokale Instanzen von Annas Avatar und Wohnzimmer einschließlich des von außen sichtbaren Teil des Mobilars.
Anna erkennt eine der Figuren sofort als den Avatar ihres Büronachbars Bernd. Sie zeigt mit der Maus auf die andere, und bekommt am Bildschirm die Auskunft, daß es sich um Bernds Freundin Clara handelt.
Avatare sind Objekte, die von realen Menschen in Echtzeit gesteuert werden. Dies zu ermöglichen ist nicht gerade trivial. Es ist einfach (wenn auch nicht leicht!), eine Figur, die Bernd darstellen soll, abzurufen und auf Annas Türschwelle zu plazieren. Es ist aber schon eine Herausforderung, den Ort und die Orientierung dieser Figur auf Annas Bildschirm in Aachen von Bernds Schreibtisch in Berlin aus steuern zu lassen: Ihn z.B. durch die Tür und in Annas Wohnzimmer treten zu lassen. Dies bedeutet, daß der VRML-Szenengraph auf jedem Client im Prinzip von jedem anderen Client aus dynamisch modifizierbar sein muß.
Das ist etwas ganz anderes als die geplanten Bild-Updates, die von Annas Cyber-Architekten von vorneherein vorgesehen waren. Die Bilderrahmen legen die genaue Plazierung und sogar die Dateinamen ihrer Bilder fest. Ein Bild wechselt nur, wenn sich die Dateien, auf die sein Anchor verweist, ändern. Dagegen ist die Plazierung eines Avatars in der Szene überhaupt nicht fest. Sie ändert sich ständig und, aus Sicht des Systems, willkürlich, da sie von einem Menschen live bestimmt wird. Auch in sich selbst sind die Avatare dynamisch, mit animierten Gesten, die der Benutzer ebenso willkürlich aufrufen kann.
Bernds Avatar ist das neueste Modell aus dem Quelle-Katalog. Claras Avatar ist ihre eigene Kreation, aus Teilen von einem Avatar Bausatz gebastelt. Auf ihrer virtuellen Schulter hat sie ein besonderes Modeaccessoire gefertigt, ein bunter Kanarienvogel, der allgemein gelobt wird. Anna bittet beide einzutreten.
Für jeden neuen Besucher in einer Szene wird ein Avatar eingefügt. Sie sind ursprünglich nicht Teil der Szene, sondern werden irgendwo nach irgendwelchen Kriterien kreiert und dann sozusagen in die Welt losgelassen. In aller Regel werden sie also nicht im Hinblick auf eine spezielle Szene entworfen. Wie und unter wessen Kontrolle passiert dieses Einfügen in die Szene und mit welchen Auswirkungen? Erhält die Szene dadurch nur zwei neue Benutzer oder eher sogar zwei neue Autoren?
Plötzlich scheint der Kanarienvogel auf Claras Schulter aufzuwachen.
Er streckt seine Flügel und für einige Sekunden fliegt er wild im Zimmer herum. Schließlich landet er oben auf dem Whiteboard, von wo aus er ein heiteres Zwitschern von sich gibt.
Der Vogel ist ein Softwareroboter - eine Art animierter Softwareagent. Claras ,,Robo-Vogel" bringt etwas Neues ins Spiel: aktive Objekte, die eine Szene betreten können, ohne von einer bestimmten Person in Echtzeit gesteuert zu werden. Die Mechanismen, mit denen Personen ihre Avatare in der GevU herumsteuern, können von einem guten Entwickler auch dazu benutzt werden, selbstgetriebene Objekte zu schaffen, die eine Szene gleichberechtigt zu den Avataren betreten und dort aktiv werden können.
Hier stellt sich wieder die Frage nach der Autorenverantwortung: Wer hat den Robo-Vogel programmiert und zu welchem Zweck? Das unerwartete Verhalten des Vogels bringt eine andere, potentiell noch beunruhigendere Frage auf: Wer steckt eigentlich hinter dem Avatar, der vorgibt, für Clara zu sprechen? Wie kann Anna (oder sogar ihr Freund Bernd) da sicher sein?
Vertrauen ist gut ... |
Digitale Authentifikation ist im Internet bereits eine etablierte Technologie. In anderem Zusammenhang wird sie bereits benutzt, um kommerzielle Online-Transaktionen sicher zu machen. Die Zertifizierung erfolgt völlig generisch. Sie erlaubt jeder Person (oder Komponente), eine lokale Funktion auszuführen, die prüft, ob Teile eines verschlüsselten Dokuments verändert worden sind. Das Dokument muß dazu vorher durch eine Zertifizierungsstelle sozusagen notariell beglaubigt worden. Der Schlüssel wird dabei mit im Zertifikat abgelegt.
Solche Zertifikate können genauso gut in einer virtuellen Kreditkarte enthalten werden, um damit sicherzustellen, daß nur der rechtmäßige Besitzer sie benutzt. Oder sie können sogar in einem virtuellen Handschlag kodiert sein, um zu belegen, daß die grafische Figur, die Bernd als Claras Avatar ansieht, tatsächlich von seiner Freundin gesteuert wird, und nicht von irgendeinem Scherzkeks oder Betrüger.
Bernd hat ein virtuelles Monopolyspiel mitgebracht. Den Spielwürfeln wurde ein elektronisches Zertifikat von VeriPlay, einer unabhängigen Testorganisation, beigelegt, daß sie statistisch gesehen wirklich zufällig rollen.
Viele Anwendungen in digitalen Welten werden davon abhängen, daß sie auf eine verläßliche Weise auf die materielle Welt verweisen. Es wird wichtig sein, Objekte in einer GevU direkt und dynamisch mit externen Daten und Funktionen verbinden zu können, sei es, um die Identität eines virtuellen Besuchers mit einem realen Kontostand zu verbinden oder einen Online-Katalog von einer entfernten Datenbank aus zu erneuern. Die ganze Bandbreite von kommerziellen Transaktionen und geschäftlichen Beziehungen wird davon abhängen, daß die GevU in der Lage ist, zuverlässige Pfade zwischen (und Schranken um) ihre vielen digitalen und materiellen Teilnehmer aufzubauen.
Mit den digitalen Würfeln wird jetzt neben Annas regelmäßig ausgetauschten Kupferstichen und den willkürlich angekommenen Avataren (samt undurchschaubarem Vogel) noch eine weitere externe Referenz in die Szene gebracht. Ein portables, wiederverwendbares Objekt, für das von dritter Seite garantiert wird, daß es eine bestimmte, spezifizierte Eigenschaft besitzt. Andere Möglichkeiten liegen nahe: Ein Kartenspiel, das gewährleistet, immer ehrlich zu mischen und nur von oben abzuheben; oder eine Registrierkasse, die sichere und anonyme Transaktionen garantiert.
Bernds virtuelles Monopolyspiel hat einige Features, die es von seinem populären Vorgänger in der realen Welt abheben. Hier hat das Spielbrett einen Eintauch-Modus, in dem die Spieler schrumpfen, so daß die Elemente des Spiels, die Tokens und die Orte auf dem Spielfeld lebensgroß erscheinen.
Wie wissen die verschiedenen Browser (Anna nutzt Netscape, Bernd hat Microsoft und Clara Silicon Graphics), wie weit sie die jeweiligen Avatare schrumpfen müssen und wie ihre Positionen und Bewegungsgeschwindigkeiten anzupassen sind? Oder, falls die Schrumpfung dadurch realisiert wird, daß die Spieler in eine anders dimensionierte Szene versetzt werden, wie werden dann die Aktionen in dieser Szene auf dem Spielbrett in Annas Wohnzimmer repliziert?
Eine in mehrfacher Hinsicht bewegte Diskussion entfacht sich: Anna und Bernd chatten (d.h., sie tippen Kurzmeldungen, die auf dem Bildschirm des jeweils anderen erscheinen), während Claras Avatar Grimassen dazu schneidet. Clara gibt auch noch einen sprachlichen Kommentar ab, wohlwissend, daß nur Anna ihn hören wird. Alle drei Avatare gestikulieren in einem fort.
Clara benutzt das Mikrofon und die Internet-Telefonsoftware ihres Rechners um ihre Kommentare abzugeben. Mit Bernds Taubheit kann sie rechnen, da sie weiß, daß sein Büro-PC keine Soundkarte hat. Aber wie weiß Claras Client, ob Anna (die Clara jetzt zum ersten Mal begegnet) eine Audio-Funktionalität hat? Wie wird diese aktiviert? Wie erfolgt die nötige Synchronisation, z.B. das Mischen von Claras Stimme mit der Hintergrundmusik oder das Ändern des Gesichtsausdrucks an einem Avatar durch die Auswahl einer Gestik?
Auch Avatare können einige grundlegende soziale Gesten zeigen (Hallo!/Tschüß!, Ja/Nein, Wie bitte?/Danke!, Hurra!/Buh!). Diese Gesten können entweder durch einen Mausklick auf dem Bildschirm oder durch Eintippen von Emoticons in der Chat-Box - wie z.B. ;-) für ein Augenzwinkern - aktiviert werden. Umgekehrt wird für jede Geste automatisch eine textuelle Erläuterung erzeugt, für den Fall, daß die Animation doch nicht selbsterklärend ist. Und selbst wenn gerade keine bestimmte Geste aktiviert ist, machen die Avatare ständig kleine Bewegungen, um sie möglichst lebendig erscheinen zu lassen.
Um etwas zu erklären, zeichnet Anna ein Bild auf ihr digitales Whiteboard, das sie gerade im Büromöbelgeschäft gekauft hat. Sowohl Bernd als auch Clara können sehen, was sie zeichnet, aber nur Bernd kann auch mitzeichnen, weil Claras PC weder die Whiteboard-Anwendung noch die dazu erforderlichen Stift und Zeichenunterlage hat. Das Whiteboard findet sie aber faszinierend und will wissen, wo man so etwas bekommen kann.
Nicht alle Besucher in der GevU werden die gleichen Ressourcen haben. Manche Software kann sogar eine spezielle Hardware erfordern (vgl. Berds fehlende Soundkarte). Die Infrastruktur soll eine Liste der diversen Interaktionsmöglichkeiten aller Besucher in der Szene führen, mit ihren jeweiligen Voraussetzungen. Im obigen Beispiel haben Anna und Bernd beide die für ein digitales Whiteboard erforderliche Hard- und Software mit Griffel und Tableau. Clara hat sie nicht, aber die Infrastruktur sorgt dafür, daß sie wenigstens ein immer wieder aktualisiertes Abbild dessen zu sehen bekommt, was die anderen beiden editieren. Bernd dagegen bekommt keine textuelle Umsetzung von Claras Kommentaren (obwohl so etwas bis Herbst 1998 wohl im Bereich des Möglichen liegt).
Als das Monopolyspiel zu Ende ist, verabschiedet Anna ihre Gäste, die noch einen gemeinsamen Nachtspaziergang vorhaben. Beim Aufräumen entdeckt sie, daß Claras Vogel ein kleines Geschenk auf dem Whiteboard hinterlassen hat: ein rundes, leuchtendes, blaues Ei. Anna klickt mit der Maus auf das Ei, und - siehe da - es zittert ein bißchen, kriegt dann einen Sprung, und heraus klettern ein Dutzend archaischer Krieger, die wild mit ihren Schwertern um sich schlagen, dabei den Kaffeetisch umwerfen und sämtliche Bilder von den Wänden holen, bevor sie zur Tür hinaus laufen und in der Nacht verschwinden.
Im Cyberspace kann das, was im Hacker-Jargon ein trojanisches Pferd genannt wird, wirklich seinem Namen gerecht werden... Erst erschleicht sich das Programm, verkleidet als etwas Harmloses (vielleicht als Email von einer Freundin, oder, wie in diesem Fall, als ihr Lieblingsvogel), Eintritt in das System. Einmal drinnen deponiert es eine Zeitbombe, die ihre Arbeit tun wird, lange nachdem der Täter die Szene wieder verlassen hat. Virtuelle Mehrbenutzerwelten sind hier wie jede andere verteilte Anwendung: Um sie seriös betreiben zu können, wird ein Satz von Schutzmechanismen gegen unerlaubten Zugriff und unerlaubte Änderungen benötigt.
Das Problem ist eigentlich inhärent in der Natur einer gemeinsam gestaltbaren Umgebung. Jeder Besucher, der bleibende Änderungen an einer digitalen Szene vornehmen kann, wird de facto zu einem ihrer Autoren. Besucher, die so viel Macht haben, müssen sich entweder der Disziplin der jeweiligen Welt unterwerfen oder als potentielle Saboteure betrachtet werden. Wenn man andererseits Besuchern jede Form von bleibendem Einfluß auf ihre Umgebung versagt, wie lange werden sie dann wohl noch interessiert sein?
Um Beiträge von aktiven Besuchern zulassen zu können, ohne gleich die ganze virtuelle Welt jedem vorbeisurfenden Böswilligen auszuliefern, muß die Infrastruktur für verläßliche Pfade innerhalb des Systems sorgen, d.h. eine Nachricht von Komponente A auf Annas Rechner darf nicht so manipuliert werden können, daß sie von Komponente B oder von Bernds Rechner zu kommen scheint.
Um solche Pfade einzurichten, müssen kritische Komponenten in die Lage versetzt werden, Sicherheitsüberprüfungen für verschiedene Klassen von Nachrichten durchzuführen. Bearbeitet werden dann nur die Nachrichten, die die Prüfung bestanden haben. In Fällen, wo ein Audit Trail genauso wichtig wie der Schutz gegen Mißbrauch ist, kann man auch Post-Condition-Tests einbauen, die prüfen, ob ein Schaden entstanden ist.
Grundsätzlich ist diese Sicherheitsmechanik genau wie das Authentifikationsproblem für andere Netzanwendungen schon gut verstanden. Sie für virtuelle Welten zu realisieren besteht im wesentlichen darin, bekannte Verfahren nachzuimplementieren. Aber das unterstreicht nur die generelle Aussage, daß der Aufbau virtueller Welten weit mehr Funktionalität erfordert, als VRML derzeit liefert.
Während Anna sich mit einer Invasion homerischer Helden auseinandersetzt, entscheiden Bernd und Clara, sich in der Stadt umzusehen. Der animierte Stadtplan berichtet, daß beim Club49 heute ziemlich tote Hose herrscht. Dagegen soll gerade heute in der MYSTischen Höhle die sich immer fortentwickelnde Story einen neuen Höhepunkt erreichen. Die beiden lassen sich sofort dorthin beamen, um nichts zu versäumen.
Die wenigen schon existierenden GevU sind ziemlich isolierte Angelegenheiten. Sie haben meistens keine funktionalen Bezüge nach außerhalb; eine Technologie, mit der man einen nächtlichen Stadtbummel planen und auch ausführen könnte, wie dies sich Bernd und Clara vorstellen, existiert noch nicht. Je reicher die Möglichkeiten einer GevU sind, um so wahrscheinlicher ist es, daß diese Möglichkeiten nur in jener einzigen Welt realisiert wurden. Die Lösungen sind proprietär, mit speziellen Benutzerschnittstellen; viele Avatare funktionieren nur in der GevU, für die sie gebaut wurden. Auch bieten die heutigen GevUs kaum so etwas wie eine dauerhafte Kontinuität: Ist eine Sitzung zu Ende, so wird die Welt entweder abgeschaltet oder ein Spiel mit neuen Spielern neu gestartet, ohne Erinnerung an vorherige Spiele.
Unsere soziale Wirklichkeit wird aber vor allem durch zwischenmenschliche Beziehungen auf der Basis gemeinsamer Erfahrungen gestaltet. Solche Beziehungen müssen erst in virtuellen Welten explizit ermöglicht werden. Systeme, die ein breites Publikum gewinnen wollen, sollten sich an den gemeinsamen Gestaltungsmöglichkeiten der (bisher nur in simplen Texten gestalteten) MUD/MOO-Welten orientieren. Sowohl historische Tiefe als auch Verbindungen zwischen Gemeinschaften werden unentbehrlich sein.
Digitale Umgebungen werden auch besondere Mittel zur Navigation benötigen, damit Besucher herausfinden können, was es zu sehen gibt, und ob es sich lohnt, den Weg dorthin zu machen. Das gleiche gilt für Transportmittel, die Personen schnell zu den Ereignissen oder Orten beamen können, die sie interessieren. Und, obwohl dies in Annas Wohnzimmer noch keine Rolle spielte, in realen Anwendungen (wie in den vorangegangenen Beispielen beschrieben) werden virtuelle Welten Möglichkeiten brauchen, um ihren Bau, ihre Benutzung und ihre Weiterentwicklung zu finanzieren.