Hans Dieter Huber
Lets mix all feelings together!" - Ansätze zu einer Theorie multimedialer Systeme.

 

erschienen In: Klaus Rehkämper, Klaus Sachs-Hombach (Hg.). Bildgrammatik. Interdisziplinäre Forschungen zur Syntax bildlicher Darstellungssysteme. Magdeburg: Scriptum Verlag 1999; S.297-314

I

Einleitung und Begriffsklärung

Unter einer Grammatik versteht man für gewöhnlich entweder die Beschreibung der Struktur einer Sprache als Teil der Sprachwissenschaft, oder das Werk, in dem diese Sprachregeln aufgezeichnet sind.1 Das Wort Grammatik bedeutete ursprünglich die Fertigkeit des Lesens, wurde aber schon früh als ein Wissen von der Sprache verstanden.2 Will man eine Grammatik der Bilder entwickeln, dann kann man dies einerseits analog zur Tradition der Grammatik der Schriftsprachen tun, oder aber in expliziter Differenz zur Schrift. Grammatiken beginnen gewöhnlich bei den kleinsten Elementen der Sprache, dem Laut und dem Buchstaben, führen dann über die Wortarten und die Wortbildung zum Satz als der letzten, großen, grammatikalischen Einheit der Sprache.

Wenn man behauptet, daß Bilder eine eigenständige Sprache besitzen, dann stellt sich die Frage, wie man die Strukturen einer solchen Sprache beschreiben könnte, bzw. wie man ein Werk verfassen könnte, das eine Grammatik des Bildes wäre, in der diese Regeln (sofern es sie denn gibt) aufgezeichnet sind. Dabei gilt es zu fragen, ob die Sprache der Bilder eine Sprache ist oder ob es sich um verschiedene Sprachen handelt. Kann man z. B. sagen, daß jedes Medium eine eigene Sprache besitzt? in einem gewissen Sinne schon. In einem anderen Sinne aber auch wieder nicht. Die Frage der Übersetzung bzw. Interpretation solcher Sachverhalte stellt sich hier auf eine ganz andere Weise, nämlich als eine Form radikaler Übersetzung bzw. Interpretation von einem Medium in ein anderes, von einem visuellen in ein schriftsprachliches. Der Begriff der radical translation wurde 1960 von dem amerikanischen Sprachphilosophen Willard van Orman Quine als ein hypothetisches Konstrukt entwickelt, um zu zeigen, daß die Hypothesen oder Vorannahmen, mit deren Hilfe man von einer Sprache in eine andere übersetzt, gegenüber allen empirisch beobachtbaren und bestimmbaren Sachverhalten auf immer und ewig unterbestimmt bleiben. Es gibt keine Möglichkeit, diese Übersetzungshypothesen gegenüber dem zu übersetzenden Material zu verifizieren. Dieses Problem führt zur Unbestimmbarkeit der Übersetzung (indeterminacy of translation) und damit zur ontologischen Relativität sämtlicher Beschreibungssysteme.

Das Konzept einer radikalen Bildgrammatik stellt daher eine Kennzeichnung dieser Problematik im Falle einer Bildsprache dar. Radikale Interpretation meint daher die Übersetzung visueller Unterscheidungen und Beobachtungen in die Schriftsprache des Beobachters. Glechzeitig wird mit dem Adjektiv 'radikal' auf eine gewisse Parallelität zu den bei Quine diskutierten Problemen der Unbestimmbarkeit der Übersetzung gegenüber dem empirischen Ausgangsmaterial und der daraus resultierenden ontologischen Relativität hingewiesen.

Ich werde die Grammatik des Bildes beim Beobachter beginnen lassen und seiner Fertigkeit beim Lesen und Verstehen von Bildern. Denn er ist es, der einzelne Bilder, ihre Grundelemente und ihre Interaktionen voneinander unterscheidet. Daran schließt sich der Versuch an, die kleinsten Grundelemente von Bildern zu bestimmen sowie das, was im Bild vielleicht den verschiedenen Wortarten einer Sprache entspräche. Die Bilder selbst entsprächen in dieser Analogie einem Wort, das aus seinen Elementen (den Buchstaben) zusammengesetzt ist. Den verschiedenen Wortarten der Sprache entsprechen verschiedene Medien mit verschiedenen visuellen Funktionen. Was entspricht bei Bildern aber der Struktur eines Satzes? Es sind die Interaktionen zwischen verschiedenen Bildern, die sich nebeneinander auf einer Zeitschriftenseite oder in einem Museum befinden.

Die Argumentionen einer Bildgrammatik sind zunächst unhistorisch, da sie von der Gegenwart ausgehen und eine logische Struktur der Bildsprache entwickeln. Aber dies gilt selbstverständlich auch für jede andere Grammatik einer Schriftsprache. Das bedeutet, daß die zu entwickelnde Bildgrammatik durch eine Archäologie ihrer grammatikalischen Strukturen, ihrer historischen Genese Ergänzung, Unterstützung, Bestätigung, Modifizierung oder Falsifizierung finden müßte oder könnte. Aber da man bekanntlich immer irgendwo beginnen muß, beginne ich in der Gegenwart, hier und jetzt.

Eine zentrale Motivation speist sich aus der gegenwärtig aktuellen Frage nach Möglichkeiten und Funktionen einer allgemeinen Bildwissenschaft. Wir befinden uns heute in einem Zeitalter des information overload, in dem spezifische Strategien der Informationsselektion und -distribution eine entscheidende Rolle spielen. Einige autoren haben in Analogie zum linguistic turn3 der sprachanalytischen Philosophie der 60er Jahre von einem pictorial turn4 oder einem iconic turn5 gesprochen. Die meisten Bilder, denen wir heute tagtäglich begegnen, sind allerdings überhaupt keine Kunstwerke, sondern nur Bilderflut oder Informationsmaterial. Kunstwerke stellen vielmehr eine besondere, durch ihre gesellschaftliche Bedeutung ausgewiesene Gattung von Bildern dar. Sie sind jedoch immer schon von Alltagsbildern umgeben gewesen und stehen in einer engen Beziehung zu deren spezifischen Produktions- und Rezeptionsbedingungen.

In der Geschichte der modernen Kunst vom ready-made bis zur Kontextkunst findet man genügend Beispiele dafür, daß der Unterschied zwischen Kunst und Nicht-Kunst nicht in irgendeiner materiellen Eigenschaft besonderer Objekte begründet sein kann, sondern grundsätzlich in einem anderen Bereich zu suchen ist. Bedeutung entsteht nämlich erst aus den spezifischen Operationen eines Beobachters im Rahmen eines spezifisch sozialen Bezugssystems oder Kontextes. Bedeutungen werden immer von einem Beobachter konstruiert. Sie sind nur aus diesem Kontext oder Bezugssystem heraus verständlich, innerhalb dessen sie voneinander unterschieden und augefasst werden können.

Wenn jemand eine Leinwand aufspannt, ein Blatt Papier in die Hand nimmt, ein Stück Holz in den Schraubstock einspannt, einen Film in eine Kamera einlegt, eine Kassette in einen Recorder schiebt oder seinen PC bootet, dann entsteht eine Grundkonstellation, aus der heraus man Bilder erzeugen kann. Diese Grundkonstellation, wie ich sie nennen möchte, und wie sie sich beispielhaft am Verhältnis von Recorder und Kassette manifestiert, ist der Ausgangspunkt der Bildproduktion. Am Anfang steht also ein technischer Apparat, ein Medium, dessen faktische Bedingungen und potentielle Möglichkeiten von vorneherein darüber entscheiden, wie ein damit erzeugtes Bild überhaupt aussehen kann bzw. wie es auf gar keinen Fall jemals wird aussehen können.

Man kann die Leinwand bemalen, das Papier beschreiben oder bezeichnen, das Holz schnitzen, den Film belichten, die Kassette bespielen und die Diskette kopieren. Erst durch diese Tätigkeiten entstehen Bilder, die medienspezifische Formen besitzen. Das ist der Ausgangspunkt für alles weitere. Erst durch die entstandene Bildform ist wiederum ein Rückschluss auf das zugrundeliegende Medium möglich. Das gleiche Stück Schreibmaschinenpapier kann als Medium der Schrift, der Handzeichnung, des Buchdrucks, der Druckgraphik, der Fotokopie oder als skulpturales Medium verwendet werden.

 

II

Der Beobachter des Systems

Alle Unterscheidungen und Differenzierungen, die getroffen werden, sind die Unterscheidungen eines bestimmten Beobachters. Dieser Beobachter ist historisch determiniert durch das, was man als seine Biographie, sein Bildungsniveau, seine Sozialisierung oder seine Kultur bezeichnen kann. Unterscheiden ist das einfache Herstellen einer Differenz, sei es eines Temperaturunterschiedes, eines Druckunterschiedes, eines Helligkeitsunterschiedes, eines Farbunterschiedes, eines Größenunterschiedes oder eines Höhenunterschiedes, usw. Wichtig für die Entwicklung einer Bildgrammatik scheinen mir zwei Dinge zu sein: Einmal ist das Erzeugen von Differenzen auch einfachen operierenden Systemen wie Zellen, Oberflächen oder Sensoren möglich. Das Herstellen eines Unterschiedes ist also nicht an die menschliche Unterscheidungsfähigkeit gebunden, sondern kann auch von einfachen Maschinen durchgeführt werden. Dies ist für die Entwicklung intelligenter Sensorik und Bilderkennungssysteme von grundlegender Bedeutung.6

Beobachten wird differenztheoretisch als Vorgang des Unterscheidens und Bezeichnens einer Seite des Unterschiedenen verstanden. Beobachten ist also das Bezeichnen einer Differenz. Differenzen besitzen immer zwei Seiten. So kann ein Beobachter bei einer dargestellten Figur seine Aufmerksamkeit entweder auf die Figur selbst richten oder auf die Außenseite der Figur. (Abb. Knoebel: Figurenbild 16, 1985, und 2 Schemata) Es ist aber nicht möglich, beide Seiten der Differenz gleichzeitig zu sehen. Dies funktioniert nur als bezeichnete Seite einer neuen Unterscheidung. Denn wendet man sich beiden Seiten gleichzeitig zu, wird die zuvor erzeugte Differenz wieder ausgelöscht.7 Formen, die durch die Unterscheidung eines Beobachters entstehen, sind daher sog. Zwei-Seiten-Formen. Sie stehen auf der einen Seite in einem Verhältnis zu dem, was auf ihrer Innenseite sichtbar gemacht und artikuliert wird und auf der anderen Seite zu dem, was gleichzeitig als latente, unartikulierte Außenseite zum Verschwinden gebracht, unsichtbar gemacht und ausgeblendet wird. Formen sind paradoxe Hybride, die gleichzeitig auf einer Struktur der Inklusion und einer Struktur der Exklusion beruhen.

An dieser Stelle kann festgehalten werden, daß erst der tatsächliche Vorgang der Beobachtung die Gegenstände erzeugt, die wir ein Bild nennen. Bilder können nur als Resultate kognitiver Konstruktionen eines bestimmten historischen Beobachters verstanden werden. in diesem Sinne sind Bilder mental und existieren nur im kognitiven System eines Beobachters. Dieses kognitive System funktioniert aber aus bestimmten Gründen so, als würden diese Bilder draußen in der Realität existieren und als hätten sie beobachtungsunabhängige Eigenschaften.8

Wer ist nun dieser Beobachter, von dem hier die Rede ist? Entweder kann man ihn als eine bestimmte, historische Person namhaft machen oder man ist selbst als Sprecher oder Autor der Beobachter, von dem die Rede ist. Historische Beobachter können nur als Textfunktion aufgespürt werden.

 

III

Die Elemente des Systems

Flächen

Wenn man bei zweidimensionalen Bildern als der einfachsten und reduziertesten Form von Bildern beginnt, kann man zunächst von einer Grundunterscheidung ausgehen, nämlich der Differenz zwischen einer bezeichneten Innenseite des Bildes und seiner unbezeichneten Außenseite.9 Dieser Unterschied schneidet in den unmarked space des Raum-Zeit-Kontinuums ein und markiert eine Grenze als Resultat einer kognitiven Konstruktionsleistung des Beobachters. Dabei sind alle möglichen Flächen denkbar. Unendlich viele sind möglich. Aber immer nur eine einzige, und das ist das Entscheidende für die grammatikalische Struktur von Bildern, wird für ein Bild als erste Primärunterscheidung ausgewählt.

Diese markierte Fläche eines Bildes ist zunächst noch unbezeichnet und undifferenziert. Erst durch Einschreibung weiterer Differenzen und deren stabiler Fixierung im Medium kann sie mit verschiedenen Formen angefüllt werden.10 Diese Formen können unendlich vielfältig sein. Erst durch die Sättigung eines marked space mit Formen (die ebenfalls unendliche Möglichkeiten besitzen), erhält das Bild eine bestimmte grammatikalische Struktur. Das abstrakte Schema wird zu einer konkreten, visuellen Aussage. Den grammatikalischen Strukturen eines Bildes ist daher von Beginn an eine grundlegende Unbestimmbarkeit zu eigen. Denn erst die radikale Interpretation eines Beobachters entscheidet über Materialität und Bedeutung des Bildes. Bilder sind also in einen unendlichen Horizont von Möglichkeiten eingebettet, der erst durch eine konkrete Konstruktion eine bestimmte Materialiät, eine bestimmte Größe und eine bestimmte Bedeutung erhält.

 

Formen

Nach den Formtheorien von George Spencer Brown, Niklas Luhmann und Dirck Baecker kann man Formen als Zwei-Seiten-Formen auffassen. Durch die Bezeichnung der einen Seite eines Unterschiedes oder einer Differenz entstehen jeweils eine Innenseite und eine Außenseite dieser Form, ein marked state und ein unmarked state, wie es Spencer Brown in seine "Laws of Form" formuliert hat.11 Je nachdem, welcher Seite man als Beobachter seine Aufmerksamkeit zuwendet, ergibt sich eine fundamental andere Beobachtungssituation. Die Einheit der Unterscheidung selbst ist aber in diesem Moment nicht beobachtbar. Sie wird von der markierten Innenseite der Unterscheidung verdeckt. (Bsp. Luca Patella: Vasa physionomica, 1982-83) Im Gegensatz zu sprachlichen Elementen sind Formen nicht abgegrenzt oder diskontinuierlich. Sie basieren nicht auf Pausen oder Lücken zwischen den Buchstaben, sondern sind konkret, kontinuierlich und übergänglich. Ihre Grenzen müssen daher in einem Akt der Unterscheidung gesetzt werden. Erst der Beobachter macht durch seine Unterscheidungen Formen diskontinuierlich und grenzt sie von der latenten Außenseite ab. Seine Unterscheidungen können mit unterschiedlicher Leichtigkeit revidiert und neu gesetzt werden.12 Es gibt also, insgesamt gesehen, unterschiedliche Grade von Auflösungsresistenz gegenüber einmal getroffenen Unterscheidungen. Dies hängt neben vielen anderen Faktoren unter anderem auch vom sog. kognitiven Stil des jeweiligen Beobachters ab.13 In der Kognitionspsychologie wird zwischen sogenannten Visualisierern und sog. Konzeptualisierern unterscheiden. Hierbei handelt es sich um unterschiedliche kognitive Orientierungen, die als Gewohnheiten in konkreten Wahrnehmungsituationen durchschlagen.

 

Farben

Nach neueren Erkenntnissen der Gehirnforschung scheint es der Fall zu sein, daß Farbeindrücke in anderen Gehirnregionen prozeßiert werden als Hell-Dunkel-Unterschiede und Bewegungen.14 Farben sind in der Beobachtung jedoch stets an Formen gekoppelt. Umgekehrt muß auch jede Form eine Farbe besitzen. Wie es keine Farbe ohne Form gibt, so gibt es keine Form ohne eine Farbe. Dies zeigen Untersuchungen zur sog. Ganzfeldbeobachtung, in der dem Probanden ein homogen ausgeleuchtetes Farbfeld dargeboten wird und nach einer Weile die beobachtete Farbe verschwindet und sich ein einheitliches Grau einstellt. Zwischen Formen und Farben besteht also eine strikte Kopplung. Das eine kann nicht ohne das andere existieren. Dennoch sind wir in unserem Denken in der Lage, die Farbigkeit einer Form auszublenden und sie quasi farblos zu sehen, während es umgekehrt sehr schwer ist, sich Farbe formlos vozustellen oder zu denken. Farbe als ein notwendiges Attribut von Bildern ist immer kontinuierlich und übergänglich. Es gibt unendlich feine Farbnuancen, die bis an die Grenzen der Unterscheidungsfähigkeit oder sogar weit darüber hinaus führen können. Diese potentielle Feinheit an Differenzierungsmöglichkeiten ist gegenüber der diskreten Begrenztheit von 26 Buchstaben unendlich groß und unendlich fein differenzierbar.

 

Bedeutungen

Bedeutung entsteht durch Bezugnahme oder Referenz. Bezugnahme ist die Etikettierung der Innenseite einer Form mit einem Begriff oder einem Bezugsrahmen. Bedeutung entsteht praktisch erst durch die begriffliche Bezeichnung der Innenseite einer Form.15 Der Bezugnehmende ist dabei stets ein Beobachter. Bedeutung als ein Vorgang oder als Resultat der Unterscheidung und Etikettierung ist daher eine komplexe kognitive Konstruktion, die immer zwei Seiten oder Pole hat: Selbstreferenz und Weltreferenz. Man kann im Prinzip als Beobachter jedem beliebigen Objekt oder Ereignis in der Welt durch Anwendung der Unterscheidung Selbstreferenz/Weltreferenz irgendeine Bedeutung zuweisen. Entscheidend ist dafür, daß Bedeutung nicht im Objekt oder Ereignis selbst vorliegt, sondern ihm von einem Beobachter zugesprochen wird. Diese Bedeutung kann vollkommen abstrus oder plausibel sein. Darauf kommt es nicht an. Ihre Zuweisung geschieht jedenfalls vor dem spezifischen Hintergrund oder Kontext der Biographie, des Bildungsniveaus und der Kultur des Beobachtenden. Aufgrund der logischen Struktur von Zwei-Seiten-Formen kann jeweils nur eine Seite der Bedeutung betont, bezeichnet oder aktualisiert werden: entweder Selbstreferenz oder Weltreferenz.

Die Selbstreferentialität eines Bildes entsteht als Resultat einer kognitiven Konstruktion. Der Beobachter unterscheidet bestimmte Elemente eines Bildes als auf sich selbst bezügliche. Elliptisch ausgedrückt, können Bilder auf sich selbst Bezug nehmen, indem sie mit bestimmten Mitteln auf sich aufmerksam machen: durch ihre Größe, ihre Materialität, durch besonders auffallende Elemente (attention getters), durch mediale Störungen oder Fehler. Durch die Möglichkeit von Selbstreferenz thematisieren Bilder sich selbst. Sie präsentieren ihre Präsenz, ihre Anwesenheit, ihr Hier und Jetzt, ihre Sinnlichkeit und ihre Autonomie.16

Geht man als Beobachter auf die andere Seite der Unterscheidung über, auf die Seite der Weltreferenz, wird das Bild entleert und entwertet. Es wird zu einem Stellvertreter, einem Repräsentanten im wahrsten Sinne des Wortes. Denn im Grunde ist ein Repräsentant ein Nichts und ein Niemand, ein NoBody. Er ist nur ein Jemand, weil er etwas anderes oder jemand anderen repräsentiert. Das macht den Repräsentanten so mächtig. Unabhängig von seiner Funktion als Repräsentant, ist er vielleicht auch noch etwas anderes, nämlich eine Person und ein Mensch. Nur als Mensch ist er er selbst. Genauso ist es im Prinzip mit einem Bild und seiner Repräsentationsfunktion. Es wird zu einem leeren Platzhalter, einem Zeichen, einem Abbild oder einem Repräsentanten von Abwesendem. Wie zwischen Form und Farbe besteht auch zwischen Selbstreferenz und Weltreferenz eine strikte Kopplung. Die Struktur der Weltreferenz basiert auf der logischen Struktur der Selbstreferenz. Die Repräsentation von Welt ruht auf der Präsenz des Bildes, auf seinem Hier und Jetzt, seiner Anwesenheit, seiner Sinnlichkeit an einem bestimmten Ort zu einer bestimmten Zeit. Das Abwesende kann nicht ohne ein Anwesendes gedacht, beobachtet oder unterschieden werden. Umgekehrt ist Selbstreferenz, Bezugnahme auf sich selbst, nicht denkbar ohne eine Differenz zu allem anderen, was das Bild nicht ist, nämlich Welt.

Die Selbstreferentialität eines Bildes kann sich daher nur in einem ständigen Abgrenzungsprozeß gegenüber dem, was das Bild nicht ist, konstituieren und erneuern. Weltreferenz besteht in der Bezugnahme auf Abwesendes oder Nicht-Darstellbares durch eine anwesende Darstellung. Die Kopplung der logischen Struktur von Selbstreferenz und Weltreferenz ist also strikt. Sie bedingen einander, um sich in Differenz zu ihrer Außenseite konstituieren zu können.

 

IV

Kontextgrammatik

Die bisherigen Untersuchungen zur grammatikalischen Struktur von Bildern sind auf der Ebene der Elemente des Systems geblieben, welche in der Sprache der Ebene der Worte entspräche. Wenn man nun aber die Interaktionsmöglichkeiten zwischen verschiedenen Bildsystemen untersucht, kommt man in den Bereich komplexer bildgrammatikalischer Strukturen, die unendliche Möglichkeiten der visuellen Narration und der individuellen Argumentation enthalten. Unter Interaktionen wird hier die wechselseitige Beeinflußung zwischen zwei voneinader unterschiedenen Einheiten verstanden.17 Man muß jedoch strikt unterscheiden, auf welcher Ebene man beobachtet. Sonst kommt es zu einer Vermischung verschiedener Ebenen. Bei der Untersuchung von Interaktionen ist daher auf die jeweilige Systemreferenz zu achten. Man kann als Beobachter in jedem Augenblick seiner Beobachtung zwischen Interaktionen von Elementen innerhalb eines Bildes und zwischen Interaktionen, die zwischen zwei oder mehreren Bildern stattfinden, unterscheiden. Man kann also zwischen der internen Struktur eines Einzelbildes und seinem Kontext hin und herswitchen. Im zweiten Falle verlagert man die Detailschärfe seines Blickes auf eine andere Stufe. Man behandelt die beteiligten Bildsysteme, so komplex sie in ihrem Inneren sein mögen, als black boxes, als geschlossene Einheiten, bei denen nur ihre externen Perturbationen, Irritationen oder Provokationen interessieren, die sie im Beobachter auszulösen imstande sind. Das Verhältnis ist analog dem Verhältnis zwischen dem Wort und seinen Buchstaben beziehungsweise dem Satz und seinen Wörtern. Wenn ich auf die Buchstaben eines Wortes blicke, kann ich nicht den Satz lesen und umgekehrt.

Selbstverständlich kann man jede beliebige, markierte Fläche als ein komplexes, zusammengesetztes System aus Elementen behandeln. Wie fein man unterscheiden will, hängt nur von der eigenen Beobachtungsschärfe ab. So kann man, wenn man will, Pigmente, Bindemittel und Trägermaterialien eines Bildes als seine grundlegenden Elemente auffassen. Ich meine das jetzt nicht nur im engeren, etwa auf die Malerei bezogenen Sinne, sondern ganz allgemein. Denn selbst bei der Photographie, der Xerokopie, der Videokassette und dem Bildschirm geht es um Pigmente, Bindeverhältnisse und Trägermaterialien. Man könnte auch noch feiner differenzieren. Man könnte Atome oder Moleküle voneinander unterscheiden, wie es beispielsweise bei der gemäldetechnischen Untersuchungen der Fall ist, indem man mit Hilfe des Gaschromatographen und geeichten Verdampfungsspektren die molekulare Zusammensetzung von Bindemitteln analysieren kann. Man kann aber auch elementare Formen und Farbtöne als seine Grundbestandteile behandeln. Viele Beobachter unterscheiden auch nur zwischen einzelnen Figuren, Gegenständen und Häusern in einem Bild. Und sie haben mit ihrer Unterscheidung auf ihre Weise auch recht. Denn die Wahl der eigenen Beobachtungsschärfe richtet sich im Prinzip immer nach dem spezifischen Erkenntnisinteresse oder einfach den Seh- und Unterscheidungsgewohnheiten verschiedener Beobachter. Jedenfalls wird hierbei deutlich, daß ein Bild in jedem Falle etwas fundamental anderes ist. Für einen Restaurator ist ein Bild etwas ganz anders als für einen Chemiker oder für einen Maler, ganz zu schweigen für einen Kunsthistoriker oder einen Laien. Man kann nicht sagen, was ein Bild unabhängig von jeglicher Beobachtung noch sein könnte. Denn um Bilder unterscheiden, beobachten und beschreiben zu können, müssen sie unterschieden, beobachtet und beschrieben werden. Man kann kein Bild ohne Beobachtung beobachten oder ohne eine Beschreibung beschreiben. Man muß immer irgend eine wählen. Der technische Apparat, der das Bild erzeugt, und den Jacques Lacan Schirm nennt, ist ein notwendiger Bestandteil.18 Kein Schirm, kein Bild. Kein Apparat, kein Bild. Von daher kann man vielleicht abschätzen, welchen strategischen Vorteil das Argument besitzt, daß ein Bild erst als konkretes Resultat eines Unterscheidungsprozeßes entsteht, der durch einen technischen Apparat, ein Medium, ermöglicht wird, und nicht von vorneherein durch eine Ontologie von "wesentlichen Eigenschaften besonderer Objekte oder Objektklassen" unnötig belastet wird.

 

Einfache Fälle

Wenn man das Einzelbild und seine grammatikalische Struktur verläßt, kann man seine Aufmerksamkeit auf den Kontext verschieben und auf die Interaktionen zwischen verschiedenen Bildern. Wenn man auch hier wieder einen einfachen Fall annimmt, nämlich den zwischen zwei verschiedenen Bildern, kann man folgende Interaktionsmöglichkeiten voneinander unterschieden:

Ein Bild kann neben einem anderen sein.

Ein Bild kann hinter einem anderen sein.

Ein Bild kann vor einem anderen sein.

Ein Bild kann über einem anderen sein.

Ein Bild kann unter einem anderen sein.

Ein Bild kann um ein anderes herum sein.

Diese Auflistung erhebt weder den Anspruch auf Vollständigkeit noch auf logische Kohärenz. In jedem Fall unterscheiden sich die Interaktionsmöglichkeiten voneinander. Wenn man als Beobachter nur einem einzigen Bild gegenüber steht, ist die Situation je nach institutionellem Kontext dieses Bildes mehr oder weniger offen für verschiedene Interpretationen. Wenn aber ein zweites Bild in diesen Kontext eintritt, spezifiziert dieses zweite Bild unzweifelhaft die Bedeutung des ersten. Es grenzt sie ein, gibt ihm eine bestimmte Richtung oder Wendung, eine neue Variante oder eine neue Deutung. (Abb. Messerstecher alleine, Messerstecher +Kind) Es könnte sein, daß ein Leser dieses Textes an irgendeinem Ort und in irgendeinem Zusammenhang diesem Bild begegnet. Von diesen Umständen hängt (unter anderem) seine Bedeutungskonstruktion dieses Bildes ab.

Da die Leserichtung in den westlichen Kulturen von links nach rechts verläuft, fungiert das linke Bild normalerweise als universale These oder "opener", der visuell plaziert wird. Er eröffnet den "universe of discourse", welches ein Universum der Bedeutung ist. Das rechte Bild fungiert aber nun nicht etwa als eine Art Antithese, sondern als eine zweite These, die vom Beobachter mit dem ersten Bild auf verschiedene Weise in Verbindung gesetzt werden kann. Die einzelnen Bilder werden quasi automatisch miteinander in Verbindung gesetzt, weil sie auf dem selben Papier sind, sich im selben Kontext befinden, weil man nach der einfachsten, gemeinsamen Bedeutung sucht, usw. Die latent gebliebenen Außenseiten der Bilder fungieren dabei als offengelassene Anschlüße oder Leerstellen. Der Beobachter konstruiert in dieser Situation von Unbestimmtheit eine grammatikalische Struktur, in der beide images bestimmte Referenzfelder miteinander teilen und andere Referenzfelder nur für sich selbst beanspruchen.19 Damit wird die Bedeutung des ersten Bildes automatisch durch die Bedeutung des zweiten verändert. Beim Blättern in Zeitschriften funktionieren diese Interaktionen auf andere Weise. Erst wird das rechte Bild als universale These wahrgenommen und dann das linke als dessen Bedeutungsspezifikation. (Abb.: Zeitschriftenseite)

Jedenfalls kann man, ganz unabhängig von einem eventuellen Streit darüber, in wieviel Prozent der Fälle man bestimmte Bildkombinationen von links oder von rechts liest, festhalten, daß man Bilder sowohl von rechts als auch von links sowie von oben und von unten lesen kann. (Abb. Dan Graham: View Interior, New Highway Restaurant, Jersey City , N.J. v. 1967; New Office Buildings, Pittsburgh, 1993) Die gewählte Leserichtung beeinflußt aufgrund der zeitlichen Sukzession der Wahrnehmungssakkaden die jeweilige Bedeutungskonstruktion der Bildfolge auf fundamentale Weise. Dasselbe gilt für Leseabfolgen von oben nach unten, von vorne nach hinten, von innen nach außen. Eine Umkehrung der einmal gewählten Lesereihenfolge führt in jedem Falle zu einer profunden Veränderung in den Bedeutungskonstruktionen des Beobachters. Aus diesen Gründen übt die relative Position eines Einzelbildes in einer Bilderfolge einen maßgeblichen Einfluß auf die Bedeutung dieser Folge aus. Man kann dies an einem einfachen Experiment erkennen, indem man die Position der Bilder vertauscht. (Abb. Hausfrau-Demonstranten) Dieselben grammatikalischen Strukturen gelten selbstverständlich auch für bewegte Bilder. Da bewegte Bilder im Prinzip auf stehenden Bildern beruhen und sozusagen nur eine äußerst schnelle Abfolge stehender Bilder sind, kann man die grammatikalische Struktur bewegter Bilder direkt aus ihren statischen Varianten ableiten. Man kann die Interaktion bewegter Bilder als eine äußerst schnelle Abfolge stehender Bildpaare interpretieren, die sich während des Zeitablaufes in ihren Interaktions- und Bedeutungsmöglichkeiten verändern.

 

Komplexe Bilderfolgen

Wenn man die Anzahl der mit einander in Wechselwirkung stehenden Bilder erhöht, also 3, 4, 5 oder mehr Bilder nebeneinander oder untereinander anordnet, dann steigt die Komplexität der grammatikalischen Struktur exponentiell an. Sie folgt der mathematischen Formel:2n-n-1. n ist dabei die Anzahl der beteiligten Einheiten. In der Komplexität von Relationen zwischen Bildern begegnet man wahrscheinlich einem der wichtigsten Unterschiede zu Schriftsystemen. Denn bereits bei einer relativ kleinen Anzahl von Bildern ist es nicht mehr möglich, alle potentiell möglichen Interaktionen und Wechselwirkungen zu beobachten und voneinander zu unterscheiden. (Abb. rechts What we take there to be) Das Resultat ist eine hohe Selektivität des Beobachteten. Die Beobachtung selbst wird fragmentarisch, selektiv, zufällig und bruchstückhaft. Sie ist nur in der Lage, dasjenige zu verarbeiten, was für das kognitive System eines bestimmten Beoachters gerade noch möglich ist. Was von einem bestimmten kognitiven System nicht mehr unterschieden, verarbeitet und verstanden werden kann, kann eben von diesem kognitiven System zu diesem Zeitpunkt schlicht und einfach nicht mehr unterschieden und verarbeitet werden. Kognitive Systeme reduzieren in aller Regel die überschießende Komplexität aller Interaktionsmöglichkeiten auf einige wenige, beobachtete und unterschiedene, auf ein für das kognitive System gerade noch verarbeitbares Ausmaß. Die grammatikalische Komplexität einer Bildfolge wird hochselektiv auf ein gerade noch vertretbares Ausmaß reduziert. Komplexität wird hochselektiv reduziert und führt daduch zur Kontingenz. Die spezifische Selektion kann nämlich und wird auch jedesmal eine andere sein. Dies könnte eine Ursache für die zahlreichen Berichte und Erfahrungen sein, daß Bilder sich in ihren Interpretationen niemals erschöpfen und sich durch eine ungeheure Überdeterminiertheit auszeichnen. Es handelt sich aber nicht um Überdeterminiertheit, sondern um unendliche Möglichkeiten, aus der potentiellen Komplexität eines Bildes eine hochselektive und hochkontingente Bedeutungskonstruktion zu erzeugen.20

Die Selektivität der Unterscheidungen steigt mit der Anzahl der beteiligten Einheiten sprunghaft an.21 Dieser Fall kommt sehr häufig in unserer Alltagswahrnehmung vor. Er ist eigentlich die Regel und der Normalfall, da unsere Sinne einem ständigen visuellen, akustischen und olfaktorischen information overload ausgesetzt sind. Das kognitive System reduziert die explodierende Komplexität der Interaktionen aller möglichen Einheiten mit allen möglichen Einheiten auf ein für das jeweilige kognitive System gerade noch prozeßierbare Maß. Da wir einem Bombardement verschiedenster visueller Eindrücke und Bilder gleichzeitig ausgesetzt sind (Abb: Neue Bahnhofshalle Leipzig), führt die extrem hohe Selektivität der Beobachtung sehr schnell zu einer hochkontingenten, das heißt, stets auch anders möglichen, Konstruktion im kognitiven System. Das bedeutet wiederum, daß im Vorgang der Beobachtung Leerstellen, Lücken und Reduktionen erzeugt und fragmentarisch in einer Weise aufgefüllt werden, welche gegenüber der potentiellen Anzahl möglicher Interaktionen bei weitem unterbestimmt ist, so daß ständig neue Aktualisierungen, Ergänzungen und Löschungen entstehen.22 Dies macht die oft beschworene Vieldeutigkeit von Interpretationen unmittelbar verständlich und nachvollziehbar. Im Prinzip kann man daraus folgern, daß es niemals, zu keinem Augenblick in der Welt, zwei völlig identische Bedeutungskonstruktionen ein und desselben Bildes geben wird.23

 

Intermediale Interaktionen

Zusätzlich zu dieser immensen Komplexität der Interaktionen kommen Interaktionsmöglichkeiten zwischen unterschiedlichen Medien hinzu, die ich mangels eines besseren Ausdrucks als intermediale Interaktionen bezeichnen möchte. Darunter verstehe ich z.B. Interaktionen zwischen Bild und Text, zwischen Bild und Sound, Bild und Geruch, Bild und Bewegung, usw. Die folgenden Ausführungen nehmen vor allem Bezug auf die Interaktion zwischen Bild und Text sowie auf die Interaktionen zwischen Bild und Sound. Beide Formen von Intermedialität spielen in unserer heutigen multimedial geformten Umwelt eine bedeutende und zentrale Rolle. Texte und Töne manipulieren unsere Bildwahrnehmung in einem wesentlich stärkeren und unbewußteren Ausmaß, als wir immer geglaubt haben.

 

Interaktionen zwischen Bild und Text

Die Interaktionen zwischen Bildern und Texten spielen in den meisten Schriftkulturen eine bedeutende und zentrale Rolle. Man kann auch hier verschiedene Typen von Interaktionen voneinander unterscheiden, Bild und Titel, Bild und Fließtext sowie Text im Bild selbst.24

Bild und Titel

Das Verhältnis zwischen einem Text und seinem Titel ist im Prinzip ähnlich demjenigen zwischen zwei Bildern. Die zuerst unterschiedene und bezeichnete Einheit fungiert als universale These, während die zweite Einheit als Spezifikator wirkt. Dies hat natürlich tiefgreifende Folgen für die daraus folgenden Bedeutungskonstruktionen, wie hinreichend bekannt ist. Wird zuerst, wie so oft, auf den Titel geblickt und dann auf das Bild, eröffnet der Bildtitel den "universe of discourse". Das Bild wirkt dann nur noch als eine Art sekundärer Verifikationsinstanz des bereits Gelesenen. Hier werden Bilder nur noch zu anschaulichen Beispielen und Erfüllungsgehilfen von Texten degradiert. Wird dagegen das Bild zuerst beobachtet und bezeichnet und anschließend der Titel gelesen, gibt der Bildtitel der Bedeutungskonstruktion des Bildes einen neuen Aspekt, eine neue Richtung oder Interpretation. (Abb. Paul Klee: Auch Dürftiges schwärmt, 1938).

Der Münchner Psychologe Bernd Weidenmann hat den steuernden Einfluß von Bildunterschriften für die Beobachtung und Unterscheidung von Bildern in mehreren experimentellen Untersuchungen genauestens erforscht.25 Der Titel führt, nachdem er gelesen wurde, die kognitiven Konstruktionen eines Beobachters in eine bestimmte Richtung, sei es, daß durch den Titel die Bedeutungskonstruktion des Bildes um einen sehr spezifischen Gehalt erweitert wird; sei es, daß diese Konstruktion modifiziert, eingeengt oder in eine neue Richtung geführt wird; sei es, daß der Titel gezielt als Köder genutzt wird, um den schrifthungrigen Beobachter in eine Bedeutungsfalle zu locken.26

Bild und Fließtext

Das Verhältnis zwischen Bild und Fließtext ist dagegen komplizierter. Der Text fließt um das Bild herum und kann an mehreren verschiedenen Stellen, sozusagen, immer wieder neu mit dem Bild in Verbindung gesetzt werden. Eine besonders spannende Arbeit hat der amerikanische Fluxuskünstler Alan Kaprow 1981 in Zusammenarbeit mit dem Wochenmagazin ZEIT ausgeführt. Er hat dieselbe Fotografie in vier verschiedene Abschnitte der Zeitung plaziert, nämlich Politik, Wirtschaft, Feuilleton und Modernes Leben. Es wird sofort deutlich, daß diese Re-Kontextualisierung wie eine Überschrift oder ein Titel funktioniert, der Bild und Text in einen bestimmten 'universe of discourse' einschreibt. Kaprow hat jedesmals das Bild mit einem anderen Bildkommentar versehen, der auf den jeweiligen Kontext des Politischen, Ökonomischen, Kulturellen oder Modernen Bezug nimmt. Auf Seite 7 des Abschnittes Politik ist die Fotografie eines Pathologen in Zusammenhang mit einen Artikel über Moshe Dajan gerückt, der aussieht, als käme er gerade von einer Augenoperation. Es wird deutlich, daß sowohl die Überschrift des Artikels sowie seine Behauptungen das Bild des Pathologen interpretieren, sowie seinerseits der Artikel über Moshe Dajan von der Fotografie und ihrer visuellen Bedeutung neu interpretiertwird. Die grammatikalisch-logische Struktur dieser Interaktion würde sich in einer differenzierteren Intrepretation in Analogie zu Negation, Konjunktion, Alternation oder Implikation durchaus näher bestimmen lassen. Beide Medien spezifizieren und kontextualisieren sich wechselseitig. Es herrscht ein Verhältnis gegenseitigen Einschlusses.

Auf Seite 23 im Abschnitt Wirtschaft rückt dieselbe Fotografie in den Kontext der Kunstfaserproduktion und ihrer ökonomischen Krise. Sofort verändert sich die Bedeutungskonstruktion des Bildes. Man denkt unwillkürlich an künstliche Organtransplantation. Umgekehrt gibt die Autopsie des Leichnams dem "Tod" der Kunstfaserproduktion eine tödlich-anschauliche Dimension. Der Leichnam wirkt fast wie eine künstliche Nachbildung aus Kautschuk.

Im Abschnitt Kritik und Information des Feuilletons rückt das Bild schließlich in den Zusammenhang einer mit der Überschrift "Tödliche Spiele" überschriebenen Rezension einer Tschechow-Inszenierung an den Münchner Kammerspielen. Die Bildunterschrift unter dem Foto des Pahtologen lautet: "Gibt es ein Leben nach dem Tod? Die religiöse Suche nach den existentiellen Werten der ausübenden Medizin zerstört eine Arztkarriere in dieser Szene eines Klassikers aus der Horrorfilmsparte der zwenziger Jahre. Der Regisseur Egon Thorwald, der in diesem Jahr den Preis des Film-Festivals in Cannes gewann, hält den "Teufel der Gesellschaft" für eine moderne Parabel der Inquisition."27

 

Die Interaktion zwischen Bild und Sound

Der amerikanische Videokünstler Bill Viola hat in einem Gespräch auf die Frage, welche Rolle der Ton in seinen Videos spielt geantwportet: "Sound is the half rent." In der Tat nehmen wir Bilder niemals ohne begleitende akustische Wahrnehmung wahr. Jede visuelle Wahrnehmung wird gleichzeitig von akustischen, olfaktorischen, gustatorischen und propriozeptiven Wahrnehmungsimpulsen koordiniert, die man niemals ausblenden kann. Sie laufen sozusagen in der Wahrnehmung automatisch mit. In diesem Sinne sind Interaktionen zwischen verschiedenen Medien meist simultan und parallel. Im Prinzip sind wir als Beobachter in eine multi-channel-perception, in ein kontinuierliches information streaming eingebunden, in dem die Perturbationen eines Mediums parallel zur korrektur der Perturbationen aus einem anderen Medium verwendet werden können. Hier gibt es ebenso wie bei Bildkombinationen eine Potentialität, deren Zahl möglicher Kombinationen mit der Anzahl der beteiligten Medien sprunghaft ansteigt. Auch hier können nur um den Preis kontingenter Selektivität Bedeutungskonstruktionen erzielt werden.

Die Referentialität von Sound läßt sich ebenfalls in Selbstreferenz und Weltreferenz unterscheiden. Es gibt Sounds, die auf nichts anderes als auf sich selbst verweisen. Sämtliche elektronischen Geräusche und sämtliche Töne von Musikinstrumenten sind strikt selbstreferentiell. Das Klavier klingt immer wie ein Klavierrauschen des Radios oder des Fernsehers. Auf der anderen Seite gibt es Sounds, die andere Sounds repräsentieren und sich dadurch auf dieses Andere beziehen: z.B. aufgenommene Geräusche von Vogelstimmen, Autos, startenden Flugzeugen, sound samplings, auch elektronische Imitationen von musikinstrumenten durch Physical modeling systeme, usw.

Sound interpretiert in Interaktion mit einem Bild dieses Bild auf fundamentale Weise. Wenn man dagegen zwei Bilder nebeneinander hat, wird die Interaktion meist mit einem der beiden Bilder stärker verkoppelt als mit dem anderen.

Bedeutungsunterschiede, die durch eine zeitliche Abfolge entstehen, sind jedoch nur bei einmaliger oder kurzer Darbietungszeit von Relevanz. Sie spielen aber bei der Interaktion zwischen Bild und Sound eine wichtige Rolle. Je nachdem, ob der Sound zuerst kommt oder das Bild, kann eine vollkommen andere Bedeutungsinterpretation entstehen.

 

Anmerkungen:

1 Duden. Das Fremdwörterbuch. Mannheim 1974, S.272

2 Historisches Wörterbuch der Philosophie, bd. 3, Sp. 846

3 Richard Rorty (Hg.): The Linguistic Turn. Recent Essays in Philisophical Method, Chicago 1967

4 W.I.T. Mitchell, Gottfried Boehm: Die Wiederkehr der Bilder; in ders.(Hg.): Was ist ein Bild? München 1994, S.13

5 Bredekamp

6 (Bild: Mustererkennung)

7 Vgl. zur selben Ansicht Ernst H. Gombrich: Kunst und illusion. Zur Psychologie der bildlichen Darstellung. Köln 1967, S. 311 [zitat boehm, s.31] Dagegen anderer Ansicht Michel Polanyi:

8 Gerhard Roth: Das Gehirn und seine Wirklichkeit. Frankfurt/M. 1994, S.

9 Vgl. hierzu in ähnlichem Sinne Gottfried Boehm: Die Wiederkehr der Bilder, S.29f.: " Was uns als Bild begegnet, beruht auf einem einzigen Grundkonzept, dem zwischen einer überschaubaren Gesamtfläche und allem, was sie an Binnenereignissen einschließt."

10 Vgl. Hans Dieter Huber: Kommunikation in Abwesenheit.

11 George Spencer Brown: Laws of Form

12 Gisela Ulmann hat nachweisen können, daß verbal bezeichnete Unterscheidungen schwerer rückgängig gemacht werden können als unbezeichnete Unterscheidungen.

13 Bekanntlicherweise gibt es Visualisier und Konzeptualisierer als unterschiedliche Verarbeitungsstile.

14 Livingstone, Roth

15 Quine: Bedeutungen sind in erster Linie sprachliche Bedeutungen.

16 Vgl. hierzu wiederum Gottfried Boehm, der dieselbe Differenz diskutiert, allerdings ohne die Begriffe Selbstreferenz/Weltreferenz zu verwenden. Die Wiederkehr der Bilder, S.34: "In der spannungsvollen Beziehung, die sich im visuellen Grundkontrast zeigt, gibt es, ..., die Möglichkeit, daß Bilder ganz selbstvergessen in der Illusionierung von etwas argestelltem aufgehen oder -umgekehrt- ihr bildliches Gemachtsein betonen."

17 Vgl. zu einem enger gefassten Begriff von Interaktion Söke Dinkla: Pioniere interaktiver Kunst von 1970 bis heute. Ostfildern-Ruit: Cantz 1997, S.14

18 Jacques Lacan: Linie und Licht, in: Gottfried Boehm: Die Wiederkehr der Bilder; in ders.(Hg.): Was ist ein Bild? München 1994, S.66

19 An dieser Stelle könnte man wieder zu der Frage zurückkehren, die bereits eingangs aufgeworfen wurde, ob und wie zwischen den logischen Strukturen eines Satzes und den logischen Strukturen einer Bildfolge Analogien oder Differenzen bestehen.

20 Dieser Punkt der Selektivität von Beobachtungsleistungen wurde ausführlicher dargestellt in: Hans Dieter Huber: Szene aus der Hirschjagd.

21 Bei zwei Bildern gibt es exakt eine Interaktionsmöglichkeit, bei drei Bildern vier Möglichkeiten, bei vier bereits 11 verschiedene Kombinationen, bei fünf schon 99, während es bei der doppelten Zahl von Elementen, nämlich zehn, bereits das Zehnfache an Kombinationsmöglichkeiten, nämlich 1013 Relationen, gibt.

22 Nelson Goodman: Ways of Worldmaking.

23 Quine: On empirically equivalent Systems of the World

24 Ich erhebe keinen Anspruch darauf, daß meine Aufzählung vollständig oder logisch ist. Es sind nur einige Beispiele für verschiedene Arten von Text-Bild-Beziehungen. Es sind dabei durchaus weitere denkbar.

25 Bernd Weidenmann: Psychische Prozeße beim Verstehen von Bildern., Bernd Weidenmann:

26 Vgl. hierzu meine ausführlicheren Untersuchungen zu Cy. Twombly: The First Part and the Second Part of the Return from Parnassus, 1961/62 in: Hans Dieter Huber: System und Wirkung. Fragen der Interpretation zeitgenössischer Kunst. München 1989, S.

27 ZEIT vom 20.3.1981, S.43. Im Abschnitt "Modernes Leben" schreibt sich das Foto ein letztesmal in einen neuen Kontext ein, in dem es unter der Überschrift "Lieber krank als ohne Arbeit" um den Krebsverdacht von Asbestfasern geht und um die Frage, daß einige Arbeitnehmer in einem schreiben an Arbeitsminister Ehrenberg lieber ihre eigene Erkrankung durch Asbeststaub in Kauf nehmen als einen möglichen Verlust ihrer Arbeitsplatzes.



 

designed by Hans.Dieter.Huber