Zitiert nach —
FRANKFURTER ALLGEMEINE ZEITUNG
(8. Juni 1968) :
Geist auf Abruf
Computerisierte Geistesarbeit
Kant-Index, Shakespeare-Konkordanz und so weiter

Von Gerd Hergen Lübben


 


Intellektuelle und moralische Verödung prangerte vor hundert Jahren Karl Marx als Begleitnotstände immer wuchtigerer Systeme der „automatischen Fabrikation“ an. Die „galoppierenden Verbesserungen der Maschinerie“ degradierten die Arbeiter zu „Teilmaschinen“, ja zwängen diese zu einem sisyphischen Konkurrenzkampf mit „mechanischen Ungeheuern“. Die landläufige Vorstellung, die Automatisierung der Produktion verschaffe den Arbeitern endlich die „Muße, über ihre unsterblichen Interessen nachzudenken“, offenbare sich als zynische Ausgeburt des „Kapitalhirns“. Freilich, „an sich betrachtet“, sei die Maschinerie als ein Sieg des Menschen über die Naturkraft zu feiern.

In unserer Zeit haben informationsverarbeitende Automaten begonnen, Menschen zu ersetzen, die geistige Arbeiten ausführen: „Elektronengehirne“, die nicht denken, sondern das verrechnen und vermerken, was ihnen zugedacht ist. Schätzungen, nach denen heute ein Wissenschaftler 95 Prozent der Weltliteratur seines Spezialgebtets nicht kennt, lasseneine beschleunigte Autornatisierung geistiger Prozesse dringlich erscheinen. Die so genannte Informationskrise steht am Anfang der neueren, vor allem an der Lage auf dem technisch-naturwissenschaftlichen Gebiet orientierten Bemühungen zur
maschinellen Informationserschließung.

Die Verwendung maschineller Hilfsmittel in der nichtnumerischen Datenverarbeitung erfordert formale Kriterien zur Manipulierung sprachlicher Gegebenheiten. Der Suche nach Algorithmen kommt der Plan eines Logikkalküls, wie er seit Leibniz diskutiert wird, entgegen. Dieser zielt darauf ab, die Logik von der Sprache unabhängig zu machen und die Begriffe und ihre Beziehungen algebraisch zu symbolisieren.

Jacob Grimms Zweifel an der Möglichkeit. dass allgemein-logische Begriffe dem „unergründlichen Sprachgeist“ auf die Spur kämen, sind noch nicht aus der Welt. Das Widerspiel zwischen Sprache und Kalkül besteht darin, dass die Sprache Ihren Kalkül ein-, der wissenschaftliche Kalkül aber die Sprache ausschließt. Die Sprache ist, als ein Universale, nicht auf das Postulat der iderspruchsfreiheit abgestellt, ist kein Chiffre-Friedhof wie etwa die Formelsprache der Chemie, die heute relativ einfach der Metasprache eines informationslogischen Automaten angepasst und In eine beliebige andere Form umgeschrieben werden kann. Chemiker werden In Immer größerem Umfang von den geistigen Tätigkeiten freigestellt, die sich formal beschreiben lassen. Es wird die Entwicklung einer „enzyklopädischen Maschine“ für möglich gehalten, die alle eindeutig formulierbaren Axiome, Theoreme, Formeln und Definitionen speichern kann.

Kant, dessen philosophischer Neuansatz ohne Leibniz nicht denkbar wäre, wollte In der Mathematik nichts als eine Hilfswissenschaft erkennen und lehnte mathematische Methoden in der Philosophie zunächst sogar spöttisch ab. In Reflexionen und Briefen zog er jedoch für die Philosophie einen
„transzendentalen Algorithmus“ in Betracht: Rechenkunst als Unterstützung schöpferischer „Scharfsinnigkeit“. Leibniz war bereits, seinem Lehrer Weigel folgend, noch weiter gegangen.

Zeit seines Lebens tüftelte Leibniz an Entwürfen zu einer Universalsprache und Universalschrift. Wiederholt hat er sich zu methodologischen Fragen der Sprachwissenschaft geäußert. In einer Denkschrift schlug er Peter dem Großen eine genormte und gezielte Fragebogenaktion zur Ermittlung eines Kernwortschatzes entlegener Sprachen aus dem russischen Kolonialgebiet vor.

Als der Bonner Germanist H. Moser 1964 das „Institut für deutsche Sprache“ in Mannheim begründete, konnte er den Plan zu einer wissenschaftlichen Sprachpflege bis auf Leibniz zurückverfolgen. Das Institut sieht seine Hauptaufgabe in der Untersuchung der Gegenwartssprache und in der Dokumentation ihrer grammatischen Merkmale. Alle Forschungsarbeiten werden mit Hilfe datenverarbeitender Maschinen durchgeführt in Zusammenarbeit mit dem Darmstädter Rechenzentrum sowie mit dem Institut für Phonetik und Kommunikationsforschung und den Instituten für instrumentelle und angewandte Mathematik an der Universität Bonn. Vor allem dem Goethe-Institut und dem Deutschen Akademischen Austauschdienst soll die Erarbeitung der Grundstrukturen der deutschen Sprache, eines „Grunddeutsch“ für den Deutschunterricht für Ausländer, zugute kommen.

Programmfluss zur automatisierten Herstellung des Wortindex zu KANTs gesammelten Schriften

Das Mannheimer Institut hat acht ständige wissenschaftliche Mitarbeiter. Demgegenüber verfügt das Ostberliner „Institut für deutsche Sprache und Literatur“ über 140 wissenschaftliche Mitarbeiter. Zu den lexikographischen Arbeiten dieses Institutes gehört die Schaffung eines .Marx-Engels-Wörterbuchs“. Eine Gruppe von Wissenschaftlern beschäftigt sich mit Untersuchungen strukturalistischer Art. Die Tatsache, dass man in der Bundesrepublik den Ostberliner Bemühungen um die deutsche Sprache lange Zeit nichts Gleichwertiges entgegenstellen konnte, erwies sich im Hinblick auf das Ausland als nachteilig. Auch die Energie, mit der andere Nationalsprachen erforscht werden, vor allem in Frankreich und in den Vereinigten Staaten, ließen die Gründung der Mannheimer Zentralstelle für die deutsche Sprache wünschenswert erscheinen. Mit der Erforschung des Französischen zum Beispiel sind Institute in Nancy („Trésor de la langue française“, Wörterbuch,  ungefähr 140 wissenschaftliche Mitarbeiter, eigene Rechenanlage) und Besançon („Français fondamental“, etwa 20 Mitarbeiter, Zentrum für mechanische Lexikologie) befasst.

Der Einsatz von elektronischen Rechenanlagen machte es erforderlich, dass das Mannheimer Institut die Aufgabe übernahm, ein Archiv für maschinenlesbare Datenträger zu erstellen, aus dem Lochkarten, Lochstreifen und Magnetbänder an andere Forschungsstellen ausgeliehen werden können. Diese „Datenbank“ soll die Literatur der Gegenwart in einem repräsentativen Querschnitt enthalten. In den nächsten Jahren wird eine Sprachmasse von mehr als fünf  Millionen Wörtern zur Auswertung verfügbar gemacht sein, die aus disparatesten Quellen geschöpft wird: Aus zeitgenössischen Romanen, Sachbüchern und Biographien ebenso wie aus Zeitungen, Krimis, Werbetexten und Gebrauchsanweisungen. Parallel damit wird eine Bibliothek linguistischer Programme für Elektronenrechner eingerichtet. Für viele Untersuchungen wird die zeitraubende Aufgabe des Exzerpierens, Verzettelns und Sortierens entfallen; Arbeiten, deren Ableistung als grundlegende Voraussetzung etwa zur Erlangung eines akadernischen Grades gilt. Neben dem ersparten Arbeitsaufwand erzielen für philologische Arbeiten qualifizierte Forscher noch den Gewinn annähernd perfekter Fehlerlosigkeit in den computerisiert gezeitigten Ergebnissen.

Vollautomatisiert erzielte Übersetzungsergebnisse von befriedigender Qualität (auch für umfangreichere Textmengen) sind in absehbarer Zeit noch nicht zu erwarten. Wichtiger als der Versuch, ein so komplexes Problem wie das der maschinellen Sprachübersetzung mit unzureichenden Mitteln anzugehen, sind vorerst weiterhin die Formalisierung und Aktivierung der Sprachstruktur sowie die Vertiefung der theoretischen Kenntnisse in algebraischer Linguistik, automatisierter Sprachbearbeitung und Programmiertheorie.

Sinnvoll im Bereich der Philologie ist der Einsatz elektronischer Rechenanlagen bei lexikalischen Messungen. Um ein Wortstellenverzeichnis zu den Werken des Euripides aufzustellen, brauchte ein Altphilologe 43 Jahre. Das Problem ließe sich heute mit Hilfe eines Elektronenrechners binnen weniger Monate lösen.

Bevor die datenverarbeitende Maschine die von ihr geforderte Leistung vollbringen kann, fällt dem Menschen immer erst die oft vertrackte Aufgabe zu, die richtigen Programme für die einzelnen Arbeitsgänge zu erarbeiten. Unschwer lässt sich voraussehen, dass über kurz oder lang von Forschern nicht nur der naturwissenschaftlich-mathematischen, sondern auch aller geisteswissenschaftlichen Fakultäten Grundkenntnisse in der Programmiertheorie verlangt werden. Wo die Maschinen nicht die Aufgabe der Textinterpretation im Sinne der Linguistik oder der Literaturwissenschaft übernehmen, sondern lediglich in kurzer Zeit zuverlässige Arbeitsmittel für den menschlichen Interpreten bereitstellen, ermöglichen geeignete Programme die automatisierte Herstellung von Inventarlisten zu beliebigen Textmassen wie Indizes, Registern, Konkordanzen.

Nach dem Grundsatz der diplomatisch getreuen Wiedergabe des Textes stellt der Philosoph G. Martin mit den Methoden der elektronischen Datenverarbeitung einen allgemeinen Kantindex her, bei dem es sich um einen vollständigen Index zur Akademie-Ausgabe von Kants gesammelten Schriften handelt. Der Kantische Text wird hierbei auf Lochkarten übertragen und anschließend in einern Elektronenrechner des Typs IBM 7090 (Institut für angewandte Mathematik, Bonn) alphabetisch geordnet.

Der Kantindex erscheint in vier Abteilungen. Ein Stellenindex liefert zu jedem Wort des Kantischen Textes in alnhabetischer Ordnung die jeweiligen Stellennachweise. Die Originalskripten dieser 15bändigen Abteilung stehen vorerst nur im Philosophischen Seminar A der Universität Bonn der wissenschaftlichen Benutzung zur Verfügung. In der zweiten Abteilung, dem

WORTINDEX ZU KANTS GESAMMELTEN SCHRIFTEN. Bearbeitet von Dieter Krallmann und Hans Adolf Martin. 4 Bände - Allgemeiner Kantindex zu Kants gesammelten Schriften. In Zusammenarbeit mit Ingeborg Heidemann, Hugo Moser, Gerold Ungeheuer, Heinz Unger, Leo Weissgerber herausgegeben von Gottfried Martin. Bände 16 bis 19. Walter de Gruyter & Co., Berlin 1967 ff., je Band etwa 100 Mark,
ist jedes Wort seiner Häufigkeit nach verzeichnet, die wiederum nach der Bandfolge der Gesamtausgabe übersichtlich gegliedert ist. Die ersten beiden Bände umfassen die Abteilung I der Akademie-Ausgabe, das heißt alle von Kant selbst oder auf seine Veranlassung veröffentlichten Werke.

Zu den Merkmalen dieses Wortindex zählt, dass alleinstehende Buchstaben, Zahlen und Zeichen, beispielsweise „§ 15a“, wie Kant sie zur Textgliederung benutzt, einzeln in alphabetischer Reihenfolge aufgeführt werden. Abkürzungen, die gemeinhin als zusammenhängender Ausdruck gelten, wie „d. i.“, können gesondert erscheinen, unter „d.“ und „i.“. Wortverbindungen, wie“Nicht-Wissen“, werden nicht getrennt. Flexionsbedingt auseinandergerissene Wörter („baut auf“) stehen einzeln unter Verbform und Präfix. Getrennt geführt werden ebenso flektierte und deklinierte Formen wie „lesen“, „las“, „gelesen“ und „Mond“, „Mondes“, „Monde“. Das Wort „Sein“ wird hier noch nicht nach verbaler, substantivischer und pronominaler Verwendung auseinandergehalten.

Für die grammatikalische Bearbeitung und systematische Gliederung des Wortmaterials sorgt erst die vierte Index-Abteilung, der Sachindex, woraus bislang nur der

SACHINDEX ZU KANTS KRITIK DER REINEN VERNUNFT. Herausgegeben von Gottfried Martin. Bearbeitet von Dieter-Jürgen Löwisch. Walter de Gruyter & Co., Berlin 1967, 353 Seiten, 38 DM,
erschienen ist. Da der Sachindex auf den vollständigen Grundlagen des allgemeinen Index fußen muss und folglich erst nach dem Abschluss der 29 Bände umfassenden Akadernie-Ausgabe – fünf Bände Vorlesungsnachschriften sind noch in Vorbereitung – in Angriff genommen werden kann, wird damit gerechnet, dass der allgemeine Kantindex bis zum Jahre 1994 fertig vorliegen wird, dem hundertsten Jahrestag des Arbeitsbeginns der Gesamtausgabe. Als dritte und philosophiegeschichtlich wohl interessanteste Abteilung des Martinschen Kantindex ist ein voluminöser Personen- und Quellenindex in Arbeit. Ein Personenregister mit sämtlichen Stellennachweisen für die Bände 1 bis 23 der Akadernie-Ausgabe soll noch 1968 als Band 20 des Allgemeinen Kantindex veröffentlicht werden. Die Bände 1 bis 9, also die Abteilung I der Akadernie-Ausgabe, bergen eine Textmasse von ungefähr 1,4 Millionen Wörtern (der inforrnationslogische Automat wurde mit der Definition des Wortes als einer Buchstabenfolge zwischen zwei Zwischenräumen gefüttert). Diese speicherte der Computer auf fünf Magnetbändern. In sechseinhalb Stunden Sortierzeit entstand das „Telefonbuch“, in dem alle Wörter samt Stellennachweis und Worthäutigkeitssumme vürzeichnet sind. Beispiele: „1 NONSENS 03 335 21“ – Kant gebraucht das Wort Nonsens insgesamt nur einmal, und zwar in Band 3 der Akademie-Ausgabe, in der Kritik der reinen Vernunft, Seite335, Zeile21“ „1 WELTANSCHAUUNG 05 255 02“ – Band 5, Kritik der Urteilskraft, etc.; „1 ZEITWESEN 08 327 27“: Im „Ende aller Dinge“ sei das „Zeitwesen“.

Das von G. Martin angewandte Verfahren darf als vorbildlich für alle zukünftigen Indlzierunternehmen gelten.

Mittlerweile werden nach den modernen Verfahren von deutschen Wissenschaftlern Indizes unter anderem zu den Werken von Büchner und Lessing (L. E. Schmitt, Marburg), Heine (M. Windfuhr, Bonn) und Leibniz (G. Martin, Bonn) erarbeitet. Es lässt sich feststellen, dass die Bundesrepublik wohl auf diesem Gebiet der maschinellen Sprachbearbeitung führend ist. Das ist hauptsächlich auf die privaten Initiativen der Wissenschaftler zurückzuführen. Nur zögernd gew:ihrt die öffentliche Hand Unterstützung. Die Untersuchungen des Bonner Universitätsinstituts für Phonetik und Kornmunikationsforschung zur maschinellen Sprachühersetzung sind teilweise vom Bundesministerluni für Verteidigung unterstützt worden. Dass die nichtnumerische Datenverarbeitung für historisch-kritische Editionen sowie für die Herstellung von Indizes nicht grundsätzlich institutionell gefördert wiid, löst bei fortschrittlichen Litcraturwissenschaftlern berechtigtes Unbehagen aus.

Die fortschreitende Computerisierung philologischer Arbeiten hat ein großangelegtes Unterfangen gleichsam im Sturmschritt überholt: 1946 legte der Philologe W. Schadewaldt der Deutschen Akademie der Wissenschaften zu Berlin eine Denkschrift zur Begründung eines Goethe-Wörterbuchs vor. Die Kodifizierung des Goetheschen Wortschatzes sei gleichbedeutend mit der Schaffung einer „Magna Charta für das neuere Deutsch“. Dem

GOETHE-WÖRTERBUCH. Herausgegeben von der Deutschen Akademie der Wissenschaften zu Berlin, der Akademie der Wissenschaften in Göttingen und der Heidelberger Akademie der Wissenschaften. Unter der wissenschaftlichen Leitung von Wolfgang Schadewaldt, Werner Simon und Wilhelm Wissmann. W. Kohlhammer, Stuttgart, Berlin, Köln, Mainz, Lieferungen zum 1. Band 1966 ff.
liegt die Weimarer Sophienausgabe (143 Bände, erschienen 1887-1919) zugrunde. Als Ergebnis der Verzettelung der Goetheschen Schriftmasse durch Studenten und junge Doktoren besteht seit 1962/63 ein Kartenarchiv, das etwa drei Millionen Karten (Goethesche Belege) verwahrt. Der auf fünf bis sechs Binde zu je tausend zweispaltigen Seiten berechnete Goethe-Thesaurus wird voraussichtlich um das fahr 2000 fertiggestellt sein. Wie groß ist die Gewähr, dass die in „mühevoller Kleinarbeit“ zusammengelesenen Belege vollständig sind? Kommt, wie die Tübinger Arbeitsstelle mitteilt, bei Goethe das Wort „Erlebnis“ wirklich nirgends vor (dessen Fehlen in Kants Wortschatz G. Martins Index mit Absolutheit erweist)?

Zur Erfassung mancher Texte, zum Beispiel der Rechtsanwaltseingaben des jungen Goethe und des ersten Bandes der Geschichte der Farbenlehre, wurde zwar mit Eleganz die automatisierte Textzerlegung und Herstellung von Zettelregistern angewandt. Im ganzen gesehen aber ragt dieser Sprachspeicher gleichsam als erratischer Block in die Landschaft der modernen Philologie. In ihm gipfelt die in Renaissance und Barock anhebende Reihe geistreicher Wortschatzbilanzen.

Der Einsatz elektronischer Rechenanlagen zu nichtnumerischer Datenverarbeitung ist eine menschliche Errungenschaft, die weithin mit der ersten Verwendung von Schriftzeichen und mit der Erfindung der Buchdruckerkunst als gleichrangig eingeschätzt wird. In allen Wissenschaften hat die informationserschließende Maschine zunehmende Bedeutung erlangt. 1957 erregte die mittels eines automatisierten Verfahrens bergestellte textkritische Bibelkonkordanz des amerikanischen Theologen J. W. Ellison weltweit Aufsehen. In der Jurisprudenz verspricht man sich von einer elektronischen Bearbeitung vollständiger Quellentexte Auswirkungen auf Gesetzgebung, Rechtsprechung und Wissenschaft.

Während sich irn Lauf der letzten hundert Jahre, seit Marx' Zeit, die Produktivität eines Fabrikarbeiters uni das 14-fache erhöhte, stieg die des Büroarbeiters nur auf den 1,5-fachen Wert an. Hochleistungsfähige Datenverarbeitungssysteme sind dabei, diesen Rückstand aufzuholen.

Das Goethe-Wörterbuch und der Allgemeine Kantindex haben beide ihren methodologischen Ursprung in der Leibnizzeit. Die Komptometer der Denker Pascal und Leibniz bildeten in nuce „unsere“ Computer vor. Nie werden logische Elektronenrechner dagegen die Leibnizsche Vorstellung von einer „bewunderungswürdigen“ Machina mundi in die Wirklichkeit umsetzen, deren „göttliche Mathematik“ und „metaphysischer Mechanismus“ sich menschlichem Zugriff entzieht. Anders wäre es um die Möglichkeit bestellt, sämtliche kanonisierten Heiligen Schriften – Awesta. Bibel. Buddhas Reden, Koran, Tao-te-king etc. – maschinenlesbar zu speichern, um dann. einen interreligiösen Thesaurus abzurufen ...

Was für Möglichkeiten! Und wenn der Computer eine Programmphase mit dem Satz SOURCE PROGRAM ERROR / NO COMPILATION selbsttätig abbräche oder, wie nach erfolgreichem Abschluss eines Indizierprogramms zu Kants Schriften, wenn er lakonisch kommentierte: END OF JOB, – allemal steht dann ein Rest an. Dieser Rest ist Geist.
 


© (1968)  Gerd Hergen Lübben