|
Es ist ja nicht so, dass TM keine Hilfe beim Erstellen von Registern gäbe. Doch ein brauchbares Register setzt eine Analyse des Textes voraus, die Software bisher noch nicht leisten kann. (Gut, vielleicht hat die NSA Programme, die sowas können, doch diese filtern Terrorverdächtige aus dem Mailverkehr heraus und erstellen keine Register von Gutachten.) Man kann natürlich sagen, ein Programm soll alle Vorkommen eines bestimmten Wortes registrieren und auflisten. Daraus entsteht aber nur eine Wortliste, kein Stichwortverzeichnis. Einer Wortliste kann ich zwar entnehmen, wo das Wort "Hund" auftritt, ich kann aber daraus nicht ersehen, ob es sich nun um einen echten Hund, ein Bild oder eine Statue oder aber um ein Schimpfwort handelt. In einem kunsthistorischen Text kann z. B. stehen, dass irgendwo Hunde abgebildet seien. Daneben kann auch stehen, dass es diese Hunde zur Zeit der Entstehung dieser Bilder gar nicht gegeben hat, sondern dass sie z. B. reiner Bild-Tradition entstammen, die von einer ganz anderen Kultur ererbt wurde, in der es diese Hunde tatsächlich einmal gegeben hat, bevor sie ausstarben. Ein gutes Register unterscheidet nun zwischen Hund (Bild) und Hund (Tier). Es kann aber noch viel schlimmer kommen: In einem Text kann derselbe Begriff in verschiedenen Formen auftauchen. Bekannte Beispiele sind "der Philosoph" und "der Apostel", die daneben auch Aristoteles und Paulus bzw. einfach nur "er" heissen können. Es hilft wenig, nur "Paulus" zu erfassen, wenn er mehr als doppelt so oft einfach nur "der Apostel" oder "er" genannt wird. Ein solcher Eintrag wäre schlicht unbrauchbar. Ein bekannter Philosoph wie Platon kann in einem Text schon einmal in seiner griechischn Form erwähnt werden, und dann ist ziemlich sicher eine andere Schriftart verwendet worden, eben eine griechische. Woher soll dann ein Programm wissen, dass Plato, Platon, Platons und platw,n dasselbe sind? (Wir wollen einmal griechische Flexionsformen wie platw,nos oder platw,na fortlassen - vielleicht meint jemand noch irrtümlich, die Form auf -a sei ein Frauenname.) Was soll schliesslich ein Programm in Fällen von Synonymen anfangen? Wenn jemand über die Geschichte der Wiedergeburtsvorstellungen in Europa schreibt, dann werden neben "Wiedergeburt" gewiss auch "Reinkarnation", "Seelenwanderung" und "Metempsychose" auftauchen. Was soll nun geschehen? Eine sinnvolle Möglichkeit bestünde z. B. darin, sich für eines dieser Wörter als Oberbegriff zu entscheiden und alle Einträge darunter zusammenzufassen, die anderen Begriffe hingegen mit dem Hinweis "siehe x" zu versehen. Ich will hier aufhören, ich glaube, das Problem sei nun allgemein nachvollziehbar.
|