GESISinactiveInhaltsverzeichnis^Ebene höherZurückblätternVorblätternSuche...SoWi.LinksHilfeIZ

Auseinandersetzung mit den konkurrierenden Verfahren der Inhaltserschließung

Die Art der Inhaltserschließung der Dokumente in einer Datenbank hat einen zentralen Einfluß auf die Güte der Recherche und ist zudem kostenintensiv. Fehlentscheidungen in dieser Komponente wirken sich deshalb stark aus. Gleichzeitig besteht bei den Fachwissenschaftler Konsens darüber, daß es bei dieser Entscheidung keine generelle Lösung gibt: Die Frage nach der "richtigen" Form der Inhaltserschließung ist eng mit dem erschlossenem Fachgebiet verbunden. Was sich z.B. für Informatikpublikationen als sinnvoll zeigt, kann für die sozialwissenschaftlichen Texte zu negativen Ergebnissen führen.

Intellektuelle Indexierungsverfahren verkörpern am klarsten die Grundidee einer möglichst weitgehenden Regulation, die Konsistenz erreichen soll. So erschließt das Informationszentrum Sozialwissenschaften seine Literatur- und Forschungsprojektdatenbanken intellektuell auf der Basis eines Thesaurus, der partiell hierarchisch organisiert ist. Alle vergebenen Begriffe (Ausnahme: Zusatzfeld für "freie Begriffe") entnimmt der Indexierer einem ständig zu pflegenden Thesaurus. Die hier enthaltenen Terme bilden ein geschlossenes semantisches System.

Die Frage, ob eine intellektuelle Indexierung auf der Basis kontrollierter Thesauri einer automatischen qualitativ überlegen sei, führt zu den unterschiedlichsten Einschätzungen, die sich in der Regel auf Evaluationsergebnisse zu verschiedenen Studien aus dem englischsprachigen Raum stützen. Neben einer klar ablehnenden Haltung in Salton steht z.B. die von D. R. Swanson, den Salton mit seiner Arbeit von 1960 noch zitiert als "probably the earliest result showing the superiority of automatic text searching". Er kommt zu dem Schluß:

"Machines cannot recognize meaning and so cannot duplicate what human judgement in principle can bring to the process of indexing and classifying documents ... Consitently effective fully automatic indexing and retrieval is not possible"

Generell ist die Frage, welche der beiden grundsätzlichen Methoden heute vorzuziehen ist, durchaus offen. Sie wäre durch vergleichende Evaluationen für den jeweiligen Anwendungsbereich zu klären und ist zudem stark mit der Verbreitung von Autorenabstracts in einem Fachgebiet (bei den Sozialwissenschaften nur bei 20%) und der rechtlichen Ausgangssituation bei der Verwertung von Volltexten verknüpft. Die gleiche Unsicherheit herrscht in Bezug auf alternative Ansätze automatischer Indexierung, die die heutigen Standardverfahren nicht ergänzen, sondern vollständig ersetzen würden, wie z.B. statistisch-quantitative Verfahren.. Es gibt zudem eine Reihe von Vorschlägen für erfolgversprechender Zusatzkomponenten, die Effizienzsteigerungen durch kontinuierliche Verbesserungen erwarten lassen (Visualisierung der Oberflächen, intelligente Unterstützungskomponenten, extended Boolesche Algebra).
Auf einer tieferen Problemebene sind zudem effizienzsteigernde Maßnahmen durch eine stärkere Automatisierung der formalen Erfassung zu beachten. 

GESISinactiveInhaltsverzeichnis^Ebene höherZurückblätternVorblätternSuche...SoWi.LinksHilfeIZ

© GESIS IZ 27.09.1996