Im Zentrum steht ein Projekt, das das Ziel verfolgt, eine integrierte Recherche in den
Datenbeständen der GESIS-Institute unter einer einheitlichen benutzerfreundlichen
Oberfläche zu ermöglichen.
Ausgangsbasis für das Projekt GESINE
(Integriertes sozialwissenschaftliches Informationssystem) ist eine empirische Erhebung
der Informationsbedürfnisse von Nutzern, die in Form von Experteninterviews an den
GESIS-Instituten durchgeführt wurde. Der Wunsch nach einer stärkeren Integration der
verschiedenen Informationstypen stand in den Gesprächen im Vordergrund. So interessieren
einen Sozialwissenschaftler, der im Bereich Wahlforschung arbeitet und Informationen zum
Thema Parteienidentifikation sucht, nicht nur einzelne Literatur- und Projektnachweise,
sondern auch Umfragedaten über die Einstellung von Parteimitgliedern zu ihrer Partei und
ggf. auch methodische Informationen über Skalen zur Messung der Identifikation mit einer
Partei.
Dieser Informationsbedarf führte zu einer Konzeption eines integrierten
Informationssystems für die Sozialwissenschaften auf der Basis der GESIS-Datenbestände.
Die technisch-konzeptionelle Grundlage für das System bildet die Entwicklung eines
relationalen Datenmodells auf der Basis einer verteilten Datenhaltung. Für die
Datenbestände des IZ (SOLIS/FORIS), das GESIS-Clearinghouse und die ALLBUS-Bibliographie
wurde bereits ein solches Datenmodell definiert und in einer ORACLE-Datenbank
implementiert.
Die Integration von strukturierten und unstrukturierten Datenbeständen ist allerdings
erst seit kurzem Gegenstand der informationswissenschaftlichen Forschung. Ein
allgemeingültiges Retrievalmodell für Texte und Daten liegt bisher noch nicht vor - auch
nicht für die besonderen Gegebenheiten in den Sozialwissenschaften. Die Grundlagen dafür
müssen somit aus der Domäne und den Zielrichtungen des Anwendungsbereichs gewonnen
werden.
Als technologische Basis für das Grundkonzept eines integrativen Rechercheverfahrens für
GESINE bieten sich quantitativ-statistische Retrievalmodelle an, die Textbestände
automatisch indexieren und über Ranking-Funktionalität im Output verfügen. In diesem
Zusammenhang wurde in einem ausführlichen Retrievaltest die intellektuelle
Verschlagwortung am IZ mit der automatischen Indexierung
auf der Basis des Systems freeWAIS-sf verglichen. Es zeichnet sich ab, daß erst eine
Mehrfachindexierung zu einer effektiven Leistungssteigerung bei der Recherche führt.
Mögliche Einsatzgebiete für eine automatische Indexierung sind auch das
GESIS-Clearinghouse und Datenbestände, die sich im Zusammenhang mit der Realisierung des
Schalenmodells (polyzentrisches Grundmodell der Informationsversorgung) ergeben.
In den Gesprächen mit GESIS-Mitarbeitern stellte sich heraus, daß ein grundlegendes
Problem bei der Suche in Datenbanken die Vagheit der Informationsanfragen ist. Dies
ist z.B. der Fall, wenn der Benutzer zu einem bestimmten recherchierten Projekt ein
thematisch ähnliches Projekt finden möchte oder Überblicksliteratur zu seinem
Thema sucht. Um den Benutzer hier effektiv unterstützen zu können, werden
Mehrwertkomponenten benötigt, die inhaltliche und strukturelle Beziehungen zwischen
Informationsobjekten identifizieren und somit zur Informationsverdichtung beitragen
können. Anknüpfungspunkte hierfür liefert das Projekt AKCESS (Assistance by
Knowledge-Based Context Evaluation in Social Science Retrieval), in dem für einige
Bereiche bereits Lösungsansätze entwickelt und erfolgreich getestet wurden.
Ein weiteres Problem, daß sich bei der GESIS-internen Bedarfsanalyse herauskristallisiert
hat, ist die Unterstützung von wiederkehrenden institutionellen und die GESIS insgesamt
betreffenden Arbeitsabläufen. Für diesen Bereich ist bereits exemplarisch eine
Komponente (COGET: Computergestützte Erstellung von Themendokumentationen) entwickelt
worden, die zur effizienteren Erstellung von Themendokumentationen eingesetzt werden kann.
Um diese FuE-Aktivitäten herum gruppieren sich drei Drittmittel- bzw. Projekte des
Hochschulsonderprogramms (HSP):