Hilfe zur Suche in ISIP

Die Freitextsuche in ISIP basiert auf der Suchmaschine Lucene. Jakarta Lucene ist eine leistungsstarke, vollfunktionsfähige Text-Suchengine, geschrieben in Java.

Die Ergebnisse der Suche werden gewichtet. Dabei werden die besten Resultate zuerst angezeigt.In der Ergebnisliste wird außerdem angegeben, um welche Art von Dokument es sich handelt (html, pdf, ...)

Lucene unterstützt standardmäßig reichhaltige Suchoptionen (Eine Beschreibung der Syntax finden Sie auch unter http://www.lucene.de/2.html):

Ausdrücke

Eine Suchanfrage wird in Ausdrücke und Operatoren unterteilt.
Ein einzelner Ausdruck ist ein Wort wie z. B. "Hallo".
Eine Phrase ist eine Gruppe von Wörtern, von Anführungszeichen umschlossen, wie "Hallo Du".
Mehrere Ausdrücke können mit Hilfe boolescher Operatoren verbunden werden.

Wildcards

Lucene erlaubt Wildcard-Suche für ein oder mehrere Zeichen.
Um einen Platzhalter für ein einzelnes Zeichen anzugeben, wird ein "?" benutzt.
te?t würde nach allen Wörtern wie "test" oder "text" suchen.
Um ein Platzhalter für mehrere Zeichen anzugeben, wird ein "*" benutzt.
test* würde nach allen Wörtern wie "test" oder "tester" suchen.
Beachte: Beide Wildcards können sowohl innerhalb, als auch am Ende der Ausdrucks stehen, nicht jedoch am Beginn.

Fuzzy-Suche (undeutliche Suche)

Lucene unterstützt undeutliche Suche (Levenshtein Distanz Algorithmus).
Um eine undeutliche Suche zu formulieren, benutzt man das Tilde-Symbol ("~") am Ende eines einzelnen Wortes.
lachen~ würde Wörter wie "lachen", "wachen" oder auch "Laschen" finden.

Distanzsuche

Lucene erlaubt das Suchen von Wörtern, die eine bestimmte maximale Distanz voneinander entfernt sind.
Um eine Distanzsuche zu formulieren, muss das Tilde-Symbol ("~"), gefolgt von der Anzahl der Wörter, die diese maximal voneinander entfernt sein dürfen, hinter dem Audruck angegeben werden.
"Guten wiedersehen"~10 würde nach den Wörtern "Guten" und "wiedersehen" suchen, die höchstens 10 Wörter voneinander entfernt liegen dürfen.

Boolesche Operatoren

Es können boolesche Operatoren, wie und, oder, usw. angegeben werden, um die Suche zu spezifizieren.

Die Standardverknüpfung ist UND.

Sollen zwei Ausdrücke ODER-verknüpft werden, so ist dazwischen ein "OR" zu schreiben.
hallo OR du
Sollen zwei Ausdrücke UND-verknüpft werden, so ist dazwischen gar nichts zu schreiben, oder ein "AND", oder aber vor beide Ausdrücke ein "+"-Zeichen.
hallo du oder hallo AND du oder aber +hallo +du
Soll z. B. das Wort "hallo" unbedingt vorkommen, das Wort "du" aber nicht unbedingt, so ist +hallo du zu schreiben.
Es können auch negierende boolesche Operatoren angegeben werden.
Um anzugeben, dass ein Ausdruck nicht vorkommen soll, ist ein NOT, oder aber ein Minuszeichen ("-") vor dem Ausdruck zu schreiben.
hallo NOT du bedeutet, dass "hallo", nicht aber "du" vorkommen soll.
Beachte: der NOT-Operator kann nicht nur mit einem Ausdruck benutzt werden, wie bei NOT "hallo du"

Gruppierung von Elementen

Elemente können gruppiert werden.
Dazu werden Klammern mit den üblichen Regeln benutzt:
(hallo OR du) AND ich sucht alle Dokumente, in denen "ich" vorkommt, sowie "hallo" oder "du".


Zurück