DE:Textsuche

From IP7 Wiki
Revision as of 10:40, 15 March 2018 by C.nothen (talk | contribs) (→‎Fuzzy)

Text-Suchblock

Mit dem Text-Suchblock können umfangreiche Volltextrecherchen erstellt werden.
In diesem Suchblock gibt es generell 2 Auswahlmöglichkeiten:
Volltextsuche oder Semantische Suche

Mit den Optionen Titel, Zusammenfassung, Ansprüche und Beschreibung können Sie festlegen welche Texte durchsucht werden sollen.

Trunkierung

Es gibt folgende Möglichkeiten Begriffe zu trunkieren:

  • * - kein bis beliebig viele Zeichen
  • % - kein bis 1 Zeichen
  • ? - genau ein Zeichen

Beispiele

?otogra?ie

findet unter anderem:
fotografie

findet unter andrem nicht:
photographie
?%otogra?%ie

findet unter anderem:
photographie, fotografie, fotographie, photografie

boolesche Operatoren

Die drei folgenden Operatoren stehen für die Verknüpfung von Begriffen zur Verfügung.

AND

OR

NOT

Mit AND, OR Operatoren und Klammersetzung können z.B. Synonyme kombiniert werden.

Beispiel

(fahrrad* or bike) and (batter%% or akku*)


Boost

Mit der Boost-Funktion ist es möglich einfluss auf das Volltext-Ranking zu nehmen.
Einzelne Begriffe können verstärkt werden und somit kann die Sortierung der Ergebnisliste beeinflusst werden.


Beispiel

fuel and cell

Der Begriff "fuel" ist für den Benutzer interessanter als der Begriff "cell" und soll höher gewichtet werden.

fuel^2.5 and cell

Der Wert des Begriffs "fuel" wird somit um 2,5 multipliziert.


Fuzzy

Die Fuzzy-Suche basiert auf dem Damerau-Levenshtein-Distanz Algorithmus. Sie findet Begriffe, die dem angegebenen Begriff ähnlich sind.

Hinter dem Fuzzy-Operator kann optional die Distanz (Anzahl an zulässigen Änderungen) angegeben werden. Eine Änderung kann das Hinzufügen, Löschen oder Ersetzen eines einzelnen Zeichens sein.

Wird keine Distanz angegeben, wird die Distanz automatisch anhand der Länge des angegebenen Begriffs gewählt:

  • Weniger als 3 Zeichen: Begriffe müssen exakt übereinstimmen.
  • 3 bis einschließlich 5 Zeichen: Eine Änderung zulässig.
  • 6 Zeichen und mehr: Zwei Änderungen zulässig.

Beispiel

electronic~
(max. 2 Änderungen, Begriff hat über 6 Zeichen)
findet unter anderem:
electronic
elektronik

aber auch:
electron

Anzahl der Änderungen manuell angeben

kraftstoffluss~1
(max. eine Änderungen)
findet unter anderem:
kraftstoffluss
kraftstofffluss

Der Fuzzy Operator ist nicht kombinierbar mit Trunkierungen und kann nur auf einen Begriff angewendet werden.

Phrase

Sobald Begriffe in Anführungszeichen gesetzt werden, wird genau nach dieser Folge von Begriffen gesucht.

Beispiel

"fuel cell"

entspricht:
span(fuel cell, 0)

Außerdem ist es somit auch möglich nach Schlüsselbegriffen wie z.B. Operatoren zu suchen.

Beispiel

"Menschen in Not"

Folgendermaßen kann auch nach einem "-Zeichen gesucht werden.

"fuel\""
es wird gesucht nach:
fuel"


Platzhalter

Werden zwischen 2 Begriffen keine Operatoren angegeben, werde diese automatisch mit AND verknüpft.

Beispiel

fuel cell

entspricht:
fuel and cell

Werden 2 Begriffe mit – Zeichen verknüpft, werden diese in englischen Texten in genau dieser Reihenfolge gesucht.
Innerhalb deutscher Texte werden die 2 Begriffe zusammengeführt.

Beispiel

fuel-cell

sucht in englischen Texten nach:
span (fuel cell, 0)

sucht in deutschen Texten nach:
fuelcell

Abstandsoperatoren

span

Begriffe werden in einem angegebenen maximalen Wortabstand gesucht.
Hierbei wird die Reihenfolge der Begriffe berücksichtigt.

Beispiel

span (fuel cell, 2)

Es muss im Text fuel und darauf folgend cell vorkommen, zwischen beiden Begriffen dürfen bis zu 2 Begriffe vorkommen.

near

Begriffe werden in einem angegebenen maximalen Wortabstand gesucht.
Hierbei wird die Reihenfolge der Begriffe nicht berücksichtigt.

Beispiel

near (fuel cell, 2)

Es muss im Text fuel und cell vorkommen, zwischen beiden Begriffen dürfen bis zu 2 Begriffe vorkommen.


Reguläre Ausdrücke "Regexp"

Es ist möglich in der Suche reguläre Ausdrücke zu verwenden.

Beispiel

span(/<3-7>/ mm, 0)

sucht nach 3-7 mm (aber nicht nach z.B. 3,5)

Grundlage der Textsuche

TextSearchBase.jpg

Mithilfe folgender Optionen kann die Grundlage der Textsuche bestimmt werden.
Document, Application, Strict family oder Extended family

Je nach ausgewählter Option wird bestimmt, über welche Texte die Begriffe gesucht werden.

Beispiel

fuel and cell

ausgewählte Texte: Title 

Document – beide Begriffe müssen im Titel eines Dokuments vorkommen
Application – ein Begriff kann im Titel der A-Schrift vorkommen, der andere Begriff im Titel der entsprechenden B-Schrift
Strict Family – ein Begriff kommt im Titel eines Dokuments eines Lands vor, der andere Begriff im Titel eines Dokuments aus einem anderen Land, beide Dokumente gehören zur gleichen strict family
Extended Family - gleich wie bei der Strict Family nur mit dem Unterschied, dass beide Dokumente zur gleichen extended family gehören müssen

Je größer die Grundlage der Textsuche gewählt wird, desto höher wird die Trefferanzahl ausfallen.
Document (wenige Treffer) → Extended family (mehr Treffer)

Grundlage der Textsuche und die gewählte Basis der gesamten Suche

TextSearchExample.jpg

In dieser Suche wird über Dokument der Text „fuel and cell“ gesucht.
Die Begriffe müssen also innerhalb eines Dokuments vorkommen.

Unten ist die Einheit „Strict family“ ausgewählt.

Es werden also alle Suchblöcke auf die strikte Familie angereichert.
Somit kann z.B. „fuel cell“ in einem US-Dokument vorkommen und in der gleichen strikten Familie ein DE-Dokument und dann wird diese strikte Familie gefunden.

Stellt man die untere Einstellung von „Strict family“ auf „Document“ um, dann muss „fuel cell“ in einem DE-Dokument enthalten sein.