DE:Textsuche: Difference between revisions

From IP7 Wiki
Line 211: Line 211:


sucht nach 3-7 mm (aber nicht nach z.B. 3,5)
sucht nach 3-7 mm (aber nicht nach z.B. 3,5)
</pre>
<pre>
/.*(bild|optisch|visuell).*(erfassung|speicherung|aufnahme).*(gerät|einrichtung|einheit|apparat).*/
findet z.B. Bilderfassungseinheit, Bildaufnahmeeinrichtung oder Bildaufnahmegerät usw.
</pre>
</pre>



Revision as of 09:27, 25 Haziran 2018

Text-Suchblock

Mit dem Text-Suchblock können umfangreiche Volltextrecherchen erstellt werden.
In diesem Suchblock gibt es generell 2 Auswahlmöglichkeiten:
Volltextsuche oder Semantische Suche

Mit den Optionen Titel, Zusammenfassung, Ansprüche und Beschreibung können Sie festlegen welche Texte durchsucht werden sollen.

Trunkierung

Es gibt folgende Möglichkeiten Begriffe zu trunkieren:

  • * - kein bis beliebig viele Zeichen
  • % - kein bis 1 Zeichen
  • ? - genau ein Zeichen

Beispiele

?otogra?ie

findet unter anderem:
fotografie

findet unter andrem nicht:
photographie
?%otogra?%ie

findet unter anderem:
photographie, fotografie, fotographie, photografie

boolesche Operatoren

Die drei folgenden Operatoren stehen für die Verknüpfung von Begriffen zur Verfügung.

AND

OR

NOT

Mit AND, OR Operatoren und Klammersetzung können z.B. Synonyme kombiniert werden.

Beispiel

(fahrrad* or bike) and (batter%% or akku*)

Werden zwischen 2 Begriffen keine Operatoren angegeben, werde diese automatisch mit AND verknüpft.

Beispiel

fuel cell

entspricht:
fuel and cell

Boost

Mit der Boost-Funktion ist es möglich einfluss auf das Volltext-Ranking zu nehmen.
Einzelne Begriffe können verstärkt werden und somit kann die Sortierung der Ergebnisliste beeinflusst werden.


Beispiel

fuel and cell

Der Begriff "fuel" ist für den Benutzer interessanter als der Begriff "cell" und soll höher gewichtet werden.

fuel^2.5 and cell

Der Wert des Begriffs "fuel" wird somit um 2,5 multipliziert.


Fuzzy

Die Fuzzy-Suche basiert auf dem Damerau-Levenshtein-Distanz Algorithmus. Sie findet Begriffe, die dem angegebenen Begriff ähnlich sind.

Hinter dem Fuzzy-Operator kann optional die Distanz (Anzahl an zulässigen Änderungen) angegeben werden. Eine Änderung kann das Hinzufügen, Löschen oder Ersetzen eines einzelnen Zeichens sein.

Wird keine Distanz angegeben, wird die Distanz automatisch anhand der Länge des angegebenen Begriffs gewählt:

  • Weniger als 3 Zeichen: Begriffe müssen exakt übereinstimmen.
  • 3 bis einschließlich 5 Zeichen: Eine Änderung zulässig.
  • 6 Zeichen und mehr: Zwei Änderungen zulässig.

Beispiel

electronic~
(max. 2 Änderungen, Begriff hat über 6 Zeichen)
findet unter anderem:
electronic
elektronik

aber auch:
electron

Anzahl der Änderungen manuell angeben

kraftstoffluss~1
(max. eine Änderungen)
findet unter anderem:
kraftstoffluss
kraftstofffluss

Der Fuzzy Operator ist nicht kombinierbar mit Trunkierungen und kann nur auf einen Begriff angewendet werden.

Phrase

Sobald Begriffe in Anführungszeichen gesetzt werden, wird genau nach dieser Folge von Begriffen gesucht.

Beispiel

"fuel cell"

entspricht:
span(fuel cell, 0)

Es ist somit auch möglich nach Schlüsselbegriffen wie z.B. Operatoren zu suchen.

Beispiel

"Menschen in Not"

Außerdem kann mit den Anführungszeichen nach Nummern gesucht werden.
Beispiel

"420"

Folgendermaßen kann auch nach einem "-Zeichen gesucht werden.

"fuel\""
es wird gesucht nach:
fuel"

Platzhalter

Werden 2 Begriffe mit – Zeichen verknüpft, werden diese in genau dieser Reihenfolge gesucht.

Beispiel

fuel-cell

sucht nach:
span (fuel cell, 0)

Abstandsoperatoren

span

Begriffe werden in einem angegebenen maximalen Wortabstand gesucht.
Hierbei wird die Reihenfolge der Begriffe berücksichtigt.

Beispiel

span (fuel cell, 2)

Es muss im Text fuel und darauf folgend cell vorkommen, zwischen beiden Begriffen dürfen bis zu 2 Begriffe vorkommen.

near

Begriffe werden in einem angegebenen maximalen Wortabstand gesucht.
Hierbei wird die Reihenfolge der Begriffe nicht berücksichtigt.

Beispiel

near (fuel cell, 2)

Es muss im Text fuel und cell vorkommen, zwischen beiden Begriffen dürfen bis zu 2 Begriffe vorkommen.


Innerhalb der Abstandsoperatoren near und span können auch mehrere Begriffe mit z.B. "OR" kombiniert werden.

Beispiel

near ((electric or elektrisch) (generator or Stromerzeuger or stromgenerator), 3)

Synonym-Gruppen aus dem Highlighting in die Textsuche übernehmen

In der Volltextsuche können alle Begriffe einer Synonym-Gruppe(Highlighting) hinzugefügt werden.
Gesammelte Synonyme können somit für die Recherche wiederverwendet werden.

Sobald ein Begriff im Textfeld eingetragen wurde, lassen sich mit der Tastenkombination Strg + Leertaste die Synonym-Gruppen anzeigen, welche den Begriff beinhalten.
SearchTextHLgroups.jpg

Es werden dabei immer alle Gruppen aus allen Highlighting Schematas berücksichtigt.

Anschließend kann die gewünschte Gruppe mit den Pfeiltasten ausgewählt werden. Mit der Enter- oder Tabulator-Taste werden dann die Synonyme automatisch in die Suche übernommen.
SearchTextHLgroups2.jpg

Reguläre Ausdrücke "Regexp"

Es ist möglich in der Suche reguläre Ausdrücke zu verwenden.

Beispiel

span(/<3-7>/ mm, 0)

sucht nach 3-7 mm (aber nicht nach z.B. 3,5)
/.*(bild|optisch|visuell).*(erfassung|speicherung|aufnahme).*(gerät|einrichtung|einheit|apparat).*/

findet z.B. Bilderfassungseinheit, Bildaufnahmeeinrichtung oder Bildaufnahmegerät usw.

Grundlage der Textsuche

TextSearchBase.jpg

Mithilfe folgender Optionen kann die Grundlage der Textsuche bestimmt werden.
Document, Application, Strict family oder Extended family

Je nach ausgewählter Option wird bestimmt, über welche Texte die Begriffe gesucht werden.

Beispiel

fuel and cell

ausgewählte Texte: Title 

Document – beide Begriffe müssen im Titel eines Dokuments vorkommen
Application – ein Begriff kann im Titel der A-Schrift vorkommen, der andere Begriff im Titel der entsprechenden B-Schrift
Strict Family – ein Begriff kommt im Titel eines Dokuments eines Lands vor, der andere Begriff im Titel eines Dokuments aus einem anderen Land, beide Dokumente gehören zur gleichen strict family
Extended Family - gleich wie bei der Strict Family nur mit dem Unterschied, dass beide Dokumente zur gleichen extended family gehören müssen

Je größer die Grundlage der Textsuche gewählt wird, desto höher wird die Trefferanzahl ausfallen.
Document (wenige Treffer) → Extended family (mehr Treffer)

Grundlage der Textsuche und die gewählte Basis der gesamten Suche

TextSearchExample.jpg

In dieser Suche wird über Dokument der Text „fuel and cell“ gesucht.
Die Begriffe müssen also innerhalb eines Dokuments vorkommen.

Unten ist die Einheit „Strict family“ ausgewählt.

Es werden also alle Suchblöcke auf die strikte Familie angereichert.
Somit kann z.B. „fuel cell“ in einem US-Dokument vorkommen und in der gleichen strikten Familie ein DE-Dokument und dann wird diese strikte Familie gefunden.

Stellt man die untere Einstellung von „Strict family“ auf „Document“ um, dann muss „fuel cell“ in einem DE-Dokument enthalten sein.