DE:Textsuche: Difference between revisions

From IP7 Wiki
Line 57: Line 57:
Die drei folgenden Operatoren stehen für die Verknüpfung von Begriffen zur Verfügung.<br />
Die drei folgenden Operatoren stehen für die Verknüpfung von Begriffen zur Verfügung.<br />


'''AND'''<br />
* '''AND'''
 
* '''OR'''
'''OR'''<br />
* '''NOT'''
 
'''NOT'''<br />


Mit AND, OR Operatoren und Klammersetzung können z.B. Synonyme kombiniert werden.
Mit AND, OR Operatoren und Klammersetzung können z.B. Synonyme kombiniert werden.
Line 79: Line 77:
entspricht:
entspricht:
fuel and cell
fuel and cell
</pre>
<br/>
Die Operatoren können mit folgenden Zeichen abgekürzt werden:
* AND - '''&'''
* OR  - '''|'''
* NOT - '''!'''
'''Beispiel'''
<pre>
(fuel & cell) | Brennstoffzell*
entspricht:
(fuel and cell) or Brennstoffzell*
</pre>
</pre>



Revision as of 08:52, 1 August 2019

Text-Suchblock

SrchText.jpg

Mit dem Text-Suchblock können umfangreiche Volltextrecherchen erstellt werden.
In diesem Suchblock gibt es generell 2 Auswahlmöglichkeiten:
Volltextsuche oder Semantische Suche

Mit den Optionen Titel, Zusammenfassung, Ansprüche und Beschreibung kann festgelegt werden welche Texte durchsucht werden sollen.

Sobald innerhalb einer Suche nach Text gesucht wird, wird das Ergebnis nach einem Volltext-Ranking sortiert.
Somit sollen möglichst die relevanten Treffer in der Ergebnisliste oben stehen und die uninteressanten Treffer unten angezeigt werden.
Dabei werden die Suchbegriffe in den Texten gezählt. Außerdem findet eine Gewichtung der Suchbegriffe statt. Ist der Suchbegriff im Titel erfährt dieser eine höhere Gewichtung als wenn der Suchbegriff nur in der Beschreibung auftritt.

Semantische Suche

Die semantische Suche funktioniert nur mit englischen Texten.
Je allgemeiner der angegebene Text formuliert ist, desto ungenauer sind die Ergebnisse der semantischen Suche.

Es empfiehlt sich deshalb z.B. nur den wichtigsten bzw. interessantesten Anspruch in die semantische Suche zu kopieren. (z.B. der erste Anspruch)

Die semantische Suche empfiehlt sich als Werkzeug um ähnliche Patente zu finden.
Die Treffermenge einer semantischen Suche kann anschließend z.B. über den Filter weiter bearbeitet werden.

Volltextsuche

Eine boolesche Textsuche mit umfangreichen Funktionen und Möglichkeiten, welche hier genauer erklärt werden.
Die Volltextsuche ist im Gegensatz zur semantischen Suche nachvollziehbar und sollte deshalb für z.B. FTO-Recherchen oder Monitoring-Profile verwendet werden.

Trunkierung

Es gibt folgende Möglichkeiten Begriffe zu trunkieren:

  • * - kein bis beliebig viele Zeichen
  • % - kein bis 1 Zeichen
  • ? - genau ein Zeichen

Beispiele

?otogra?ie

findet unter anderem:
fotografie

findet unter andrem nicht:
photographie
?%otogra?%ie

findet unter anderem:
photographie, fotografie, fotographie, photografie

boolesche Operatoren

Die drei folgenden Operatoren stehen für die Verknüpfung von Begriffen zur Verfügung.

  • AND
  • OR
  • NOT

Mit AND, OR Operatoren und Klammersetzung können z.B. Synonyme kombiniert werden.

Beispiel

(fahrrad* or bike) and (batter%% or akku*)

Werden zwischen 2 Begriffen keine Operatoren angegeben, werde diese automatisch mit AND verknüpft.
Sobald Operatoren in einer Suche verwendet werden, müssen Operatoren in der gesamten Suche, also zwischen allen Begriffen, verwendet werden.

Beispiel

fuel cell

entspricht:
fuel and cell


Die Operatoren können mit folgenden Zeichen abgekürzt werden:

  • AND - &
  • OR - |
  • NOT - !

Beispiel

(fuel & cell) | Brennstoffzell*

entspricht:
(fuel and cell) or Brennstoffzell*

Boost

Mit der Boost-Funktion ist es möglich einfluss auf das Volltext-Ranking zu nehmen.
Einzelne Begriffe können verstärkt werden und somit kann die Sortierung der Ergebnisliste beeinflusst werden.


Beispiel

fuel and cell

Der Begriff "fuel" ist für den Benutzer interessanter als der Begriff "cell" und soll höher gewichtet werden.

fuel^2.5 and cell

Der Wert des Begriffs "fuel" wird somit um 2,5 multipliziert.


Fuzzy

Die Fuzzy-Suche basiert auf dem Damerau-Levenshtein-Distanz Algorithmus. Sie findet Begriffe, die dem angegebenen Begriff ähnlich sind.

Hinter dem Fuzzy-Operator kann optional die Distanz (Anzahl an zulässigen Änderungen) angegeben werden. Eine Änderung kann das Hinzufügen, Löschen oder Ersetzen eines einzelnen Zeichens sein.

Wird keine Distanz angegeben, wird die Distanz automatisch anhand der Länge des angegebenen Begriffs gewählt:

  • Weniger als 3 Zeichen: Begriffe müssen exakt übereinstimmen.
  • 3 bis einschließlich 5 Zeichen: Eine Änderung zulässig.
  • 6 Zeichen und mehr: Zwei Änderungen zulässig.

Beispiel

electronic~
(max. 2 Änderungen, Begriff hat über 6 Zeichen)
findet unter anderem:
electronic
elektronik

aber auch:
electron

Anzahl der Änderungen manuell angeben

kraftstoffluss~1
(max. eine Änderungen)
findet unter anderem:
kraftstoffluss
kraftstofffluss

Der Fuzzy Operator ist nicht kombinierbar mit Trunkierungen und kann nur auf einen Begriff angewendet werden.

Phrase

Sobald Begriffe in Anführungszeichen gesetzt werden, wird genau nach dieser Folge von Begriffen gesucht.

Beispiel

"fuel cell"

entspricht:
span(fuel cell, 0)

Es ist somit auch möglich nach Schlüsselbegriffen wie z.B. Operatoren zu suchen.

Beispiel

"Menschen in Not"

Außerdem kann mit den Anführungszeichen nach Nummern gesucht werden.
Beispiel

"420"

Folgendermaßen kann auch nach einem "-Zeichen gesucht werden.

"fuel\""
es wird gesucht nach:
fuel"

Platzhalter

Werden 2 Begriffe mit – Zeichen verknüpft, werden diese in genau dieser Reihenfolge gesucht.

Beispiel

fuel-cell

sucht nach:
span (fuel cell, 0)

Kommentare

Es ist möglich in der Textsuche Kommentare hinzuzufügen.
Kommentare werden bei der Textsuche nicht berücksichtigt und dienen nur als Information für den Benutzer.

Beispiel

TextSearchComment.jpg


Abstandsoperatoren

span

Begriffe werden in einem angegebenen maximalen Wortabstand gesucht.
Hierbei wird die Reihenfolge der Begriffe berücksichtigt.

Beispiel

span (fuel cell, 2)

Es muss im Text fuel und darauf folgend cell vorkommen, zwischen beiden Begriffen dürfen bis zu 2 Begriffe vorkommen.

near

Begriffe werden in einem angegebenen maximalen Wortabstand gesucht.
Hierbei wird die Reihenfolge der Begriffe nicht berücksichtigt.

Beispiel

near (fuel cell, 2)

Es muss im Text fuel und cell vorkommen, zwischen beiden Begriffen dürfen bis zu 2 Begriffe vorkommen.


Innerhalb der Abstandsoperatoren near und span können auch mehrere Begriffe mit z.B. "OR" kombiniert werden.

Beispiel

near ((electric or elektrisch) (generator or Stromerzeuger or stromgenerator), 3)

Synonym-Gruppen aus dem Highlighting in die Textsuche übernehmen

In der Volltextsuche können alle Begriffe einer Synonym-Gruppe(Highlighting) hinzugefügt werden.
Gesammelte Synonyme können somit für die Recherche wiederverwendet werden.

Sobald ein Begriff im Textfeld eingetragen wurde, lassen sich mit der Tastenkombination Strg + Leertaste die Synonym-Gruppen anzeigen, welche den Begriff beinhalten.
SearchTextHLgroups.jpg

Es werden dabei immer alle Gruppen aus allen Highlighting Schematas berücksichtigt.

Anschließend kann die gewünschte Gruppe mit den Pfeiltasten ausgewählt werden. Mit der Enter- oder Tabulator-Taste werden dann die Synonyme automatisch in die Suche übernommen.
SearchTextHLgroups2.jpg

Reguläre Ausdrücke "Regexp"

Es ist möglich in der Suche reguläre Ausdrücke zu verwenden.

Beispiele

span(/<3-7>/ mm, 0)

sucht nach 3-7 mm (aber nicht nach z.B. 3,5)

Der Begriff "Kamera" wird z.B. in der deutschen Patentsprache oft in einem zusammengesetzte Nomen umschrieben.
In diesem Fall kann ein regulärer Ausdruck verschiedene Fälle bzw. Schreibweisen abbilden:

/.*bild(erfassung|speicherung|aufnahme).*(gerät|einrichtung|einheit|apparat).*/

findet z.B. Bilderfassungseinheit, Bildaufnahmeeinrichtung oder Bildaufnahmegerät usw.

Grundlage der Textsuche

TextSearchBase.jpg

Mithilfe folgender Optionen kann die Grundlage der Textsuche bestimmt werden.
Document, Application, Strict family oder Extended family

Je nach ausgewählter Option wird bestimmt, über welche Texte die Begriffe gesucht werden.

Beispiel

fuel and cell

ausgewählte Texte: Title 

Document – beide Begriffe müssen im Titel eines Dokuments vorkommen
Application – ein Begriff kann im Titel der A-Schrift vorkommen, der andere Begriff im Titel der entsprechenden B-Schrift
Strict Family – ein Begriff kommt im Titel eines Dokuments eines Lands vor, der andere Begriff im Titel eines Dokuments aus einem anderen Land, beide Dokumente gehören zur gleichen strict family
Extended Family - gleich wie bei der Strict Family nur mit dem Unterschied, dass beide Dokumente zur gleichen extended family gehören müssen

Je größer die Grundlage der Textsuche gewählt wird, desto höher wird die Trefferanzahl ausfallen.
Document (wenige Treffer) → Extended family (mehr Treffer)

Grundlage der Textsuche und die gewählte Basis der gesamten Suche

TextSearchExample.jpg

In dieser Suche wird über Dokument der Text „fuel and cell“ gesucht.
Die Begriffe müssen also innerhalb eines Dokuments vorkommen.

Unten ist die Einheit „Strict family“ ausgewählt.

Es werden also alle Suchblöcke auf die strikte Familie angereichert.
Somit kann z.B. „fuel cell“ in einem US-Dokument vorkommen und in der gleichen strikten Familie ein DE-Dokument und dann wird diese strikte Familie gefunden.

Stellt man die untere Einstellung von „Strict family“ auf „Document“ um, dann muss „fuel cell“ in einem DE-Dokument enthalten sein.