DE:Textsuche: Difference between revisions
Line 225: | Line 225: | ||
Es muss im Text fuel und cell vorkommen, zwischen beiden Begriffen dürfen bis zu 2 Begriffe vorkommen.<br /> | Es muss im Text fuel und cell vorkommen, zwischen beiden Begriffen dürfen bis zu 2 Begriffe vorkommen.<br /> | ||
==== allgemein ==== | |||
Innerhalb der Abstandsoperatoren near und span können auch mehrere Begriffe mit "OR" und Klammern kombiniert werden. | |||
'''Beispiel''' | |||
<pre> | |||
near ((electric or elektrisch) (generator or Stromerzeuger or stromgenerator), 3) | |||
</pre> | |||
Der maximale Wortabstand bezieht sich bei near und span auf alle angegebenen Begriffe bzw. Synonyme.<br /> | |||
'''Beispiel''' | '''Beispiel''' | ||
<pre> | <pre> | ||
span (rotary wing thrust, 4) | |||
</pre> | </pre> | ||
Insgesamt dürfen zwischen den 3 Begriffen maximal 4 Begriffe vorkommen.<br /> | |||
Somit wird z.B. dieses Patent gefunden:<br /> | |||
[[file:SpanNearMax.jpg|380px]] | |||
Wird nur mit Wortabstand 2 gesucht, wird das Patent nicht mehr gefunden. <br /> | |||
=== Synonym-Gruppen aus dem Highlighting in die Textsuche übernehmen === | === Synonym-Gruppen aus dem Highlighting in die Textsuche übernehmen === |
Revision as of 08:47, 26 Mayıs 2020
Text-Suchblock
Mit dem Text-Suchblock können umfangreiche Volltextrecherchen erstellt werden.
In diesem Suchblock gibt es generell 2 Auswahlmöglichkeiten:
Volltextsuche oder Semantische Suche
Mit den Optionen Titel, Zusammenfassung, Ansprüche und Beschreibung kann festgelegt werden welche Texte durchsucht werden sollen.
Sobald innerhalb einer Suche nach Text gesucht wird, wird das Ergebnis nach einem Volltext-Ranking sortiert.
Somit sollen möglichst die relevanten Treffer in der Ergebnisliste oben stehen und die uninteressanten Treffer unten angezeigt werden.
Dabei werden die Suchbegriffe in den Texten gezählt. Außerdem findet eine Gewichtung der Suchbegriffe statt. Ist der Suchbegriff im Titel erfährt dieser eine höhere Gewichtung als wenn der Suchbegriff nur in der Beschreibung auftritt.
Semantische Suche
Die semantische Suche funktioniert nur mit englischen Texten.
Je allgemeiner der angegebene Text formuliert ist, desto ungenauer sind die Ergebnisse der semantischen Suche.
Es empfiehlt sich deshalb z.B. nur den wichtigsten bzw. interessantesten Anspruch in die semantische Suche zu kopieren. (z.B. der erste Anspruch)
Die semantische Suche empfiehlt sich als Werkzeug um ähnliche Patente zu finden.
Die Treffermenge einer semantischen Suche kann anschließend z.B. über den Filter weiter bearbeitet werden.
Volltextsuche
Eine boolesche Textsuche mit umfangreichen Funktionen und Möglichkeiten, welche hier genauer erklärt werden.
Die Volltextsuche ist im Gegensatz zur semantischen Suche nachvollziehbar und sollte deshalb für z.B. FTO-Recherchen oder Monitoring-Profile verwendet werden.
Trunkierung
Es gibt folgende Möglichkeiten Begriffe zu trunkieren:
- * - kein bis beliebig viele Zeichen
- % - kein bis 1 Zeichen
- ? - genau ein Zeichen
Beispiele
?otogra?ie findet unter anderem: fotografie findet unter andrem nicht: photographie
?%otogra?%ie findet unter anderem: photographie, fotografie, fotographie, photografie
boolesche Operatoren
Die drei folgenden Operatoren stehen für die Verknüpfung von Begriffen zur Verfügung.
- AND
- OR
- NOT
Mit AND, OR Operatoren und Klammersetzung können z.B. Synonyme kombiniert werden.
Beispiel
(fahrrad* or bike) and (batter%% or akku*)
Werden zwischen 2 Begriffen keine Operatoren angegeben, werde diese automatisch mit AND verknüpft.
Sobald Operatoren in einer Suche verwendet werden, müssen Operatoren in der gesamten Suche, also zwischen allen Begriffen, verwendet werden.
Beispiel
fuel cell entspricht: fuel and cell
Die Operatoren können mit folgenden Zeichen abgekürzt werden:
- AND - &
- OR - |
- NOT - !
Beispiel
(fuel & cell) | Brennstoffzell* entspricht: (fuel and cell) or Brennstoffzell*
Boost
Mit der Boost-Funktion ist es möglich einfluss auf das Volltext-Ranking zu nehmen.
Einzelne Begriffe können verstärkt werden und somit kann die Sortierung der Ergebnisliste beeinflusst werden.
Beispiel
fuel and cell
Der Begriff "fuel" ist für den Benutzer interessanter als der Begriff "cell" und soll höher gewichtet werden.
fuel^2.5 and cell
Der Wert des Begriffs "fuel" wird somit um 2,5 multipliziert.
Fuzzy
Die Fuzzy-Suche basiert auf dem Damerau-Levenshtein-Distanz Algorithmus. Sie findet Begriffe, die dem angegebenen Begriff ähnlich sind.
Hinter dem Fuzzy-Operator kann optional die Distanz (Anzahl an zulässigen Änderungen) angegeben werden. Eine Änderung kann das Hinzufügen, Löschen oder Ersetzen eines einzelnen Zeichens sein.
Wird keine Distanz angegeben, wird die Distanz automatisch anhand der Länge des angegebenen Begriffs gewählt:
- Weniger als 3 Zeichen: Begriffe müssen exakt übereinstimmen.
- 3 bis einschließlich 5 Zeichen: Eine Änderung zulässig.
- 6 Zeichen und mehr: Zwei Änderungen zulässig.
Beispiel
electronic~ (max. 2 Änderungen, Begriff hat über 6 Zeichen) findet unter anderem: electronic elektronik aber auch: electron
Anzahl der Änderungen manuell angeben
kraftstoffluss~1 (max. eine Änderungen) findet unter anderem: kraftstoffluss kraftstofffluss
Der Fuzzy Operator ist nicht kombinierbar mit Trunkierungen und kann nur auf einen Begriff angewendet werden.
Phrase
Sobald Begriffe in Anführungszeichen gesetzt werden, wird genau nach dieser Folge von Begriffen gesucht.
Beispiel
"fuel cell" entspricht: span(fuel cell, 0)
Es ist somit auch möglich nach Schlüsselbegriffen wie z.B. Operatoren zu suchen.
Beispiel
"Menschen in Not"
Außerdem kann mit den Anführungszeichen nach Nummern gesucht werden.
Beispiel
"420"
Folgendermaßen kann auch nach einem "-Zeichen gesucht werden.
"fuel\"" es wird gesucht nach: fuel"
Platzhalter
Werden 2 Begriffe mit – Zeichen verknüpft, werden diese in genau dieser Reihenfolge gesucht.
Beispiel
fuel-cell sucht nach: span (fuel cell, 0)
Kommentare
Es ist möglich in der Textsuche Kommentare hinzuzufügen.
Kommentare werden bei der Textsuche nicht berücksichtigt und dienen nur als Information für den Benutzer.
Beispiel
Abstandsoperatoren
span
Begriffe werden in einem angegebenen maximalen Wortabstand gesucht.
Hierbei wird die Reihenfolge der Begriffe berücksichtigt.
Beispiel
span (fuel cell, 2)
Es muss im Text fuel und darauf folgend cell vorkommen, zwischen beiden Begriffen dürfen bis zu 2 Begriffe vorkommen.
near
Begriffe werden in einem angegebenen maximalen Wortabstand gesucht.
Hierbei wird die Reihenfolge der Begriffe nicht berücksichtigt.
Beispiel
near (fuel cell, 2)
Es muss im Text fuel und cell vorkommen, zwischen beiden Begriffen dürfen bis zu 2 Begriffe vorkommen.
allgemein
Innerhalb der Abstandsoperatoren near und span können auch mehrere Begriffe mit "OR" und Klammern kombiniert werden.
Beispiel
near ((electric or elektrisch) (generator or Stromerzeuger or stromgenerator), 3)
Der maximale Wortabstand bezieht sich bei near und span auf alle angegebenen Begriffe bzw. Synonyme.
Beispiel
span (rotary wing thrust, 4)
Insgesamt dürfen zwischen den 3 Begriffen maximal 4 Begriffe vorkommen.
Somit wird z.B. dieses Patent gefunden:
Wird nur mit Wortabstand 2 gesucht, wird das Patent nicht mehr gefunden.
Synonym-Gruppen aus dem Highlighting in die Textsuche übernehmen
In der Volltextsuche können alle Begriffe einer Synonym-Gruppe(Highlighting) hinzugefügt werden.
Gesammelte Synonyme können somit für die Recherche wiederverwendet werden.
Sobald ein Begriff im Textfeld eingetragen wurde, lassen sich mit der Tastenkombination Strg + Leertaste die Synonym-Gruppen anzeigen, welche den Begriff beinhalten.
Es werden dabei immer alle Gruppen aus allen Highlighting Schematas berücksichtigt.
Anschließend kann die gewünschte Gruppe mit den Pfeiltasten ausgewählt werden.
Mit der Enter- oder Tabulator-Taste werden dann die Synonyme automatisch in die Suche übernommen.
Reguläre Ausdrücke "Regexp"
Es ist möglich in der Suche reguläre Ausdrücke zu verwenden.
Beispiele
span(/<3-7>/ mm, 0) sucht nach 3-7 mm (aber nicht nach z.B. 3,5)
Der Begriff "Kamera" wird z.B. in der deutschen Patentsprache oft in einem zusammengesetzte Nomen umschrieben.
In diesem Fall kann ein regulärer Ausdruck verschiedene Fälle bzw. Schreibweisen abbilden:
/.*bild(erfassung|speicherung|aufnahme).*(gerät|einrichtung|einheit|apparat).*/ findet z.B. Bilderfassungseinheit, Bildaufnahmeeinrichtung oder Bildaufnahmegerät usw.
Grundlage der Textsuche
Mithilfe folgender Optionen kann die Grundlage der Textsuche bestimmt werden.
Document, Application, Strict family oder Extended family
Je nach ausgewählter Option wird bestimmt, über welche Texte die Begriffe gesucht werden.
Beispiel
fuel and cell ausgewählte Texte: Title
Document – beide Begriffe müssen im Titel eines Dokuments vorkommen
Application – ein Begriff kann im Titel der A-Schrift vorkommen, der andere Begriff im Titel der entsprechenden B-Schrift
Strict Family – ein Begriff kommt im Titel eines Dokuments eines Lands vor, der andere Begriff im Titel eines Dokuments aus einem anderen Land, beide Dokumente gehören zur gleichen strict family
Extended Family - gleich wie bei der Strict Family nur mit dem Unterschied, dass beide Dokumente zur gleichen extended family gehören müssen
Je größer die Grundlage der Textsuche gewählt wird, desto höher wird die Trefferanzahl ausfallen.
Document (wenige Treffer) → Extended family (mehr Treffer)
Grundlage der Textsuche und die gewählte Basis der gesamten Suche
In dieser Suche wird über Dokument der Text „fuel and cell“ gesucht.
Die Begriffe müssen also innerhalb eines Dokuments vorkommen.
Unten ist die Einheit „Strict family“ ausgewählt.
Es werden also alle Suchblöcke auf die strikte Familie angereichert.
Somit kann z.B. „fuel cell“ in einem US-Dokument vorkommen und in der gleichen strikten Familie ein DE-Dokument und dann wird diese strikte Familie gefunden.
Stellt man die untere Einstellung von „Strict family“ auf „Document“ um, dann muss „fuel cell“ in einem DE-Dokument enthalten sein.