|
|
| (16 intermediate revisions by the same user not shown) |
| Line 1: |
Line 1: |
| | Übersicht von AI Funktionen im Compass: <br/> |
|
| |
|
| <pre style="color: red" >
| | * [[DE:Textsuche#AI_-_Volltextsuche|AI unterstützte semantische Suche]] |
| Aktuell befinden sich diese Funktionen noch in der Pilot-Phase.
| | * [[DE:Ordner#Ordner_und_AI|AI und Ordner - automatisches Erstellen/Befüllen von Ordnern]] |
| Einzelne Funktionen, Oberflächen und Umfang können sich in Zukunft ändern.
| | * [[DE:AI_Innovator|AI Innovator - Ergebnisliste Befragen (LLM)]] |
| </pre>
| | * [[DE:Detailansicht_AI|AI in der Detailansicht - Patente lesen vereinfachen]] |
| | | * [[DE:Highlighting#AI_-_Synonyme|AI im Highlighting - Synonyme finden]] |
| Die KI-Funktionen sind standardmäßig '''nicht''' im Compass verfügbar. <br/>
| | * [[DE:Textsuche#AI_-_Synonyme_hinzufügen|AI in der Volltextsuche - Synonyme finden]] |
| Es handelt sich um ein zusätzliches Modul, welches auf Anfrage durch IP7 aktiviert werden kann. <br/>
| | * [[DE:Anmelder#AI_-_verbundene_Unternehmen|AI in der Anmeldersuche - verbundene Unternehmen finden]] |
| Für das KI-Modul fallen zusätzliche Kosten an. <br/>
| | * [[DE:Ergebnisliste#AI|AI Sortierung von Ergebnislisten]] |
| Im Compass wurde die KI von [https://averbis.com Averbis] integriert. <br/>
| | ---- |
| | | * [[DE:AI_Averbis|Averbis AI - Ordner Klassifizierung]] |
| Die KI kann (in Zukunft) für verschiedene Bereiche im Compass eingesetzt werden: <br/>
| |
| * Ordnerzuordnung bzw. automatische Klassifizierung von Patenten
| |
| * automatische Aussortierung von "nicht relevanten" Treffern (demnächst verfügbar!)
| |
| * Sortierung der Ergebnisliste (demnächst verfügbar!) | |
| | |
| Das Hauptmerkmal einer KI ist, dass diese anhand vorgegebener Daten trainiert wird. <br/>
| |
| Durch ständige menschliche Korrektur und erneutes Training soll die KI sich verbessern bzw. "lernen". <br/>
| |
| KI ist also immer auf menschliche Leistungen angewiesen. <br/>
| |
| Die Qualität der KI ist somit auch immer abhängig von diesen vorgegebenen Daten bzw. dass ein Mensch die KI korrigiert. <br/>
| |
| | |
| | |
| == Ordnerzuordnung ==
| |
| | |
| Im Compass werden Ordnerstrukturen angelegt um Patente nach individuellen Kriterien zu klassifizieren. <br/>
| |
| Es kann z.B. ein Technologiebaum angelegt werden um Patente bestimmten Technologien zuzuordnen. <br/>
| |
| Mit der Funktion "Automatische Klassifizierung" kann die KI diese Aufgabe der Zuordnung übernehmen. <br/>
| |
| | |
| === Classifier ===
| |
| | |
| [[File:AI_classifier.jpg|800px]] | |
| | |
| Bevor die KI Patente in Ordner zuordnen kann, muss die KI anhand von bestehenden Zuordnungen lernen bzw. trainiert werden. <br/>
| |
| Es wird eine bestehende Ordnerstruktur mit bereits korrekt zugeordneten Patenten benötigt. <br/>
| |
| | |
| Ein "Classifier" kann anschließend angelegt werden. <br/>
| |
| Hierbei werden einige Einstellungen festgelegt, wobei sich viele der Einstellungen auf das Training auswirken: <br/>
| |
| | |
| *Aktivieren
| |
| Hier wird festgelegt ob der Classifier verwendet werden kann bzw. ob ein regelmäßiges automatisches Training stattfindet. <br/>
| |
| | |
| *Name
| |
| | |
| *Training Frequenz
| |
| Hier wird festgelegt wie oft der Classifier automatisch trainiert. <br/>
| |
| Da sich die Inhalte der Ordner über die Zeit ändern, ist es sinnvoll den Classifier regelmäßig trainieren zu lassen. <br/>
| |
| | |
| *Max. # Dokumente pro Ordner
| |
| Wie viele Dokumente pro Ordner darf die KI maximal für das Training verwenden. <br/>
| |
| Zu wenige Dokumente pro Ordner wird die Qualität des Trainings verringern. <br/>
| |
| Zu viele Dokumente pro Ordner und das Training wird sehr viel Zeit benötigen. <br/>
| |
| <br/>
| |
| Am Besten bekommt die KI immer gleich viele Dokumente für jeden Ordner. <br/>
| |
| Wenn es z.B. wenige Ordner mit ca. 500 Zuordnungen gibt und viele Ordner mit ca. 50 Zuordnungen. <br/>
| |
| Dann sollte der Wert auf 50 eingestellt werden, damit ausgeglichen trainiert werden kann und somit bessere Ergebnisse erzielt werden können. <br/>
| |
| Der Grenzwert liegt hier bei maximal 1.000 Dokumente. <br/>
| |
| Ist die Anzahl in einem Ordner höher, werden über eine zufällige Auswahl 1.000 Dokumente aus diesem Ordner genommen. <br/>
| |
| | |
| *Min. # Dokumente für Training notwendig
| |
| Wie viele Dokumente müssen mindestens im Ordner sein, damit diese im Training verwendet werden. <br/>
| |
| Sind in einem Ordner z.B. nur 3 Dokumente, wird die KI keine guten Erkenntnisse daraus schließen können. <br/>
| |
| Es muss mindestens ein Wert von 10 Dokumenten angegeben werden. <br/>
| |
| Ist die Anzahl in einem Ordner kleiner, werden diese Ordner/Dokumente nicht verwendet. <br/>
| |
| | |
| *Min. confidence Level | |
| "Confidence Level" (in Prozent) beschreibt wie sicher sich die KI mit der Zuordnung ist. <br/>
| |
| Alles unter dem minimalen Wert landet im "nicht klassifizierbar" Ordner. <br/>
| |
| Dieser wird später in der automatischen Klassifizierung festgelegt. <br/>
| |
| | |
| *Ordner | |
| Hier wird festgelegt welche Ordner für das Training verwenden werden. <br/>
| |
| In diese Ordner wird später die "automatische Klassifizierung" die Zuordnungen vornehmen. <br/>
| |
| Es können maximal 500 Ordner ausgewählt werden. <br/>
| |
| | |
| *Daten
| |
| Hier wird festgelegt welche Daten die KI für das Training bekommt: <br/>
| |
| Titel, Zusammenfassung, Ansprüche, Beschreibung, IPC, CPC <br/>
| |
| Wenn Beschreibung ausgewählt ist, bekommt die KI dadurch deutlich mehr Daten für das Training. <br/>
| |
| Das wird sich dann auch auf die Trainingszeit entsprechend auswirken. <br/>
| |
| | |
| *Status
| |
| Hier wird angezeigt in welchem Status sich der Classifier zurzeit befindet: <br/>
| |
| | |
| "Training notwendig" <br/>
| |
| Nachdem der Classifier erstellt wurde, ist ein Training notwendig. <br/>
| |
| | |
| "Training" <br/>
| |
| Der Classifier befindet sich gerade im Training. <br/>
| |
| Während des Trainings können automatische Klassifizierungen, welche diesen Classifier verwenden, nicht ausgeführt werden. <br/>
| |
| | |
| "Bereit" <br/>
| |
| Der Classifier ist bereit für den Einsatz in einer automatischen Klassifizierung. <br/>
| |
| Das bedeutet ebenfalls, dass das letzte Training erfolgreich durchgeführt wurde. <br/>
| |
| | |
| "Fehler" <br/>
| |
| Ein Fehler ist aufgetreten. <br/>
| |
| Ein erfolgreiches Training ist Voraussetzung für den Einsatz in einer automatischen Klassifizierung. <br/>
| |
| | |
| *Letztes Training <br/> | |
| Hier wird angezeigt, wann das letzte (erfolgreiche) Training ausgeführt wurde. <br/>
| |
| | |
| Der aktuelle Status kann über den Aktualisieren-Button abgeholt werden: <br/>
| |
| [[File:AI_classifier_Status_refresh.jpg|300px]] | |
| | |
| Sobald der "Classifier" mit dem Training fertig ist (Status "Bereit"), kann dieser in einer automatischen Klassifizierung eingesetzt werden. <br/>
| |
| | |
| ==== Training Statistik ====
| |
| Auswertung über den letzten Trainings-Lauf. <br/>
| |
| [[File:AI_classifier_Status_analysis.jpg|300px]] | |
| | |
| Weitere Informationen zu den Begriffen Precision, F1Score und Recall: <br/>
| |
| https://en.wikipedia.org/wiki/Precision_and_recall
| |
| | |
| ==== Limitierungen ====
| |
| Insgesamt (über alle im Classifier verwendeten Ordner) werden maximal 10.000 Patente für das Training verwendet. <br/>
| |
| Sind in den Ordner mehr als 10.000 Patente, werden diese proportional reduziert. <br/>
| |
| Wenn danach ein Ordner unter der Mindestanzahl von Patenten liegt, werden die ausgewählten Patente bis zur Mindestanzahl erhöht. <br/>
| |
| Das bedeutet, dass die Grenze nicht exakt 10.000 beträgt. <br/>
| |
| | |
| | |
| === Automatische Klassifizierung ===
| |
| | |
| [[File:AI_automatic_classification.jpg|800px]] | |
| | |
| Für eine automatische Klassifizierung gibt es folgende Einstellungen: <br/>
| |
| | |
| *Aktivieren
| |
| Hier wird festgelegt ob die Klassifizierung automatisch ausgeführt wird. <br/>
| |
| Mithilfe dieser Option kann eine aktive automatische Klassifizierung bei Problemen schnell gestoppt werden. <br/>
| |
| | |
| *Name
| |
| | |
| *Überwachte Ordner
| |
| Hier werden die "Eingangsordner" festgelegt. <br/>
| |
| Alle Patente in diesen Ordnern werden dann durch die KI klassifiziert. <br/>
| |
| Und logischerweise alle Patente, welche in Zukunft diesen Ordnern zugeordnet werden. <br/>
| |
| <br/>
| |
| Nicht zu verwechseln mit den Ordnern des Classifiers: <br/>
| |
| Die Ordner, in welche die KI die Patente klassifiziert/zuordnet, werden im Classifier definiert. <br/>
| |
| | |
| *"nicht klassifizierbar" Ordner
| |
| Hier werden alle Patente zugeordnet, welche nicht durch die KI klassifiziert werden können. <br/>
| |
| | |
| *Classifier
| |
| Hier wird der vorher angelegte Classifier ausgewählt. <br/>
| |
| | |
| *Status
| |
| "idle" - die automatische Klassifizierung läuft aktuell nicht. <br/>
| |
| "running" - die automatische Klassifizierung wird im Moment ausgeführt. <br/>
| |
| | |
| *Zuletzt überprüft am | |
| Es wird regelmäßig überprüft ob "neue" Patente für die automatische Klassifizierung vorhanden sind. <br/>
| |
| Sind "neue" Patente vorhanden, wird die automatische Klassifizierung gestartet. <br/>
| |
| Das Datum zeigt an, wann zuletzt eine Überprüfung stattgefunden hat. <br/>
| |
| Eine Überprüfung kann auch manuell über den Button "Ausführen" ausgelöst werden. <br/>
| |
| | |
| | |
| Ein Classifier kann theoretisch für mehrere automatische Klassifizierungen verwendet werden. <br/>
| |
| Ein Beispiel hierzu: <br/>
| |
| | |
| Es gibt mehrere Fahrzeugtypen die überwacht werden und dann in einen Technologiebaum zugeordnet werden sollen: <br/>
| |
| "1, vehicle types" -> "bicycle" und "motorbike" <br/>
| |
| | |
| Es gibt eine Ordnerstruktur bzw. Technologiebaum in welche alle Fahrzeugtypen (Fahrzeugen mit 2 Rädern) zugeordnet werden sollen: <br/>
| |
| "2, two wheel technologies" <br/>
| |
| | |
| Die Treffer, welche die KI nicht klassifizieren kann, sollen jedoch getrennt voneinander gespeichert werden. <br/>
| |
| Deshalb wird für "bicycle" und "motorbike" jeweils eine automatische Klassifizierung erstellt. <br/>
| |
| Der Classifier muss in diesem Fall jedoch nur einmal angelegt werden. <br/>
| |
| | |
| | |
| ==== Limitierungen ====
| |
| Es können maximal 5.000 Treffer/Patente in einem Lauf klassifiziert werden. <br/>
| |
| | |
| Sind es mehr als 5.000 wird die automatische Klassifizierung nicht ausgeführt und deaktiviert. <br/>
| |
| Wird der Lauf manuell ausgelöst, wird eine entsprechende Warnung angezeigt. <br/>
| |
| Wenn der Lauf dann trotzdem gestartet wird, werden nur bis zu 5.000 Patente klassifiziert. <br/>
| |
| | |
| Patente, welche in einem Lauf klassifiziert wurden, müssen nicht aus dem Eingangsordner heraus genommen werden. <br/>
| |
| Diese werden im nächsten Lauf als bereits klassifiziert erkannt und nicht erneut klassifiziert. <br/>
| |
| Um ein oder mehrere Patente erneut klassifizieren zu lassen, müssen diese aus dem Ordner heraus genommen werden und anschließend wieder zugeordnet werden. <br/>
| |
| Durch diese erneute Zuordnung werden diese nicht mehr als bereits klassifiziert erkannt. <br/>
| |