Jump to content

DE:KI: Difference between revisions

From IP7 Wiki
No edit summary
 
(11 intermediate revisions by the same user not shown)
Line 1: Line 1:
Übersicht von AI Funktionen im Compass: <br/>


<pre style="color: red" >
* [[DE:Textsuche#AI_-_Volltextsuche|AI unterstützte semantische Suche]]
Aktuell befinden sich diese Funktionen noch in der Pilot-Phase.
* [[DE:Ordner#Ordner_und_AI|AI und Ordner - automatisches Erstellen/Befüllen von Ordnern]]
Einzelne Funktionen, Oberflächen und Umfang können sich in Zukunft ändern.
* [[DE:AI_Innovator|AI Innovator - Ergebnisliste Befragen (LLM)]]
</pre>
* [[DE:Detailansicht_AI|AI in der Detailansicht - Patente lesen vereinfachen]]
 
* [[DE:Highlighting#AI_-_Synonyme|AI im Highlighting - Synonyme finden]]
Die KI-Funktionen sind standardmäßig '''nicht''' im Compass verfügbar. <br/>
* [[DE:Textsuche#AI_-_Synonyme_hinzufügen|AI in der Volltextsuche - Synonyme finden]]
Es handelt sich um ein zusätzliches Modul, welches auf Anfrage durch IP7 aktiviert werden kann. <br/>
* [[DE:Anmelder#AI_-_verbundene_Unternehmen|AI in der Anmeldersuche - verbundene Unternehmen finden]]
Für das KI-Modul fallen zusätzliche Kosten an. <br/>
* [[DE:Ergebnisliste#AI|AI Sortierung von Ergebnislisten]]
Im Compass wurde die KI von [https://averbis.com Averbis] integriert. <br/>
----
 
* [[DE:AI_Averbis|Averbis AI - Ordner Klassifizierung]]
Die KI kann (in Zukunft) für verschiedene Bereiche im Compass eingesetzt werden: <br/>
* Ordnerzuordnung bzw. automatische Klassifizierung von Patenten
* automatische Aussortierung von "nicht relevanten" Treffern (demnächst verfügbar!)
* Sortierung der Ergebnisliste (demnächst verfügbar!)
 
Das Hauptmerkmal einer KI ist, dass diese anhand vorgegebener Daten trainiert wird. <br/>
Durch ständige menschliche Korrektur und erneutes Training soll die KI sich verbessern bzw. "lernen". <br/>
KI ist also immer auf menschliche Leistungen angewiesen.  <br/>
Die Qualität der KI ist somit auch immer abhängig von diesen vorgegebenen Daten bzw. dass ein Mensch die KI korrigiert. <br/>
 
 
== Ordnerzuordnung ==
 
Im Compass werden Ordnerstrukturen angelegt um Patente nach individuellen Kriterien zu klassifizieren. <br/>
Es kann z.B. ein Technologiebaum angelegt werden um Patente bestimmten Technologien zuzuordnen. <br/>
Mit der Funktion "Automatische Klassifizierung" kann die KI diese Aufgabe der Zuordnung übernehmen. <br/>
 
=== Classifier ===
 
[[File:AI_classifier.jpg|800px]]
 
Bevor die KI Patente in Ordner zuordnen kann, muss die KI anhand von bestehenden Zuordnungen lernen bzw. trainiert werden. <br/>
Es wird eine bestehende Ordnerstruktur mit bereits korrekt zugeordneten Patenten benötigt. <br/>
 
Ein "Classifier" kann anschließend angelegt werden. <br/>
Hierbei werden einige Einstellungen festgelegt, wobei sich viele der Einstellungen auf das Training auswirken: <br/>
 
*Aktivieren
Hier wird festgelegt ob der Classifier verwendet werden kann bzw. ob ein regelmäßiges automatisches Training stattfindet. <br/>
 
*Name
 
*Training Frequenz
Hier wird festgelegt wie oft der Classifier automatisch trainiert. <br/>
Da sich die Inhalte der Ordner über die Zeit ändern, ist es sinnvoll den Classifier regelmäßig trainieren zu lassen. <br/>
 
*Max. # Dokumente pro Ordner
Wie viele Dokumente pro Ordner darf die KI maximal für das Training verwenden. <br/>
Zu wenige Dokumente pro Ordner wird die Qualität des Trainings verringern. <br/>
Zu viele Dokumente pro Ordner und das Training wird sehr viel Zeit benötigen. <br/>
<br/>
Am Besten bekommt die KI immer gleich viele Dokumente für jeden Ordner. <br/>
Wenn es z.B. wenige Ordner mit ca. 500 Zuordnungen gibt und viele Ordner mit ca. 50 Zuordnungen. <br/>
Dann sollte der Wert auf 50 eingestellt werden, damit ausgeglichen trainiert werden kann und somit bessere Ergebnisse erzielt werden können. <br/>
Der Grenzwert liegt hier bei maximal 1.000 Dokumente. <br/>
Ist die Anzahl in einem Ordner höher, werden über eine zufällige Auswahl 1.000 Dokumente aus diesem Ordner genommen. <br/>
 
*Min. # Dokumente für Training notwendig
Wie viele Dokumente müssen mindestens im Ordner sein, damit diese im Training verwendet werden. <br/>
Sind in einem Ordner z.B. nur 3 Dokumente, wird die KI keine guten Erkenntnisse daraus schließen können. <br/>
Es muss mindestens ein Wert von 10 Dokumenten angegeben werden. <br/>
Ist die Anzahl in einem Ordner kleiner, werden diese Ordner/Dokumente nicht verwendet. <br/>
 
*Min. confidence Level
"Confidence Level" (in Prozent) beschreibt wie sicher sich die KI mit der Zuordnung ist. <br/>
Alles unter dem minimalen Wert landet im "nicht klassifizierbar" Ordner. <br/>
Dieser wird später in der automatischen Klassifizierung festgelegt. <br/>
 
*Ordner
Hier wird festgelegt welche Ordner für das Training verwenden werden. <br/>
In diese Ordner wird später die "automatische Klassifizierung" die Zuordnungen vornehmen. <br/>
Die KI kann ein Patent bzw. eine Patentfamilie dann auch in mehrere Ordner zuordnen. <br/>
Es müssen mindestens 3 Ordner bzw. Unterordner ausgewählt werden. <br/>
Es können maximal 500 Ordner ausgewählt werden. <br/>
 
*Daten
Hier wird festgelegt welche Daten die KI für das Training bekommt: <br/>
Titel, Zusammenfassung, Ansprüche, Beschreibung, IPC, CPC  <br/>
Wenn Beschreibung ausgewählt ist, bekommt die KI dadurch deutlich mehr Daten für das Training. <br/>
Das wird sich dann auch auf die Trainingszeit entsprechend auswirken. <br/>
 
*Status
Hier wird angezeigt in welchem Status sich der Classifier zurzeit befindet: <br/>
 
"Training notwendig" <br/>
Nachdem der Classifier erstellt wurde, ist ein Training notwendig. <br/>
 
"Training" <br/>
Der Classifier befindet sich gerade im Training. <br/>
Während des Trainings können automatische Klassifizierungen, welche diesen Classifier verwenden, nicht ausgeführt werden. <br/>
 
"Bereit" <br/>
Der Classifier ist bereit für den Einsatz in einer automatischen Klassifizierung. <br/>
Das bedeutet ebenfalls, dass das letzte Training erfolgreich durchgeführt wurde. <br/>
 
"Fehler" <br/>
Ein Fehler ist aufgetreten. <br/>
Ein erfolgreiches Training ist Voraussetzung für den Einsatz in einer automatischen Klassifizierung. <br/>
 
*Letztes Training <br/>
Hier wird angezeigt, wann das letzte (erfolgreiche) Training ausgeführt wurde. <br/>
 
Der aktuelle Status kann über den Aktualisieren-Button abgeholt werden: <br/>
[[File:AI_classifier_Status_refresh.jpg|500px]]
 
Sobald der "Classifier" mit dem Training fertig ist (Status "Bereit"), kann dieser in einer automatischen Klassifizierung eingesetzt werden. <br/>
 
==== Training Statistik ====
Auswertung über den letzten Trainings-Lauf. <br/>
[[File:AI_classifier_Status_analysis.jpg|500px]]
 
Weitere Informationen zu den Begriffen Precision, F1Score und Recall: <br/>
https://en.wikipedia.org/wiki/Precision_and_recall
 
==== Limitierungen ====
Insgesamt (über alle im Classifier verwendeten Ordner) werden maximal 10.000 Patente für das Training verwendet. <br/>
Sind in den Ordner mehr als 10.000 Patente, werden diese proportional reduziert. <br/>
Wenn danach ein Ordner unter der Mindestanzahl von Patenten liegt, werden die ausgewählten Patente bis zur Mindestanzahl erhöht. <br/>
Das bedeutet, dass die Grenze nicht exakt 10.000 beträgt. <br/>
 
=== Automatische Klassifizierung ===
 
[[File:AI_automatic_classification.jpg|800px]]
 
Für eine automatische Klassifizierung gibt es folgende Einstellungen: <br/>
 
*Aktivieren
Hier wird festgelegt ob die Klassifizierung automatisch ausgeführt wird. <br/>
Mithilfe dieser Option kann eine aktive automatische Klassifizierung bei Problemen schnell gestoppt werden. <br/>
 
*Name
 
*Überwachte Ordner
Hier werden die "Eingangsordner" festgelegt. <br/>
Alle Patente in diesen Ordnern werden dann durch die KI klassifiziert. <br/>
Und logischerweise alle Patente, welche in Zukunft diesen Ordnern zugeordnet werden. <br/>
<br/>
Nicht zu verwechseln mit den Ordnern des Classifiers: <br/>
Die Ordner, in welche die KI die Patente klassifiziert/zuordnet, werden im Classifier definiert. <br/>
 
*"nicht klassifizierbar" Ordner
Hier werden alle Patente zugeordnet, welche nicht durch die KI klassifiziert werden können. <br/>
 
*Classifier
Hier wird der vorher angelegte Classifier ausgewählt. <br/>
 
*Status
"idle" - die automatische Klassifizierung läuft aktuell nicht. <br/>
"running" - die automatische Klassifizierung wird im Moment ausgeführt. <br/>
 
*Zuletzt überprüft am
Es wird regelmäßig überprüft ob "neue" Patente für die automatische Klassifizierung vorhanden sind. <br/>
Sind "neue" Patente vorhanden, wird die automatische Klassifizierung gestartet. <br/>
Das Datum zeigt an, wann zuletzt eine Überprüfung stattgefunden hat. <br/>
Eine Überprüfung kann auch manuell über den Button "Ausführen" ausgelöst werden. <br/>
 
 
Ein Classifier kann theoretisch für mehrere automatische Klassifizierungen verwendet werden. <br/>
Ein Beispiel hierzu: <br/>
 
Es gibt mehrere Fahrzeugtypen die überwacht werden und dann in einen Technologiebaum zugeordnet werden sollen: <br/>
"1, vehicle types" -> "bicycle" und "motorbike" <br/>
 
Es gibt eine Ordnerstruktur bzw. Technologiebaum in welche alle Fahrzeugtypen (Fahrzeugen mit 2 Rädern) zugeordnet werden sollen: <br/>
"2, two wheel technologies" <br/>
 
Die Treffer, welche die KI nicht klassifizieren kann, sollen jedoch getrennt voneinander gespeichert werden. <br/>
Deshalb wird für "bicycle" und "motorbike" jeweils eine automatische Klassifizierung erstellt. <br/>
Der Classifier muss in diesem Fall jedoch nur einmal angelegt werden. <br/>
 
 
==== Limitierungen ====
Es können maximal 5.000 Treffer/Patente in einem Lauf klassifiziert werden. <br/>
 
Sind es mehr als 5.000 wird die automatische Klassifizierung nicht ausgeführt und deaktiviert. <br/>
Wird der Lauf manuell ausgelöst, wird eine entsprechende Warnung angezeigt. <br/>
Wenn der Lauf dann trotzdem gestartet wird, werden nur bis zu 5.000 Patente klassifiziert. <br/>
 
Patente, welche in einem Lauf klassifiziert wurden, müssen nicht aus dem Eingangsordner heraus genommen werden. <br/>
Diese werden im nächsten Lauf als bereits klassifiziert erkannt und nicht erneut klassifiziert. <br/>
Um ein oder mehrere Patente erneut klassifizieren zu lassen, müssen diese aus dem Ordner heraus genommen werden und anschließend wieder zugeordnet werden. <br/>
Durch diese erneute Zuordnung werden diese nicht mehr als bereits klassifiziert erkannt. <br/>

Latest revision as of 10:39, 19 February 2026

Cookies help us deliver our services. By using our services, you agree to our use of cookies.