Replies: 2 comments 1 reply
-
|
Bei entscheidsuche haben wir eine neue KI-embedding-basierte Suche gebaut und suchen nun nach Möglichkeiten der Evaluierung. Die Suche ist auf https://entscheidsuche-beta.pansoft.de/ zum Testen verfügbar. |
Beta Was this translation helpful? Give feedback.
1 reply
-
|
Beta Was this translation helpful? Give feedback.
0 replies
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment

Uh oh!
There was an error while loading. Please reload this page.
Uh oh!
There was an error while loading. Please reload this page.
-
Ausgangslage & Problemdiagnose
Mehr Rechtsfragen werden häufiger mit Hilfe einer rasant wachsenden Anzahl AI-Tools beantwortet. Für eine umfassende Evaluation der Antworten auf die Rechtsfragen und damit verschiedener AI-Tools fehlen jedoch insbesondere Einzelpersonen oder kleinen bis mittel-grossen Teams (z.B. regionalen Sozialhilfediensten oder Anwaltskanzleien) die Ressourcen und das Know-how.
Challenge
Gemeinsam erstellen wir ein öffentlich zugängliches Testdatenset mit Musterfragen und validierten Musterantworten unter Berücksichtigung der föderalistischen Besonderheiten des Schweizer Rechts. Das Testdatenset ist die Grundlage für die anschliessende Retrieval-Evaluation und Generation-Evaluation.
Team & Infrastruktur
Rechtsfragen stellen sich für alle Menschen (unabhängig ihrer juristischen oder Programmierkenntnisse): Daher können alle Interessierten mithelfen. IUS Chat wird als zentrales Arbeitstool bereitgestellt, da es Quellenangaben direkt ausweist und damit eine nachvollziehbare Evaluation von Retrieval und Generierung ermöglicht. Mit Label Studio werden gemäss den definierten Evaluations-Dimensionen verschiedene AI-Tools miteinander verglichen.
Attachments:
20260408_Challenge OLL.pdf
Sonstiges:
Verein Gerechter.ch
Beta Was this translation helpful? Give feedback.
All reactions