@OpenGradient Ich dachte früher, Verifikation sei ein gelöstes Problem. Man führt das Modell aus, erhält die Ausgabe, und geht weiter. Als zum ersten Mal jemand von „Verifizierung der Inferenz“ sprach, wies ich es ab als das Suchen von Kryptografen nach einem Job. Rechnen ist Rechnen. Was gibt es da zu verifizieren?
Das Problem tauchte später leise auf. Ein Modell lieferte eine Antwort, und ich hatte keine Möglichkeit zu wissen, ob es wirklich das Modell war, für das ich bezahlt hatte, das ehrlich ausgeführt wurde, oder ob eine billigere Ersatzlösung eingeschleust worden war, um Kosten zu senken. Es gab keinen Beleg. Nur Vertrauen – und im Bereich der Infrastruktur ist das ein anderes Wort für Hoffnung.
Das ist die Lücke. Sobald Inferenz zu etwas wird, das man kauft, abrechnet oder für das man rechtlich verantwortlich gemacht wird, reicht „läuft wahrscheinlich korrekt“ nicht mehr aus. Regulierungsbehörden wollen wissen, was eine Entscheidung hervorgebracht hat. Institutionen brauchen eine Audit-Spur. Entwickler möchten sicher sein, dass der Anbieter das System nicht still und heimlich verschlechtert.
Die meisten Lösungen wirken unbeholfen, weil sie Vertrauen nachträglich „draufschrauben“ – Protokolle, denen man glauben muss, und Bestätigungen von derselben Partei, die man gerade auditiert.
Verifikation auf der Compute-Ebene könnte das beheben, wenn der Overhead tragbar bleibt und die Leute die Beweise tatsächlich prüfen. Es scheitert, wenn es zu langsam ist oder wenn sich niemand die Mühe macht zu verifizieren. Nützlich für die wenigen, die dafür verantwortlich gemacht werden können, wenn sie falsch liegen.
#OPG $OPG
Das Problem tauchte später leise auf. Ein Modell lieferte eine Antwort, und ich hatte keine Möglichkeit zu wissen, ob es wirklich das Modell war, für das ich bezahlt hatte, das ehrlich ausgeführt wurde, oder ob eine billigere Ersatzlösung eingeschleust worden war, um Kosten zu senken. Es gab keinen Beleg. Nur Vertrauen – und im Bereich der Infrastruktur ist das ein anderes Wort für Hoffnung.
Das ist die Lücke. Sobald Inferenz zu etwas wird, das man kauft, abrechnet oder für das man rechtlich verantwortlich gemacht wird, reicht „läuft wahrscheinlich korrekt“ nicht mehr aus. Regulierungsbehörden wollen wissen, was eine Entscheidung hervorgebracht hat. Institutionen brauchen eine Audit-Spur. Entwickler möchten sicher sein, dass der Anbieter das System nicht still und heimlich verschlechtert.
Die meisten Lösungen wirken unbeholfen, weil sie Vertrauen nachträglich „draufschrauben“ – Protokolle, denen man glauben muss, und Bestätigungen von derselben Partei, die man gerade auditiert.
Verifikation auf der Compute-Ebene könnte das beheben, wenn der Overhead tragbar bleibt und die Leute die Beweise tatsächlich prüfen. Es scheitert, wenn es zu langsam ist oder wenn sich niemand die Mühe macht zu verifizieren. Nützlich für die wenigen, die dafür verantwortlich gemacht werden können, wenn sie falsch liegen.
#OPG $OPG