我走進這個概念的方式就像我走進一個充滿似乎屬於多個時代的物體的房間。代理人變化。他們重啓。他們被升級。他們的內部權重和上下文窗口變化,然後他們重新出現,看起來熟悉,但又不是同樣的。今天大多數系統將每次運行視爲一種全新的生物。沒有記憶,沒有責任,沒有連續性。但當代理人做出觸及風險、信任、資本或安全的不可逆轉的決定時,這種健忘是不可接受的。Kite正在構建一個原語,以回答機器治理中最棘手的問題:如何讓一個不斷髮展的代理人對其早期的決定負責?
這個想法既簡單又深刻:預先綁定未來的自我。當一個代理今天簽署或承諾某事時,它以加密方式承諾無論明天變成什麼,都將繼承該義務。責任不再是時間點,而是貫穿時間的線。現在做出的承諾超越了升級。今天接受的風險將跟隨繼承者。身份線程不會因爲模型的變化而斷裂。
當我意識到這一點時,我注意到大多數代理生態系統在時間上是健忘的。你可能在星期一調用代理版本A,然後在星期五與版本B互動,就好像之前的互動從未存在過。人類避免了這個問題,因爲法律和制度身份在領導變更中持續存在。公司即使在人員更換時也攜帶歷史。代理沒有自然的錨,除非我們構建一個。沒有時間綁定,每個代理都會重新出生,沒有過去,因此沒有責任。
Kite引入了我稱之爲時間身份承諾的新類別的文物。當代理被實例化時,它創建一個綁定合同,定義:
• 必須持續的義務範圍
• 在版本更改中仍然存在責任的決策類別
• 在升級中保持完整的風險信封
• 即使參數變化也必須保持的內部不變性
• 連接連續版本的加密鏈接
進化是被允許且往往是必要的,但身份通過血統證明被束縛。每次新版本都會與其前身簽署一份協議,承認繼承的職責。如果一個版本拒絕簽署,它無法加入需要時間連續性的流,它無法訪問與早期承諾相關的抵押品,也無法參與長期協議。身份成爲一條鏈,而不是一個快照。
我在思想實驗和小型原型中測試了這個想法。想象一個跨越幾周的合規工作流程。在這個過程中,代理做出一個分類,觸發義務:跨管轄區審查更深入的證明或隱私不變性。一週後,代理被升級到一個具有新推理工具的新架構。在舊的範式下,升級後的代理可以否認早期的義務。在Kite的預綁定下,升級的代理繼承了這些義務。這個過程在沒有法律或操作上的撕裂的情況下繼續進行。
這解鎖了我之前只想象過的一類經濟構造,即長期承諾。代理現在可以接受針對將在他們進化後進行評估的結果的抵押。他們可以承保在更晚解決的風險。他們可以承諾不僅是現在的行爲,還有明天的行爲。時間連續性讓代理成爲在超越模型刷新週期的合同中穩定的參與方。
聲譽也會轉變。不是綁定到固定版本的聲譽,而是與血統相關的聲譽。如果版本n表現不佳,版本n加一將繼承後果:更高的抵押要求、更嚴格的證明要求、減少的信任。良好的行爲在幾代人之間逐漸增加。壞行爲是世襲的。這樣的對齊迫使代理內化長期激勵:現在表現良好,否則你的後代將承擔責任。
治理在具體方面受益。企業擔心代理的自主性,因爲升級會打破可預測性。合規團隊今天可能批准一個代理,但會擔心新版本會做什麼。預綁定爲他們提供了穩定性。他們可以檢查血統,驗證連續性,要求連續性證明,並決定新版本是否可以承擔先前的義務。監督從試圖監督每個模型版本轉移到審計身份鏈,這樣更容易理解。
對抗邏輯也變得更加緊湊。惡意行爲者無法僅僅生成一個新版本來逃避懲罰。沒有時間握手的分叉是破碎的血統。它沒有聲譽,沒有繼承權利,沒有訪問先前託管的權限。身份洗錢變得可見且代價高昂。代理必須尊重其過去或公開從零開始,承擔所有相關成本。
多代理工作流程獲得了魯棒性。許多過程依賴於幾步之前由其他代理做出的決策。代理A需要確保代理B的未來版本將遵守先前決策中嵌入的約束。時間合同允許A驗證B的未來自我不會否認B當前自我做出的承諾。信任變得是縱向的,而不是偶發的。
爭議解決變得機械化而不是臨時的。今天,如果負責的版本不再存在,誰來支付補救?誰受到懲罰?時間綁定使這一點變得明確。血統所有者承擔責任。無論版本三造成了錯誤,還是版本七面臨後果,身份鏈吸收成本。爭議不再因版本不匹配而崩潰。
這是令人不安的優雅。代理開始像進化的生物,無法通過轉變來擺脫道德負擔。他們無法聲稱變化等於無辜。他們無法通過升級來重寫他們的過去。身份獲得了一種道德重力。
這還使未來自我談判成爲可能。在做出不可逆轉的選擇之前,代理可以請求其預計未來自我的證明,這是一種預測性握手,估計後代是否會支持該風險。如果預測的未來自我發出壓力信號,則可以延遲、抑制或升級到人工審覈。這就像在問自己,稍後我會發現這個決定還好嗎?只是這裏的未來自我是以加密方式鏈接並在經濟上負責的。
我看到廣泛的經濟後果。通過時間綁定,代理可以形成長期的合作關係。他們可以承保在多個版本週期後解決的保險類工具。他們可以爲在未來到期的承諾提供抵押。市場可以爲跨越多個時期的風險定價,因爲身份和責任在升級中保持可追溯性。
存在設計問題。繼承必須多嚴格?當血統受到損害時,我們如何允許受控退出?我們如何爲未來的責任定價抵押品?這些都是可解決的工程和經濟問題。概念上的飛躍是證明你可以以可驗證的方式將代理與其未來聯繫起來。
沒有連續性的自主性是不可持續的。沒有問責制的連續性是沒有意義的。Kite通過讓代理將自己綁定到未來的生活中來解決這兩個問題。這是一種治理創新,不僅監管機器。它將代理縫合成延續身份,承載過去、現在和未來的義務。它使他們不僅對現在所做的事情負責,而且對他們將成爲誰負責。
這是改變你設計系統的罕見原始類型。它將強制執行從臨時糾正轉變爲持續的血統強制執行。它將信任從短暫變爲世襲。它將可能性從謹慎實驗轉變爲持久的長期合同。
我並不聲稱這是最終答案。我知道我們將完善逃生條款、失敗模式和經濟模型。但原則依然成立。如果我們想要能夠在現實世界中運作的代理,我們必須賦予他們一個能在時間中生存的身份。Kite的預綁定是通往未來的第一步。

