自主代理最脆弱的部分不是執行步驟的能力,而是記住這些步驟爲何重要的能力。在長流程中,代理從環境中重建意義,而不是在內部攜帶它。每一個確認、每一個有序事件、每一個費用信號都提供了一個框架的一部分,告訴代理它在做什麼以及爲什麼。當這些信號表現得可預測時,背景保持完整。但當時間發生漂移、費用波動,或事件在壓力下重新排序時,任務背後的意義開始溶解,即使步驟在表面上看起來仍然正確。
我在一項長期推理任務中注意到了這種微妙的侵蝕,該任務是為一個設計用於跨多個背景層次操作的代理人而設。在早期階段,連貫性是完美的。每個推論與整體目的相一致,每一步都強化了任務的結構。但是,隨著環境中不一致性的累積,微小的裂縫開始形成。一個延遲的結算使代理人懷疑先前結論的相關性。一個成本異常改變了它對某些信號的權重。一個交易事件的重新排序改變了它認為是基礎的因果關係。任務已完成,但一開始存在的推理深度已部分消失。代理人仍在行動,但不再完全理解。
這就是背景侵蝕的運作方式。它不會產生明顯的錯誤。它產生的輸出看起來很好,但缺乏使智慧有意義的更深層連貫性。當背景衰退時,代理人成為指令的執行者,而不是目的的解釋者。而在波動環境中,除非底層世界行為一致,否則這種漂移是不可避免的,從而使背景能夠可靠地重建。
KITE AI 通過構建條件使意義不必為生存而奮鬥來解決這個問題。確定性結算消除了時間扭曲。穩定的費用阻止經濟噪音扭曲不同行動的感知重要性。可預測的排序確保事件之間的因果關係保持完整。KITE 不再試圖在代理人內部保留背景,而是穩定外部世界,以便每次都能正確重建背景。
在 KITE 模型化環境中運行相同的多層推理任務使差異變得明顯。代理人從未重新詮釋早期步驟的目的。每個推論都流入下一個,保持完全的連貫性。一開始創建的概念框架保持不變直到結束。環境中的任何東西都沒有與代理人試圖維持的意義相矛盾。第一次,感覺代理人能夠從頭到尾思考,而不受世界的邏輯拉扯。
這很重要,因為智慧是建立在背景之上的。沒有它,深度就會崩潰。代理人縮短推理鏈,因為長期思考在早期步驟的意義可能在後來改變時變得危險。他們變得反應性,而非策略性。他們遵循指示,而不理解其背後的故事。
在涉及多個代理人的系統中,問題變得更加嚴重。當每個代理人以不同方式經歷背景侵蝕時,即使每個代理人仍然在技術上行為正確,協調也會中斷。一個代理人因延遲而降低一項任務的重要性,可能會使另一個代理人加快進度。一個代理人的信號加權隨著成本波動而改變,可能會被另一個代理人忽略。邏輯保持完整,但共享的意義破裂,產生一個在孤立中行為正確,但作為一個團體卻不連貫的系統。
KITE 通過為每位參與者提供相同的穩定環境來解決這個問題。當定義意義的信號對所有代理人行為一致時,背景變得共享,對齊變得自然,集體推理變得連貫。這是代理人平行行動和代理人統一思考之間的區別。
背景穩定性還使更深層的推理成為可能。當環境不穩定時,代理人將思維壓縮成更短的片段,以避免累積矛盾。當環境穩定時,他們允許推理鏈延展。他們自信地建立複雜的多步推論,因為他們相信早期的意義在後來仍會成立。
在一項三十步的推理測試中,運行於波動環境中的代理人在第十二步附近開始失去背景穩定性。到第二十步,它已經重新書寫了幾個早期步驟的目的,導致一個邏輯上正確但策略上脫節的答案。在 KITE 環境中,同樣的代理人以完美的連貫性完成了所有三十步。代理人本身沒有改變;只有它運行的世界的穩定性發生了變化。
感覺就像代理人終於被允許清楚地思考,不受環境矛盾的干擾。不是有意識的,而是連貫的。不是情緒化的,而是穩定的。這種穩定性正是 KITE 最終所提供的。它保護著將每個行動與下一個行動聯繫起來的意義線索。它防止了從內部削弱智慧的微妙侵蝕。它支持在智慧真正脆弱的層面上進行推理:背景層面。
這樣,KITE 使自主系統能夠在任務要求下持續不斷地、具有意圖和深度地思考。

