原文標題:(a16z 領投 3300 萬美元種子輪,Yupp 如何基於區塊鏈與激勵重塑 AI 評估模式?)

原文作者:ShenZhen,PANews

隨着 AI 應用深入各行各業,如何準確評估模型性能與提升用戶信任成了當下亟待解決的難題。傳統評測多依賴集中化機制,既難以覆蓋多樣化場景,也無法反映真實用戶偏好;與此同時,模型「幻覺」問題頻出,用戶在選擇時常陷入信息繭房。

在這一背景下,Yupp 作爲一家新晉平臺,憑藉其獨特的衆包模式和激勵機制,正試圖重塑 AI 模型的發現、比較與使用方式,併爲 AI 評估領域帶來一場範式變革。本文將深入剖析 Yupp 的核心機制、技術亮點、團隊背景及其對 AI 生態的潛在影響。

團隊背景與融資:科技巨頭經驗加持

Yupp 立足於解決 AI 領域長期存在的評估難題,致力於構建一個「去信任」(trustless)的 AI 反饋市場——讓多元化的用戶反饋在區塊鏈和加密經濟激勵的保障下自由流通,從而形成一個可擴展、公平且透明的模型評估層。通過對高質量人工標註數據的激勵分發,Yupp 可以及時捕捉真實用戶在不同場景下的需求和偏好,幫助 AI 開發者以迭代的方式優化模型性能。

該項目由 Pankaj Gupta(聯合創始人兼 CEO)和 Gilad Mishne(聯合創始人兼 AI 負責人)於 2024 年 6 月創立,首席科學家 Jimmy Lin(滑鐵盧大學教授)亦參與核心團隊。三人早在 2010 年於 Twitter 共事,曾打造並優化大規模推薦與搜索系統,後在 Google 和 Coinbase 積累了豐富經驗。

因去中心化、數據價值透明化的願景能夠切中 AI 廠商對可信評估和用戶參與的雙重訴求,以及得益於核心團隊的豐富履歷,Yupp 贏得了科技行業知名人士和頂級風投的高度認可。

上週,Yupp 宣佈完成 3300 萬美元種子輪融資,A16z 合夥人 Chris Dixon 領投,其他投資方還包括 Google 首席科學家 Jeff Dean、Twitter 聯合創始人 Biz Stone、Pinterest 聯合創始人 Evan Sharp、Perplexity CEO Aravind Srinivas、斯坦福大學 Dan Boneh、Chris Re、Nick McKeown 和 Balaji Prabhakar 等 45 位知名天使及企業高管,以及 Coinbase Ventures。

核心功能與用戶體驗:構建「AI 議會」

作爲一箇中心化的 AI 評估平臺,Yupp 秉持「人人共享的 AI(Every AI for everyone)」理念,讓用戶輕鬆發現、比較並使用最新的 AI 模型。與傳統單一響應不同,Yupp 針對每個提示同時返回兩個(乃至更多)模型的答案,形成一個「AI 議會」。這種設計不僅滿足了用戶對多樣化選擇的需求,更能有效甄別模型可能出現的「幻覺」,幫助用戶通過對比做出更明智的決策。正如 Yupp CEO Pankaj Gupta 所言,並排輸出對於關注生成錯誤的用戶尤爲有益,因爲他們可以藉此交叉驗證結果。

平臺現已支持逾 500 款 AI 模型,涵蓋文本與圖像生成領域,包括 ChatGPT、Claude、Gemini、DeepSeek、Grok、Llama 等知名模型,以及衆多新興模型。爲進一步優化體驗,Yupp 還推出了「QuickTake」功能,可將冗長回覆提煉爲一條簡潔的推文。

此外,Yupp 高度重視用戶隱私:所有聊天記錄默認私密,除非用戶主動公開;即使公開分享,也不透漏任何個人信息。用戶可隨時控制分享內容及範圍。

經濟模型與激勵機制:數據勞動價值化

Yupp 將免費使用與用戶反饋結合,通過「Yupp 積分」系統衡量模型使用情況。新用戶註冊秒獲 5000 積分,後續可通過對模型回覆打分、選擇偏好並闡述理由來賺取更多積分。反饋質量越高,獎勵越豐厚,確保用戶可持續免費使用包括 Claude Opus 4 或 OpenAI o3 等高端模型。平臺承諾,積分只增不減,且當前所有模型皆能免費體驗。

在每次提問後,用戶會獲得兩份模型回答,並通過反饋贏取「數字刮刮卡」,獎勵 0~250 不等的 Yupp 積分。每 1000 積分可兌換 1 美元,用戶每日最高可提現 10 美元、月度最高 50 美元。積分支持兌換美元、歐元等 20 餘種貨幣,合作伙伴包括 Stripe、PayPal、Coinbase。同時,平臺集成了 Base Ethernet L2 和 Solana 穩定幣,爲全球用戶提供即時、免手續費的獎勵。

正如 Pankaj Gupta 所說,用戶產生的高質量反饋對於 AI 公司的模型微調與強化學習價值遠超獎勵本身。雖然用戶月度收益或僅相當於幾杯咖啡,但這些付費標註數據對 AI 迭代至關重要。

爲激勵更多人蔘與,Yupp 還設立推薦獎勵:推薦人獲 5000 積分,被推薦人獲 1000 積分;目前新註冊用戶可獲 5000 積分,被推薦人額外獲得 2500 積分。

Yupp VIBE 評分:AI 評估的新範式

針對現有排行榜透明度不足、公平性欠缺、評估數據獲取不均等問題,Yupp 推出了測試版 AI 排行榜和「Yupp VIBE (Vibe Intelligence Benchmark) Score」評分系統。該系統匯聚全球用戶在自然交互中產生的偏好數據,力求提供穩健且可信賴的評估結果。

Yupp 的評估原則包括:

· 穩健性(Robust):保證代表性(覆蓋多樣場景)、真實性(反映用戶關切)、抗作弊性(抵禦惡意行爲);

· 可信賴性(Trustworthy):公平中立(對模型不偏不倚)、透明公開(詳細披露排名算法)、嚴謹科學(遵循評估規範)。

平臺不僅收集二元偏好,還鼓勵用戶指出回覆的優缺點(如「切中要害」、「速度快」、「風格佳」等),並根據用戶的年齡、教育、職業等信息進行分羣分析,展現不同羣體的偏好差異。

在技術層面,Yupp 正在探索利用區塊鏈、密碼學原語及零知識證明等技術,確保評估過程的公正、透明和可驗證。同時,平臺已與專業 AI 數據提供商合作,通過檔案驗證和多層質量檢測校準評分員,清除惡意數據。

近期榜單已更新,展示了 GPT‑4.5 Preview、Claude Opus 4、Claude Sonnet 4 等模型的 VIBE 得分及其勝率、不喜歡率、速度、延遲、上下文窗口和成本指標。

發展歷程與未來展望

Yupp 於 2025 年 6 月 13 日正式上線,前期進行了六個月內部測試。自上線以來,產品持續迭代:

· 多模態支持:接入 Dall‑E、Flux、Stable Diffusion、Luma Photon、Google Imagen 4 等模型,並支持用戶上傳圖像/PDF 提問;

· 交互方式拓展:新增語音輸入與語音朗讀功能;

· 模型更新:陸續引入 DeepSeek R1/V3、Mistral Small 3、OpenAI o3‑pro、Hermes 3、Amazon Nova Pro v1、Microsoft Phi 系列及「MAX 模型」類別;

· 實時信息:將在線查詢請求路由至 Perplexity 和 Google Gemini Live,並附帶超鏈接引文;

· 支付升級:新增美國 PayPal、Venmo 提現及 24 種貨幣 PayPal 支持;

· 分享導出:支持格式保留的複製、PDF/文本/Markdown 導出,按需分享單條回覆或整段對話;

· 社區活動:舉辦「AI 提示挑戰賽」等活動,獎品最高達數萬積分;新增個人資料頁、AI 自動生成的聊天名稱等功能。

Yupp 的使命是「賦能人類塑造 AI 的未來」。Pankaj Gupta 認爲,AI 發展需要每個人的參與與貢獻。通過多視角 AI 迴應和用戶反饋,Yupp 不僅助力用戶更好決策,也爲 AI 進化提供源源不斷的動力。

值得一提的是,Yupp 的主要競爭對手之一是開放 AI 模型評測平臺 LMArena(網址:https://lmarena.ai/),該網站在 AI 業內人士中非常受歡迎,但該平臺目前正處於商業化探索階段,並沒有借用區塊鏈技術對用戶參與提供直接的物質獎勵或積分激勵機制。

總的來說,Yupp 以衆包模式、激勵機制與真實用戶偏好驅動的評估系統,開闢了 AI 評估的新路徑。它不僅爲用戶提供免費、多樣的 AI 互動體驗,更將用戶反饋轉化爲高價值訓練數據,推動模型持續優化。憑藉經驗豐富的團隊和頂級資本加持,Yupp 有望在未來 AI 生態中扮演關鍵角色,實現「人人皆享 AI,人人塑造 AI」的願景。

然而,對於剛剛上線的 Yupp 而言,如何在大規模用戶參與下,持續確保數據質量、抵禦潛在的作弊行爲,以及在商業化與用戶激勵之間取得平衡,仍將是其未來發展中需要不斷探索和優化的方向。

原文鏈接