想象一个世界,每当有人教给人工智能一个事实时,这个事实就被记录下来。每当人工智能从某人的数据中学习时,就会有记录。每当人工智能帮助某人时,贡献其学习的人会得到报酬——公平、可见、立即。这就是OpenLedger的目标:建立一个区块链,使人工智能的所有动态部分都诚实、可追溯且可货币化。
现在的问题是什么,为什么这很重要?
在OpenLedger之前:
人们贡献数据集(图像、文本、传感器读数等),但他们常常不知道自己的工作是否被使用,或者贡献了多少。
当模型被出售或用于盈利时,追踪谁应该获得哪一部分的利润会变得混乱。
如果他们帮助训练一些大型的东西,小型研究者或个人获得奖励的难度很大。
可能会有不信任:我是否使用了正确的数据?这个模型到底是谁训练的?是否有人在滥用个人数据?
OpenLedger说:让我们解决这个问题。
整合在一起:OpenLedger的基础组件
这是OpenLedger如何运作的——用人类的词语,而不是技术术语。
一个为AI而造的区块链
把它想像成一个账本/记录本,所有关于AI生命周期的事情都会被记下:何时添加数据,何时建立模型;何时有人使用模型(推理);以及所有这些如何流动产生的收入。数据网络:拥有权和参与的数据集
与数据被孤立或隐形不同,人们会向「数据网络」贡献——共享的数据池。如果你的数据帮助建立了一个模型,你将为此受到认可。你可以看到你的贡献是如何被使用的。这是一种社区数据的方法。归属证明 (PoA):谁真正重要
这是关键思想之一。当模型被训练时,PoA旨在计算每一条数据的影响力有多大。你的文本片段或图像是否帮助塑造了现在赚钱的模型的一部分?PoA试图衡量这一点。然后,当模型赚钱时,支付会相应地分配。链上训练和推理会计
不仅是数据和模型,而是当有人使用模型(「给我翻译」或「对这张图片进行分类」)时,该使用情况会被记录。由使用触发的支付(每一步可能很小)会得到妥善指导:模型拥有者、数据贡献者,还有可能的平台费用或代币持有者,根据协议进行分配。代币化和模型股份
模型成为可交易的资产。也许有人建立了一个出色的模型,但他们不需要所有资本。他们可以将其收益进行分割——想像一下在模型未来收益中出售小的「股份」。投资者可以进入,期待在使用该模型时获得回报。开放生态系统,熟悉的工具
他们希望OpenLedger能够良好地与人们已经拥有的钱包、开发者已经知道的智能合约框架,并可能的侧链或第二层一起工作。这个想法是:不要建立完全陌生的东西;建立AI人员和区块链人员可以在不重新学习所有内容的情况下使用的东西。和区块链人员可以使用而无需重新学习所有内容。
对人们有什么好处——你可以关联的用例
一位医学研究者向一个数据网络贡献X光照片。后来,有人使用从该数据集衍生的模型来检测疾病。每一次有人支付的推理,该研究者都会获得一部分收益。
一位独立开发者建立了一个专门的模型(例如,用于某一特定领域的法律文件摘要)。他们将所有权分割:早期支持者或投资者购买股份,当用户支付摘要费用时,每个人的收益都是自动的。
一个摄影师社区上传风景图片。然后,有人使用该模型生成桌面背景。因为贡献被追踪,即使是小贡献者也能获得透明度和奖励。
代币、金钱和价值流动的方式
有一个本地代币(通常在报导中称为OPEN)。它的角色包括:
支付和费用:使用模型或进行推理是需要成本的,这些成本会支付给模型拥有者和数据贡献者。
质押/安全/验证者:帮助验证或保护链的人(区块生产者、节点)可能需要锁定代币。
治理:代币持有者帮助决定未来的功能、参数设置、要建设或资助的项目。
激励:为了让人们贡献数据或建立模型,会有奖励、补助金或生态系统资助的计划。
他们现在的位置——进展和重大步骤
根据我收集的资料:
这个想法已在白皮书和文档中正式化。他们对于如何希望事物运作(至少在设计上)相当公开。
他们已经设立了一个「生态系统基金」(OpenCircle或类似的)来帮助启动项目——这有助于吸引开发者、数据集、模型入驻。
代币已经推出,上市于交易所,因此有真正的交易和流动性。
一些试点项目或原型可能正在进行中(尽管敏感数据项目必然会较慢采纳)。
权衡:什么是困难的,什么需要注意
没有什么大事是完美的。这里是一些更棘手的部分:
归属是混乱的:准确测量一条数据对模型输出影响的程度并不容易。像「Shapley值」这样的算法在理论上很好,但成本高而且有时是近似的。会有分歧。
隐私问题:当你将数据贡献或来源放在区块链上时,这是否泄漏了一些敏感信息?如果某人的数据集包含私人信息,即使是元数据也可能揭示过多。因此,你需要隐私保护技术或加密。
复杂性:系统变得复杂。开发者需要整合智能合约、数据追踪、激励分配。所有这些都增加了开销。
经济公平:谁决定模型拥有者、数据贡献者和平台各自的收益?早期行为者(拥有大量代币或大数据)会不会主导?如何防止集中或不公平的交易?
监管:数据共享和货币化是一个法律雷区。数据权利、使用同意、知识产权、数据保护法、证券法(如果代币被视为金融产品)——这些都是关注点。
为什么这可能非常重要
如果事情运作良好,OpenLedger(或类似的项目)可能会重塑我们对AI的看法:
不仅是大型科技公司拥有模型和数据。小型参与者(研究者、数据贡献者)有更多的机会分享收益。
更大的透明度:更好的文档、审计追踪、可重复性。对于AI的信任至关重要。
新的市场:我们可能会看到数据集被交易,模型以更模块化的方式被分享或授权。
对质量的激励:如果数据贡献者在他们的数据被重视时获得报酬,他们会更关心数据质量(整洁性、标签、合理性)。这可能会提高数据集的质量。
LFG
OpenLedger正试图重新想像AI价值的共享方式。这是一个充满希望的想法:平衡权力、奖励贡献,使AI管道更加透明。但很多事情需要运作:归属的数学、隐私、治理、经济激励。