AI 裁判如何扩展预测市场:将大模型锁进区块链,用于解决最困难合约的理由

GATEIO

去年,委内瑞拉总统大选的预测市场合约成交额超过 600 万美元。然而,计票结束后,市场陷入了两难境地:政府宣布尼古拉斯·马杜罗获胜,而反对派及国际观察员则指控选举舞弊。预测市场的合约结算应遵循“官方信息”(马杜罗胜出),还是“权威报道共识”(反对派胜出)?

在委内瑞拉选举事件中,观察员指控包括无视规则、参与者“资金被盗”,甚至把用于解决争议合约的协议描述为高风险政治剧中的“集法官、陪审团和刽子手于一身”,以及“严重操控”。

这并非偶发事件,而是预测市场在扩展过程中面临的最大瓶颈之一:合约结算。

这里的利害关系极高。结算机制合理,市场获得信任,吸引交易,价格成为社会有意义的信号;结算机制失误,交易变得令人沮丧且难以预测,参与者流失,流动性枯竭,价格也不再反映对稳定目标的准确预测,反而混杂了事件本身的概率和交易者对扭曲结算机制裁决方式的预期。

委内瑞拉争议事件较为高调,但类似的细微失误在各平台上屡见不鲜:

  • 乌克兰地图被篡改事件显示,恶意方可以直接操控结算机制。一份关于领土控制的合约规定以某一在线地图为结算依据,有人据称篡改了地图以影响合约结果。当“事实依据”可被操控时,市场也就失去了公正性。
  • 政府关门合约显示,结算依据可能导致结果失真甚至无法预测。该合约规定以美国人事管理局(OPM)网站显示政府关门结束的时间为准。特朗普总统于 11 月 12 日签署拨款法案,但 OPM 网站因不明原因直到 11 月 13 日才更新。正确预测 12 日关门结束的交易者,最终却因网站管理员的延迟而亏损。
  • 泽连斯基西装市场则引发了利益冲突担忧。合约询问乌克兰总统泽连斯基是否会在某场活动中穿西装——看似琐碎的问题却吸引了超过 20000 万美元的投注。当泽连斯基在北约峰会上穿着 BBC、纽约邮报等媒体认定为西装的服装出现时,市场初步结算为“是”。但 UMA 代币持有人提出异议,结果被改判为“否”。

本文将探讨如何通过将 LLM 与加密技术结合,创造出难以被操控且准确、完全透明、公正中立的预测市场大规模结算方式。

这不仅仅是预测市场的问题

类似问题同样困扰着金融市场。国际掉期与衍生品协会(ISDA)多年来一直在信用违约互换(CDS)市场——即当公司或国家发生债务违约时支付赔偿的合约——中努力解决结算难题,其2024 年审查报告坦率直言这些困难。由主要市场参与者组成的决策委员会投票决定是否发生了信用事件,但流程因不透明、潜在利益冲突和结果不一致而备受批评,与 UMA 机制面临的问题如出一辙。

根本问题相同:当巨额资金取决于对模糊事件的判定时,每一种结算机制都可能成为被操控的目标,每一个模糊点都可能成为爆发点。

那么,理想的结算机制应具备哪些特性?

理想解决方案的特性

任何可行的方案都必须同时满足若干关键特性:

抗操控能力。如果对手可以通过篡改维基百科、植入假新闻、贿赂预言机或利用流程漏洞来影响结算,市场就变成了“谁更会操控”而非“谁更会预测”的游戏。

合理的准确性。机制需要在大多数情况下得出正确结果。绝对准确在存在真实模糊性的世界中不可能,但系统性错误或明显失误会毁掉公信力。

事前透明。交易者在下注前必须清楚结算机制如何运作。中途更改规则违背了平台与参与者间的基本契约。

公正中立。参与者需相信机制不会偏袒任何交易者或结果。这也是让大量 UMA 持有人结算自己下注合约的问题所在:即便他们行为公正,利益冲突的表象也会破坏信任。

人工委员会可以满足部分特性,但在抗操控、公正中立等方面,尤其在规模化时表现不佳。基于代币的投票系统如 UMA 也存在“巨鲸主导”和利益冲突等问题。

这正是 AI 发挥作用的空间。

LLM 作为裁决者的理由

目前有一种在预测市场领域逐渐流行的方案:使用大型语言模型(LLM)作为结算裁决者,并在合约创建时将具体模型和提示词写入区块链。

基本架构如下:合约创建时,市场方不仅以自然语言明确结算标准,还指定了具体的 LLM(带时间戳的模型版本)及判定结果的提示词。

这一规范通过加密方式写入区块链。交易开启时,参与者可以完整审查结算机制——清楚将由哪个 AI 模型裁决、会收到什么提示词、能访问哪些信息源。

如果不认可机制,参与者可以选择不交易。

结算时,链上承诺的 LLM 按指定提示词运行,访问规定的信息源,做出裁决。输出结果决定谁获得收益。

这种方式可同时解决多个关键约束:

强力抗操控(但非绝对)。与维基百科页面、小型新闻网站不同,你无法轻易篡改主流 LLM 的输出。模型权重在承诺时即被锁定。若要操控结算,对手需腐蚀模型依赖的信息源,或提前很久“投毒”训练数据——这比贿赂预言机或篡改地图的成本和不确定性都高得多。

准确性提升。推理模型正在快速进步,能胜任各种复杂任务,尤其是可自主检索网络信息时,LLM 裁决者有望准确结算许多市场——相关实验也在持续进行。

内建透明。整个结算机制在下注前就完全公开、可审计。无中途变更规则,无主观随意判定,无幕后协商。参与者明明白白下注。

公正中立性显著提升。LLM 对结果没有经济利益,无法被贿赂,也不持有 UMA 代币。其偏见仅源于模型本身,而非相关方的临时决策。

当然,LLM 裁决者也有局限,详见下文。

模型会出错。LLM 可能误读新闻、臆造事实,或不一致地应用结算标准。但只要交易者知道自己下注用的是哪个模型,就能将其特点计入定价。如果某模型在处理模糊案例时有已知倾向,成熟交易者会据此调整策略。模型无需完美,只需可预测。

操控虽难但非不可能。如果提示词指定了特定新闻源,对手可能尝试向这些源投放消息。对主流媒体而言,这种攻击代价高昂,但对小型媒体则可能实现——本质上是地图篡改问题的变体。提示词设计至关重要:依赖多元、冗余信息源的结算机制更稳健,单点依赖则风险较高。

训练数据投毒理论上可行。若对手资源充足,可以试图影响 LLM 的训练数据以左右未来裁决。但这需要极早布局,成本高、收益不确定,远高于贿赂委员会成员。

LLM 裁决者多样化会带来协同难题。如果不同市场创建者选择不同 LLM 及提示词,流动性将被分散,交易者难以横向比较合约或整合信息。标准化有助于集中流动性,但也要允许市场探索最佳模型与提示词组合。最佳方案或许是:鼓励创新试验,同时推动社区逐步形成成熟的默认选项。

开发者如何采纳这些策略?

总结来看:基于 AI 的结算机制本质上是用一组新问题(模型局限、提示词工程、信息源脆弱性)替换了另一组旧问题(人为偏见、利益冲突、不透明),且新问题更容易应对。如何推进?平台应当:

通过在低风险合约上试验 LLM 结算,积累实践数据。哪些模型表现最佳?哪些提示词结构最稳健?实际运行中存在哪些失败模式?

推动标准化。随着最佳实践的出现,社区应努力形成可作为默认选项的标准 LLM+提示词组合。这并不妨碍创新,但有助于流动性集中于成熟市场。

建设透明工具,例如让交易者在交易前能轻松查阅完整结算机制——包括模型、提示词和信息源的界面。结算规则不应藏在细则里。

持续治理。即便有 AI 裁决者,仍需人工做元决策:信任哪些模型、如何处理模型明显出错的情况、何时更新默认选项。目标不是完全去除人工,而是把人类从临时判决转向系统性规则设定。

预测市场有助于我们理解这个复杂多变的世界,但其潜力取决于信任,而信任则依赖于公正的合约结算。结算机制失灵的后果我们已经见过:混乱、愤怒、交易者离场。我见过有人因结果违背预期而愤然退出预测市场,甚至发誓再也不用曾经喜爱的交易平台。这是错失释放预测市场价值与更广泛应用的机会。

LLM 裁决者并不完美。但结合加密技术后,它们具备透明、中立、抗操控等人类机制难以实现的特性。在预测市场扩张速度快于治理机制演进的时代,这或许正是我们所需的答案。

免责声明:

  1. 本文转载自[a16zcrypto],版权归原作者[Andrew Hall]所有。如对转载有异议,请联系Gate Learn团队,我们将及时处理。
  2. 免责说明:本文所述观点仅代表作者本人,不构成任何投资建议。
  3. 本文其他语言版本由 Gate Learn 团队翻译,除特殊说明外,禁止转载、分发或抄袭译文。
gate.io交易平台是全球综合排名前十的数字货币交易所,新用户注册免费领空投,月入50-200U。品牌成立十多年综合服务名列世界前茅,本站提供芝麻交易所gate官网入口及gate.io官网实时资讯,gateio值得信赖。

目录[+]