去中心化AI(DeAI)如何挑战中心化AI:独特优势、实际应用与资金支持
作者:0xJeff,加密 KOL;编译:Felix,PANews
当今社会,无论是食品、住所、电子产品,还是最新的 AI 技术,几乎人人都在推销某种产品或服务。过去,人们兜售的是满足基本需求的实用物品,而如今,尤其是在加密 AI 领域,兜售的更多是梦想和希望,这些被包装在光鲜亮丽的外衣中。
然而,加密 AI 产品和基础设施往往因其复杂性而难以理解,导致团队在沟通中使用过多专业术语,无法吸引广泛的用户群体。此外,启动一个真正的 AI 实验室(而非简单的封装)需要巨额资金支持,包括人才、计算资源和其他必要条件。
企业级 AI 实验室的年度运营成本高达数百万美元,而前沿模型的研究、训练和优化可能耗费数亿美元。例如,H100 型号的 GPU 单价在 2.5 万至 4 万美元之间,而较新的 Blackwell B200 和 GB200 型号的价格则在 3 万至 7 万美元之间。训练一个前沿模型可能需要数千个这样的 GPU。
去中心化 AI(DeAI)的优势:小型模型 + 强化学习
选择去中心化的系统,即通过全球范围内的计算资源整合来训练单个模型,理论上能够显著降低 GPU 成本(节省 30% 至 90%),因为可以利用全球闲置的 GPU 网络。然而,协调这些 GPU 并确保它们高效运行是一项极具挑战性的任务。因此,目前尚未有去中心化 AI 实验室完全攻克去中心化训练的难题。
尽管如此,未来依然充满希望。一些实验室在去中心化强化学习领域取得了令人鼓舞的成果。这种自我博弈、自我学习的过程,能够使小型模型变得极其智能。
并非所有场景都需要大型语言模型(LLM)。通过训练特定领域的模型,并结合强化学习(RL)完善其技能,是提供经济高效的企业级 AI 解决方案的最佳途径。归根结底,客户追求的是结果——合规、安全、成本效益高且能提高生产力。
早在 2019 年,OpenAI Five 就在《Dota 2》游戏中击败了当时的世界冠军 OG 战队。这一胜利并非偶然,而是彻底的碾压,连续两场比赛都轻松取胜。
那么,它是如何做到的?
《Dota 2》是一款复杂的多人在线战斗竞技场游戏,五名玩家相互对抗,完成各种目标并摧毁对方基地。为了让 AI 能够与顶级选手抗衡,它遵循了以下步骤:
- 从零开始自我对战:通过数百万次的自我对战学习基础知识。如果获胜,则说明操作有利;如果失败,则说明操作不当(即大规模试错)。
- 设置奖励系统(积分),激励那些可能带来胜利的行为(如摧毁防御塔、击杀英雄),并对不利行为扣分。
- 采用名为“PPO”的强化学习算法进行训练。AI 在比赛中尝试某些操作,PPO 将结果视为反馈。如果结果良好,则多做;如果结果不佳,则少做。这种方式逐渐引导 AI 走向正确的方向。
- 数百个 GPU 运行近一年来训练 AI,使其不断学习并适应游戏版本更新和变动。
- 一段时间后,AI 开始探索复杂的策略(如牺牲一条兵线、在恰当的时机采取保守或激进的打法等),并最终战胜人类玩家。
尽管 OpenAI Five 已经退役,但它证明了小型模型在特定领域任务中的潜力(其参数量仅为 58MB)。
像 OpenAI 这样的大型 AI 实验室之所以能够实现这一点,是因为拥有充足的资金和资源来训练强化学习模型。如果一家企业想要拥有类似的解决方案用于欺诈检测、工厂机器人、自动驾驶汽车或金融市场交易,则需要大量资金支持。
去中心化的强化学习解决了这一问题,这也是为什么像 Nous Research、Pluralis、gensyn、Prime Intellect 和 Gradient 这样的去中心化 AI 实验室正在构建全球 GPU 网络,共同训练强化学习模型,为特定领域的企业级 AI 提供基础设施。
一些实验室正在研究进一步降低成本的方法,例如使用 RTX 5090/4090 而非 H100 来训练强化学习模型。还有一些专注于通过强化学习提升大型基础模型的智能水平。
无论研究重点在哪,去中心化 AI 的这一发展方向都极具前景。如果去中心化的强化学习解决方案能够在商业上实现大规模应用,企业客户将向 AI 投入更多资金,同时也会看到更多去中心化 AI 团队实现 8 到 9 位数的年收入。
通过协调层为 DeAI 提供资金并实现规模扩展
然而,在达到每年 8 至 9 位数收入之前,这些实验室需要持续研究、实施并过渡到具有商业可行性的强化学习解决方案,而这需要大量资金支持。
通过像 Bittensor 这样的协调层筹集资金是一种有效途径。每天都有数百万美元的 TAO 激励金发放给子网(初创企业和 AI 实验室),同时贡献者(AI 人才)为他们感兴趣的子网贡献力量以获取部分激励金。
Bittensor 不仅让贡献者能够参与 AI 的开发,还为投资者提供了投资于 DeAI 技术的机会。
目前,在 Bittensor 生态系统中,量子计算、去中心化训练、AI 代理和预测系统等关键 DeAI 细分领域脱颖而出(尽管强化学习目前还不是其中之一,但已有 3 个以上的子网正在积极关注去中心化强化学习)。
目前去中心化强化学习进展如何?
强化学习已被证明可以大规模应用,但尚未实现工业化。好消息是,企业对能够从真实反馈中学习的 AI 代理的需求正在迅速增长。例如,能够从现实环境、销售和客户服务电话中学习的代理,以及能够适应市场变化的交易模型等。这些自我学习系统能够为企业创造或节省数百万美元。
隐私技术也在兴起。可信执行环境(TEE)、TEE 内的加密嵌入以及差分隐私等技术在反馈循环中的应用有助于加密和保护私人信息,使医疗保健、金融、法律等敏感行业在拥有强大的特定领域自我学习 AI 代理的同时保持合规。
接下来会怎样?
强化学习是推动 AI 更加智能化的关键所在。它将 AI 从生成系统转变为积极主动、智能的 AI 代理。
隐私与强化学习的结合将推动企业在合规的前提下真正采用 AI,为客户提供切实可行的解决方案。
强化学习还使得“代理经济”成为可能,代理能够购买计算资源、相互协商并提供服务。
由于其成本效益,去中心化强化学习将成为扩展强化学习训练的默认方式。
联邦式强化学习(Federated RL)也将出现,使多方能够在不共享本地敏感数据的情况下协同学习,将隐私保护与自我学习相结合,从而极大提升智能水平,同时符合合规要求。
免责声明:
1.资讯内容不构成投资建议,投资者应独立决策并自行承担风险
2.本文版权归属原作所有,仅代表作者本人观点,不代币币情的观点或立场
快讯