为什么稳定币数据比表面更复杂:揭开背后的四大迷思

华雨欢10 小时前

作者:Sebastian Melendez 来源:Artemis 翻译:善欧巴,金色财经

引言

稳定币正成为市场关注的核心。几乎每天都有新的动态引发热议。例如,Stripe 宣布收购钱包服务公司 Privy,PayPal 则宣布将在 Stellar 上原生铸造 PYUSD。这些消息让人们应接不暇。随着越来越多企业进入这一领域,追踪和获取稳定币数据的需求也日益增长。然而,在与客户沟通的过程中,我们发现有四个问题始终被反复提及:

  1. 稳定币到底被用来做什么?

  2. 谁在使用稳定币?

  3. 存在哪些机会?

  4. 稳定币在哪些国家或地区被使用?

Artemis,我的工作是每天收集、整理并汇总稳定币数据,以便回答这些问题。今天,我们将探讨一些看似简单的数据迷思,并深入分析这些问题为何如此难以解答。

迷思一:稳定币数据对所有人都是开放透明、随手可得的

独立访问链上数据的成本和技术门槛高得惊人。尽管过去五年里,原始区块链数据的可访问性有所提升,但依然充满挑战。主流数据服务商如 Dune、Flipside、Allium 和 Goldsky 各有优势,但没有一家能覆盖所有关键区块链

实际情况:

如今,几乎每家公司都在推出自己的区块链,各具特色,导致数据分析变得极其复杂。要想全面了解稳定币的使用模式并发现潜在机会,你需要能够在所有相关链上进行全景分析,而不仅仅是当前部署的平台。

以 PYUSD 为例:

一旦你集成了 LayerZero 的 OFT 跨链协议,要想真正看清全貌,你就得掌握:

  • Ethereum 的机制

  • Solana 的账户模型

  • LayerZero 的跨链逻辑

  • 以及 Berachain、Flow 等新兴链的结构

用户还可能将代币跨桥到更多平台,这使得数据问题成倍复杂化。

问题不只是你当前上线的链,还在于整个生态不断扩张,新增链层出不穷。这就引出了第二个问题:架构碎片化。

每条链的数据架构和格式都不一样

回忆一下 2000 年代早期,那时候你发一个文件给别人,不代表对方能打开。PowerPoint 打不开,视频缺少解码器,系统各自为政,一切都无法无缝协作。即使是小学生都被这些问题折磨过。

现在的区块链世界就和当年一样乱。

当前最活跃的链 —— Solana、Tron、Ethereum、TON、Stellar、Aptos —— 它们的数据架构天差地别

举几个例子:

  • Solana:你得理解 token account 和 owner account 的概念

  • Ethereum:你要理解智能合约、EOA、ERC-20 标准

  • Aptos、Sui:使用面向对象模型,资产是可编程对象

  • Stellar、TON:架构完全不同,但稳定币使用量惊人

理解这些链上的活动意味着你得拆解一个越来越庞杂的技术网

再看 PYUSD:

之前只需搞懂 Ethereum、Solana 和 LayerZero 的架构。但如今随着它登陆 Stellar,你还得理解:

  • Stellar 的智能合约平台 Soroban

  • Soroban 的虚拟机模型

  • 与以太坊完全不同的转账与余额管理逻辑

也就是说,你甚至得成为某条链的专家,才能访问和解析数据,更别说从中提炼出洞察了

迷思二:只要拿到区块链数据,洞察就能自然而然产生

很多人以为:只要解决了数据访问问题,接下来就能轻松搞出用户洞察了。假设你搞定了访问权限,抓到了全链的余额、转账数据集,那么你得到了什么?

答案是:一堆噪音。

链上地址只是字母和数字的字符串,钱包余额经常不准确或具有误导性。原始区块链数据并不等于洞察,它只是一个凌乱的数据堆,需要经过极其复杂的清洗与加工,才能变得有价值。

现实是:要理解链上发生了什么,离不开上下文和链外数据

即使你费尽心力收集到了链上数据,你依然无法回答关键问题:谁在使用你的稳定币?他们在哪里?

你唯一能说的是:“我的稳定币被使用了。”这并不具备可执行性,也无法帮助你了解用户行为、市场渗透情况、增长机会。若想实现这些洞察,你必须依赖链外上下文。而真正的问题是:你需要什么链外数据,如何获取?

  • 应用程序和协议标签:标记链上活动没有单一的可靠来源。Flipside、Dune、开放标签倡议、区块浏览器、Arkham——它们都提供了一些信息,但每个信息都有各自的模式和有限的覆盖范围。为了回答诸如“这个地址使用什么应用程序?”“我们看到了什么样的使用情况?”之类的基本问题,您需要统一这些零散的标签来源,并手动标记重要的钱包地址。如果不这样做,您就只能使用原始交易数据,而这些数据无法提供任何关于实际使用模式的信息。

  • 地理位置:这才是关键所在——或许也是我最常被问到的问题:我的用户在哪里?我们利用时区启发式算法和先进技术来推断地理分布。更重要的是,我们与数据合作伙伴合作,获取专有的链下地理数据,从而帮助我们精准定位钱包最有可能来自哪个国家。

现实情况是,解决这个标签问题需要大量的资源和行业关系。你需要与主要的L1和协议建立合作伙伴关系,以构建全面的标签数据集。大多数团队没有足够的带宽或连接来手动处理这个问题——这就是为什么许多分析工作在获得原始区块链数据后就遇到了瓶颈。上下文层才是真正的工作开始的地方。

迷思三:区块链数据是直观且一致的

区块链远比表面看起来复杂得多。虽然过去几年,业界已经开始围绕代币转移的特定设计模式进行标准化,但情况并非总是如此。当桥接技术首次流行时,并没有用于追踪跨链活动的社区标准。这在尝试准确追踪余额和转账时造成了混乱——尤其是对于那些存在时间足够长、早于这些标准出台的代币而言。您需要了解每条链的具体历史和特性,才能获得准确的数据。

现实:区块链“数据库模式”一直在变化——你必须成为“链上历史学家”,才能获取精准数据

我们很容易忘记,这些生态系统都在不断变化。以 Solana 为例,它的架构(区块链的运作方式)和代币程序(代币的创建和转移方式)都进行了重大升级。

  1. 架构升级:Solana 首次上线时,该链并未将时间戳存储在长期存储中。这在尝试计算随时间推移的历史余额时造成了重大问题。Solana 在 2020 年修复了这个问题,但损害已经造成:如何在没有时间戳的情况下重建准确的历史余额?

  2. 代币计划升级:去年,Solana 推出了代币计划 2022,以解决原始设计中的碎片化问题,但这意味着您需要了解新旧代币计划的细微差别,才能准确跟踪可替代代币。

基于这一点,人们经常听到有人说区块链是不可变的、公开的、仅可追加的数据库。虽然现在普遍如此,但早期并非总是如此。乐观主义就是一个很好的例子——他们并非只是经历了一次创世事件就发布了。实际上,几个月后他们就完全重新上线了。

结果如何?没有任何关于原始 Optimism 链上所有代币转移的完整数据集。

这为什么重要?这些缺失的数据对于理解OP主网上主要稳定币(包括USDC、USDT和DAI)的当前和历史活动至关重要。没有这些数据,你就无法获得完整的数据集,也无法计算准确的钱包余额。

构建准确的数据集需要成为一名区块链历史学家。理解每条链的细微演变,并解释所有这些历史差异,需要多年的努力。

结语

区块链数据面临着在其他行业中根本不存在的独特挑战。即便在名义上“开放透明”,但想要提炼出有意义的洞察,居然需要链外数据、整合十几家数据服务商、阅读散落在加密推特和官方文档里的上下文信息,再加上一支 10 人以上的工程团队。否则,你只是在盲人摸象,追逐一个以光速变化的幻影市场

免责声明:

1.资讯内容不构成投资建议,投资者应独立决策并自行承担风险

2.本文版权归属原作所有,仅代表作者本人观点,不代币币情的观点或立场