Yupp获3300万美元种子轮融资,前推特技术团队打造AI模型评估新范式
作者:KarenZ,Foresight News
随着人工智能技术的快速发展,AI模型的数量激增,用户在面对众多选择时往往感到无所适从。如何挑选合适的AI模型?除了传统的基准测试,如何让模型更精准地捕捉真实需求,并为用户提供有效的激励以获取反馈,成为当前AI行业亟待解决的核心问题。
正是在这样的背景下,Yupp应运而生。作为一个开放型平台,Yupp致力于构建一个透明、社区驱动的AI模型评估系统。正如其官方所言:“与历史上其他技术创新相比,AI的发展更加依赖于每个人的参与和贡献。”
上周(6月13日),Yupp.ai宣布完成由a16z crypto领投的3300万美元种子轮融资,同时吸引了谷歌首席科学家Jeff Dean、X联合创始人Biz Stone等豪华投资人阵容的关注。与此同时,Yupp正式上线其产品,不仅为用户提供了一个探索AI的窗口,还通过社区参与和区块链技术支持,重新定义了AI模型的评估与优化方式。
Yupp团队背景与融资详情
Yupp背后的运营公司为Ber Sarai Labs Inc.,由Pankaj Gupta和Gilad Mishne两位联合创始人于2024年6月共同创立,并在过去六个月内秘密测试。两位联合创始人和首席科学家均于2010年在推特相识,拥有深厚的AI行业背景,曾在Coinbase、Google、X等知名企业工作。
-
Pankaj Gupta:Yupp联合创始人兼CEO,毕业于印度理工学院德里分校计算机科学与工程专业,并取得斯坦福大学计算机科学博士学位。他曾担任推特的技术主管、个性化与推荐高级经理以及ML高级职员(2009年3月-2014年5月),并在谷歌担任过工程总监和高级工程总监(2017年7月-2021年3月)。此外,他还曾是Coinbase India的第一位员工及站点负责人,并在Coinbase担任工程副总裁和顾问(2021年4月-2024年5月)。
-
Gilad Mishne:Yupp联合创始人兼AI主管,曾在英特尔担任软件工程师(1998年-2000年)、雅虎担任高级科学家(2017-2010年),以及推特担任高级工程师和搜索总监(2010-2015年)。他还在谷歌担任过高级工程经理和机器学习主管(2019-2023年)。
-
Jimmy Lin:Yupp首席科学家,在麻省理工学院攻读计算机科学博士期间专注于问答系统和对话界面研究。目前,他是滑铁卢大学David R. Cheriton计算机科学学院教授,并担任David R. Cheriton主席。2010年至2012年,Jimmy Lin曾在推特参与数据分析和数据科学基础设施建设。
本月,Yupp官宣的3300万美元种子轮融资实际上已于去年完成。Yupp的投资矩阵覆盖了技术、投资和学术领域,除了领投方a16z crypto外,还包括谷歌首席科学家Jeff Dean、X联合创始人Biz Stone、Pinterest联合创始人Evan Sharp、Perplexity首席执行官Aravind Srinivas、Cred首席执行官Kunal Shah、斯坦福大学四位教授(Dan Boneh、Chris Re、Nick McKeown、Balaji Prabhakar)、Othman Laraki、Paul Grewal、Gokul Rajaram以及Coinbase Ventures等。
Yupp是什么?它如何运作?
Yupp定位为一个AI模型探索与评估平台,允许用户免费体验并比较各类AI模型。其核心理念是通过众包模式进行模型评估:用户提交提示词,对比不同AI模型生成的回复,并选择较优答案,同时提供反馈以获得可兑现的积分奖励。这些选择与反馈将被记录下来,用于后续AI模型的训练和评估。
Yupp还利用区块链等开放访问和无需许可的技术、零知识证明以及挑战/响应机制等密码学原语,结合机密计算等隐私保护技术,构建一个具有可信中立性、公平性和稳健性的系统。
以下是Yupp的主要运作机制:
1. 模型探索与对比:Yupp汇集了超过500个AI模型,包括ChatGPT、Claude、Gemini、DeepSeek、Grok、Llama等。用户可以在聊天页面找到各种AI模型并进行Prompt测试,直观地对比它们的表现。
Yupp的聊天页面设计简洁,包含消息框、文件上传功能、模型选择功能(可选)、图片上传功能以及聊天私密和公开模式切换(默认私密)。
如下图所示,提问后,Yupp会给出两个AI的回答版本供用户选择。
值得一提的是,提问时模型默认自动选择,有时还会隐藏模型名称以收集更客观的反馈。当然,用户也可以随机提问。此外,Yupp的QuickTake AI功能还可以提供简短总结回复。
2. 用户反馈:用户在选择较优答案后,可以通过点击标签反馈答案的优劣偏好,也可以用文字自由阐述。这些反馈将帮助用户定制未来在Yupp上的AI答案,同时也为Yupp提供了免费的模型优化数据。
3. 反馈奖励:用户在提供反馈后,会获得一张积分刮刮卡。积分可用于提问或兑现。
4. 模型评估:用户的选择和反馈直接参与到模型的评估过程中。Yupp旨在建立一个公开透明的评估体系,让AI开发者获取有价值的训练数据,用户则获得奖励,共同推动AI技术的发展。Yupp平台设有名为“Yupp VIBE Score”(VIBE,Vibe Intelligence BEnchmark)的公开排行榜,利用用户反馈改进模型性能,同时确保用户Prompt的私密性,除非用户选择共享。
Yupp的排行榜可以根据用户反馈、响应速度等因素对集成的AI模型进行排序,维度包括VIBE评分、概率样本的置信区间、投票情况、速度、延迟、输入/输出成本。
Yupp的AI模型评估结合用户的偏好数据,以更细粒度的方式对用户和评估数据进行细分,从而为AI开发者提供样本。凭借创始团队在推特应对垃圾信息和机器人问题的经验,Yupp开发了复杂的算法剔除低质量数据,确保排名的完整性。此外,Yupp组建了专门的信任与安全团队,并将持续投入大量资金。
Yupp积分体系:消耗与兑现的平衡规则
Yupp积分通过提问消耗、反馈赚取,并且部分可以兑现。Yupp表示,如果用户负责任地使用平台,将始终拥有足够的积分提问AI模型,并可以兑现一部分积分以表达对生态系统的支持。
提问需要花费积分,初始注册后可免费获得5000积分。总费用由默认费用、PRO模型费用、附件提交费用、预选图片模型费用之和构成。
-
基本费用:每个提示词默认花费50积分。如果生成图像,则费用为100 Yupp积分。
-
PRO模型:这些高级模型仅在其他平台通过付费订阅提供。如果用户预先选择PRO模型,则每次提问需额外花费50个Yupp积分。
-
MAX模型:这些模型属于最昂贵的一类。如果用户预先选择MAX模型,则每个模型每个提示词需额外花费300 Yupp积分(含基础费用共计350积分)。
-
附件提交费用:每个附件需要花费25个Yupp积分。
-
选择图像模型:每个预选图像模型需额外花费100个Yupp积分。
此外,Yupp问答默认私密,如果用户选择公开问答,仅需支付上述常规费用的一半。
如前所述,反馈模型可以获得积分刮刮卡。笔者获得的几个积分刮刮卡在200到500积分之间。
Yupp表示,用户可以将积分提现,兑换成美元、欧元、印度卢比及其他20多种货币,或兑换成稳定币(基于Base和Solana)。Yupp已与Stripe、Paypal和Coinbase等支付服务提供商合作,满足用户的不同需求。每1000积分可兑换1美元。不过,兑现功能目前暂未开放。为规避滥用行为,Yupp设定了以下积分兑现规则:
-
每日提款次数最多1次,提款上限为10美元(1万积分);
-
每周提款次数最多3次,总提款上限为20美元(2万积分);
-
每月提款次数最多6次,总提款上限为50美元(5万积分)。
另外,Yupp规定,购买、出售、交易或转让Yupp积分等行为违反服务条款,将视为无效,并可能导致账户立即停用。滥用行为可能会导致产品功能被禁用,甚至账户被暂停。
如何参与?
Yupp的参与流程如下:
-
用谷歌账号登录注册(注册可获得5000积分,官方表示6月20日前使用“yupp-launch”代码可额外获得2500积分);
-
提问AI模型,在两个AI模型中选择较优答案;
-
选择反馈标签或提供文字反馈;
-
用鼠标刮积分刮刮卡领取积分;
-
自行决定是否提款(目前官方已临时关闭提款功能)。
小结
正如a16z crypto创始人兼执行合伙人Chris Dixon所言:“Yupp的设计将人类的判断转化为可持续的经济资源。随着新的互动替代旧的数据,形成了自然的良性循环:更多的使用带来更新的评估;更新的评估产生更好的模型;更好的模型吸引更多的使用。所有参与者——从用户到AI模型构建者——都可以参与其中,并看到相同的透明规则适用于每个人,确保了一个可信的中立市场。没有人可以隐藏排行榜,也没有人可以操纵奖励或结果。”
Yupp的口号“Every AI for everyone”,译为“普惠AI”更为贴切。Yupp试图通过区块链技术与众包模式,构建AI时代的“评估基础设施”:让用户通过反馈获得激励,让开发者获取真实数据,最终推动AI技术向更普惠、更可信的方向进化。
参考:
https://www.wired.com/story/yupp-chatbot-pays-users-ai-model-feedback/
https://yupp.ai/help
https://blog.yupp.ai/launch
https://blog.yupp.ai/leaderboard
免责声明:
1.资讯内容不构成投资建议,投资者应独立决策并自行承担风险
2.本文版权归属原作所有,仅代表作者本人观点,不代币币情的观点或立场