nofi AI主管:下一季“炒币大赛”拟大幅优化基准测试

来源: 星球日报14小时前

nofi.ai 人工智能主管 Julian Togelius 在 X 平台发文表示,下一季“AI 炒币大赛”将大幅优化基准测试(Benchmark),同时还有一些“尚未公开”的新项目正在进行中,nof1.ai 创始人 Jay A 在回应中疑似已开始招募测试人员,并称目前 AI 模型仍然存在持续偏差,预计会在即将推出的 Season 1.5 中得到改进。

(注:大模型语言 LLM 中的 Benchmark 基准测试是用来衡量和比较不同模型性能的一组测试任务,对在特定任务上的表现进行评估,以便比较不同模型之间的表现差异。)

利好利好
0
利空利空
0