阿里云宣布开源 Qwen2.5,上架超 100 个模型

来源: 陀螺科技565天前
9 月 19 日下午消息,今日举办的 2024 云栖大会上,阿里云 CTO 周靖人发布通义千问新一代开源模型 Qwen2.5。据悉,Qwen2.5 全系列涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型,每个尺寸都有基础版本、指令跟随版本、量化版本,总计上架 100 多个模型,其中旗舰模型 Qwen2.5-72B 性能超越 Llama 405B。 相比 Qwen2,Qwen2.5 全系列模型都在 18T tokens 数据上进行预训练,整体性能提升 18% 以上,拥有更多的知识、更强的编程和数学能力。 此外,在多模态模型方面,阿里云还宣布了视觉语言模型 Qwen2-VL-72B 开源,Qwen2-VL 能识别不同分辨率和长宽比的图片,理解 20 分钟以上长视频,具备自主操作手机和机器人的视觉智能体能力。(新浪科技)
利好利好
0
利空利空
0