这是一个自动化的大模型排行榜监测系统,能够持续抓取业界最权威的 LMSYS Chatbot Arena、OpenRouter Rankings 以及 Artificial Analysis 数据,自动计算排名变化,并于每天北京时间 11:00 前准时推送到你的移动设备(微信/手机 App)。
为了让你第一时间掌握大模型界的“风吹草动”,系统支持美观的 Markdown 报告推送(支持微信、App、浏览器多端同步):
| WXPusher 移动端展示 (1) | WXPusher 移动端展示 (2) | Server酱 (方糖) 展示 |
|---|---|---|
![]() |
![]() |
![]() |
生成的报告包含详细的排名、Token 使用量、Elo 分数及变动 Delta:
📊 数据源: OpenRouter | LMSYS | Artificial Analysis
排名 模型 ID / 名称 指标 (Tokens/Elo) 变动 1 moonshotai/kimi-k2.51.52T tokens ⚪ - 2 google/gemini-3-flash-preview744B tokens 🟢 ↑1 3 anthropic/claude-sonnet-4.5654B tokens 🔴 ↓1 4 deepseek/deepseek-v3.2741B tokens ⚪ - 5 claude-opus-4-6-thinking1506 Elo ⚪ - 6 Claude Opus 4.6 (Anthropic)53 Index 🆕 New 7 gpt-oss-120B (Cerebras)2,969 t/s ⚪ - 更多详细数据可在推送消息中点击直达...
由于 WXPusher 支持更丰富的卡片展示且配置后无需后续干预,推荐所有用户使用此方案。
点击下方链接,使用微信扫码关注【LLM今日_藤椒33】主题:
👉 点击此处进行订阅
- 在应用市场搜索并下载 WxPusher消息推送平台。
- 使用微信登录。
- 进入 App 后,点击右上角三个点 -> “订阅管理”,确认列表中包含 LLM今日_藤椒33。
- 只要该订阅存在,你就能每天准时收到最专业的大模型研报!
Note
关于 Server酱:Server酱主要用于个人本地调试,配置流程相对繁琐。如无特殊需求,建议优先使用上方的 WxPusher 方案。如果你坚持使用 Server酱,请参考以下教程。
- 访问 Server酱官网 (Turbo版) 并点击“微信登入”。
- 登录后,复制页面显示的
SendKey(通常以SCT开头)。 - 在官网上找到 “通道配置”,确保开启了 “方糖服务号”,并扫码关注“方糖”公众号。
- 将
SendKey填入.env文件或 GitHub Secrets。
本项目深度集成并量化了四大权威大模型排行榜,为研究者和开发者提供全方位、多维度的趋势分析:
- 量化指标:真实生产环境中的 Token 使用量 (Usage) 和 增长率 (Growth)。
- 价值:反映了模型的“市场占有率”和“实际落地活跃度”,是真实用户用脚投票的结果。
- 量化指标:Elo 分数 和 累计投票数。
- 涵盖赛道:文本 (Text)、编程 (Code)、视觉 (Vision)、文生图 (T2I)、搜索增强 (Search)、视频 (Video) 等 8 个细分赛道。
- 价值:基于众测的盲测比较,是衡量模型“体感质量”和综合能力的黄金标准。
- 量化指标:平均分 (Average Score)。内容源自官方数据集 API,覆盖 4500+ 个开源模型。
- 价值:专注于开源社区的模型表现,提供学术基准测试的量化分析。
- 量化指标:质量指数 (Intelligence)、吞吐速度 (Speed)、每百万 Token 价格 (Price)。
- 价值:提供极具参考价值的性能与成本对比(Speed vs. Quality),帮助用户在性能和预算间取得平衡。
你可以直接查看每次自动生成的完整 Markdown 报告。报告包含详细的排名、数据变动(↑/↓)以及“显著变动”分析章节。


