Skip to content

TengJiao33/LLM_Trend_Observer

Repository files navigation

LLM Trend Observer (大模型趋势观察者) 🚀

这是一个自动化的大模型排行榜监测系统,能够持续抓取业界最权威的 LMSYS Chatbot ArenaOpenRouter Rankings 以及 Artificial Analysis 数据,自动计算排名变化,并于每天北京时间 11:00 前准时推送到你的移动设备(微信/手机 App)。


📱 推送效果展示

为了让你第一时间掌握大模型界的“风吹草动”,系统支持美观的 Markdown 报告推送(支持微信、App、浏览器多端同步):

推送效果图

WXPusher 移动端展示 (1) WXPusher 移动端展示 (2) Server酱 (方糖) 展示
WXP推送展示1 WXP推送展示2 Server酱展示

🏆 报告示例

生成的报告包含详细的排名、Token 使用量、Elo 分数及变动 Delta:

🤖 LLM 趋势观察技术报告 (示例)

📊 数据源: OpenRouter | LMSYS | Artificial Analysis

排名 模型 ID / 名称 指标 (Tokens/Elo) 变动
1 moonshotai/kimi-k2.5 1.52T tokens ⚪ -
2 google/gemini-3-flash-preview 744B tokens 🟢 ↑1
3 anthropic/claude-sonnet-4.5 654B tokens 🔴 ↓1
4 deepseek/deepseek-v3.2 741B tokens ⚪ -
5 claude-opus-4-6-thinking 1506 Elo ⚪ -
6 Claude Opus 4.6 (Anthropic) 53 Index 🆕 New
7 gpt-oss-120B (Cerebras) 2,969 t/s ⚪ -

更多详细数据可在推送消息中点击直达...


📢 如何接收推送 (推荐 WXPusher)

由于 WXPusher 支持更丰富的卡片展示且配置后无需后续干预,推荐所有用户使用此方案。

第一步:点击链接关注订阅

点击下方链接,使用微信扫码关注【LLM今日_藤椒33】主题:

👉 点击此处进行订阅

第二步:安装 App 确保实时到达

  1. 在应用市场搜索并下载 WxPusher消息推送平台
  2. 使用微信登录
  3. 进入 App 后,点击右上角三个点 -> “订阅管理”,确认列表中包含 LLM今日_藤椒33
  4. 只要该订阅存在,你就能每天准时收到最专业的大模型研报!

Note

关于 Server酱:Server酱主要用于个人本地调试,配置流程相对繁琐。如无特殊需求,建议优先使用上方的 WxPusher 方案。如果你坚持使用 Server酱,请参考以下教程。

方案 B:Server酱 (作为备份或个人调试)

  1. 访问 Server酱官网 (Turbo版) 并点击“微信登入”。
  2. 登录后,复制页面显示的 SendKey (通常以 SCT 开头)。
  3. 在官网上找到 “通道配置”,确保开启了 “方糖服务号”,并扫码关注“方糖”公众号。
  4. SendKey 填入 .env 文件或 GitHub Secrets。

📊 追踪榜单与量化指标

本项目深度集成并量化了四大权威大模型排行榜,为研究者和开发者提供全方位、多维度的趋势分析:

  • 量化指标:真实生产环境中的 Token 使用量 (Usage)增长率 (Growth)
  • 价值:反映了模型的“市场占有率”和“实际落地活跃度”,是真实用户用脚投票的结果。
  • 量化指标Elo 分数累计投票数
  • 涵盖赛道:文本 (Text)、编程 (Code)、视觉 (Vision)、文生图 (T2I)、搜索增强 (Search)、视频 (Video) 等 8 个细分赛道。
  • 价值:基于众测的盲测比较,是衡量模型“体感质量”和综合能力的黄金标准。
  • 量化指标平均分 (Average Score)。内容源自官方数据集 API,覆盖 4500+ 个开源模型。
  • 价值:专注于开源社区的模型表现,提供学术基准测试的量化分析。
  • 量化指标质量指数 (Intelligence)吞吐速度 (Speed)每百万 Token 价格 (Price)
  • 价值:提供极具参考价值的性能与成本对比(Speed vs. Quality),帮助用户在性能和预算间取得平衡。

📂 完整报告参考

你可以直接查看每次自动生成的完整 Markdown 报告。报告包含详细的排名、数据变动(↑/↓)以及“显著变动”分析章节。


About

自动化AI排行信息推送。每天推送HF,OpenRouter,LMSYS和Artificial Analysis的实时排行榜信息,稳抓LLM动态

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages