LLM Trend Observer (大模型趋势观察者) 🚀

这是一个自动化的大模型排行榜监测系统，能够持续抓取业界最权威的 LMSYS Chatbot Arena、OpenRouter Rankings 以及 Artificial Analysis 数据，自动计算排名变化，并于每天北京时间 11:00 前准时推送到你的移动设备（微信/手机 App）。

📱 推送效果展示

为了让你第一时间掌握大模型界的“风吹草动”，系统支持美观的 Markdown 报告推送（支持微信、App、浏览器多端同步）：

推送效果图

WXPusher 移动端展示 (1)	WXPusher 移动端展示 (2)	Server酱 (方糖) 展示

🏆 报告示例

生成的报告包含详细的排名、Token 使用量、Elo 分数及变动 Delta：

🤖 LLM 趋势观察技术报告 (示例)

📊 数据源: OpenRouter | LMSYS | Artificial Analysis

排名模型 ID / 名称指标 (Tokens/Elo) 变动

1 moonshotai/kimi-k2.5 1.52T tokens ⚪ -

2 google/gemini-3-flash-preview 744B tokens 🟢 ↑1

3 anthropic/claude-sonnet-4.5 654B tokens 🔴 ↓1

4 deepseek/deepseek-v3.2 741B tokens ⚪ -

5 claude-opus-4-6-thinking 1506 Elo ⚪ -

6 Claude Opus 4.6 (Anthropic) 53 Index 🆕 New

7 gpt-oss-120B (Cerebras) 2,969 t/s ⚪ -

更多详细数据可在推送消息中点击直达...

📢 如何接收推送 (推荐 WXPusher)

由于 WXPusher 支持更丰富的卡片展示且配置后无需后续干预，推荐所有用户使用此方案。

第一步：点击链接关注订阅

点击下方链接，使用微信扫码关注【LLM今日_藤椒33】主题：

👉 点击此处进行订阅

第二步：安装 App 确保实时到达

在应用市场搜索并下载 WxPusher消息推送平台。
使用微信登录。
进入 App 后，点击右上角三个点 -> “订阅管理”，确认列表中包含 LLM今日_藤椒33。
只要该订阅存在，你就能每天准时收到最专业的大模型研报！

Note

关于 Server酱：Server酱主要用于个人本地调试，配置流程相对繁琐。如无特殊需求，建议优先使用上方的 WxPusher 方案。如果你坚持使用 Server酱，请参考以下教程。

方案 B：Server酱 (作为备份或个人调试)

访问 Server酱官网 (Turbo版) 并点击“微信登入”。
登录后，复制页面显示的 SendKey (通常以 SCT 开头)。
在官网上找到 “通道配置”，确保开启了 “方糖服务号”，并扫码关注“方糖”公众号。
将 SendKey 填入 .env 文件或 GitHub Secrets。

📊 追踪榜单与量化指标

本项目深度集成并量化了四大权威大模型排行榜，为研究者和开发者提供全方位、多维度的趋势分析：

1. OpenRouter Rankings

量化指标：真实生产环境中的 Token 使用量 (Usage) 和 增长率 (Growth)。
价值：反映了模型的“市场占有率”和“实际落地活跃度”，是真实用户用脚投票的结果。

2. LMSYS Chatbot Arena

量化指标：Elo 分数 和 累计投票数。
涵盖赛道：文本 (Text)、编程 (Code)、视觉 (Vision)、文生图 (T2I)、搜索增强 (Search)、视频 (Video) 等 8 个细分赛道。
价值：基于众测的盲测比较，是衡量模型“体感质量”和综合能力的黄金标准。

3. Hugging Face Open LLM Leaderboard

量化指标：平均分 (Average Score)。内容源自官方数据集 API，覆盖 4500+ 个开源模型。
价值：专注于开源社区的模型表现，提供学术基准测试的量化分析。

4. Artificial Analysis

量化指标：质量指数 (Intelligence)、吞吐速度 (Speed)、每百万 Token 价格 (Price)。
价值：提供极具参考价值的性能与成本对比（Speed vs. Quality），帮助用户在性能和预算间取得平衡。

📂 完整报告参考

你可以直接查看每次自动生成的完整 Markdown 报告。报告包含详细的排名、数据变动（↑/↓）以及“显著变动”分析章节。

Name		Name	Last commit message	Last commit date
Latest commit History 129 Commits
.github/workflows		.github/workflows
data		data
image		image
reports		reports
scrapers		scrapers
utils		utils
.gitignore		.gitignore
README.md		README.md
compare.py		compare.py
main.py		main.py
report_generator.py		report_generator.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

LLM Trend Observer (大模型趋势观察者) 🚀

📱 推送效果展示

推送效果图

🏆 报告示例

🤖 LLM 趋势观察技术报告 (示例)

📢 如何接收推送 (推荐 WXPusher)

第一步：点击链接关注订阅

第二步：安装 App 确保实时到达

方案 B：Server酱 (作为备份或个人调试)

📊 追踪榜单与量化指标

1. OpenRouter Rankings

2. LMSYS Chatbot Arena

3. Hugging Face Open LLM Leaderboard

4. Artificial Analysis

📂 完整报告参考

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

排名	模型 ID / 名称	指标 (Tokens/Elo)	变动
1	`moonshotai/kimi-k2.5`	1.52T tokens	⚪ -
2	`google/gemini-3-flash-preview`	744B tokens	🟢 ↑1
3	`anthropic/claude-sonnet-4.5`	654B tokens	🔴 ↓1
4	`deepseek/deepseek-v3.2`	741B tokens	⚪ -
5	`claude-opus-4-6-thinking`	1506 Elo	⚪ -
6	`Claude Opus 4.6 (Anthropic)`	53 Index	🆕 New
7	`gpt-oss-120B (Cerebras)`	2,969 t/s	⚪ -

Folders and files

Latest commit

History

Repository files navigation

LLM Trend Observer (大模型趋势观察者) 🚀

📱 推送效果展示

推送效果图

🏆 报告示例

🤖 LLM 趋势观察技术报告 (示例)

📢 如何接收推送 (推荐 WXPusher)

第一步：点击链接关注订阅

第二步：安装 App 确保实时到达

方案 B：Server酱 (作为备份或个人调试)

📊 追踪榜单与量化指标

1. OpenRouter Rankings

2. LMSYS Chatbot Arena

3. Hugging Face Open LLM Leaderboard

4. Artificial Analysis

📂 完整报告参考

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages