Steam 平台游戏数据的交互式可视化分析,覆盖 2006–2025 年共 20 年、超过 30,000 款游戏。
👉 Steam 时代编年史 — GitHub Pages 自动部署
也可直接打开仓库中的 index_standalone.html 离线查看。
- 时间轴:拖动或点击浏览 2006–2025 年的 Steam 游戏生态变迁,默认定位最新年份
- 多语言切换:支持中文 / 英文 / 日文,247 款推荐游戏名全覆盖翻译
- 年度画像:每年度的游戏数量、价格、好评率、游玩时长等核心指标
- 类型分布:各类型游戏的数量与好评率对比
- 价格分析:价格区间分布及各区间的好评率
- 标签词云:基于 Steam 用户标签投票 + 游戏描述文本,悬停显示真实出现次数,已过滤万能填充词(combat/fight/items 等)
- 综合推荐:加权评分算法(好评率 30% + 热度 30% + 游玩深度 20% + 价格合理性 10% + 影响力 10%),每年 TOP 5 及各类型最佳
- 时期洞察:年度综合推荐与趋势总结,游戏名跟随语言切换
- 跨年趋势:游戏数量、价格、好评率、类型兴衰的时间序列变化
steam-analysis/
├── index_standalone.html # 单机版(所有数据内嵌,直接打开即用)
├── rebuild.bat # 一键重建数据(分析 → 翻译 → 嵌入 → 打开)
├── README.md
├── scripts/ # 构建脚本
│ ├── analysis_v2.py # 数据分析(kagglehub 自动下载数据集,生成 timeline_data.json)
│ ├── build_game_names_final.py # 游戏名翻译构建(285条手动映射 + 外部数据)
│ ├── embed_v2.py # 数据注入(JSON → 单机 HTML)
│ ├── explore.py # 数据探索
│ └── fetch_names.py # Steam API 名称预取
├── data/ # 数据文件
│ ├── timeline_data.json # 分析结果
│ ├── game_names.json # 247款游戏多语言翻译(中/日)
│ ├── game_names_merged.csv # 外部翻译合并数据
│ ├── data_module*.json # 统计模块数据(描述统计/假设检验/相关性/方差/贝叶斯)
│ └── steam_store_games.csv # 原始数据(.gitignore)
├── src/ # HTML 模板
│ └── index_v2.html # 主模板
└── tmp/ # 一次性校验产物(.gitignore)
- Kaggle: fronkongames/steam-games-dataset(2026 年 1 月更新,覆盖至 2025 年)
- 筛选条件:评价数 ≥ 50,价格 ≤ $200
方式一:双击 rebuild.bat(Windows 推荐,自动完成后打开预览)
方式二:手动执行
# 前置依赖
pip install kagglehub pandas numpy scipy scikit-learn
# 1. 运行分析(自动通过 kagglehub 下载数据集,无需手动下载)
python scripts/analysis_v2.py
# 2. (可选)重新构建游戏名翻译
python scripts/build_game_names_final.py
# 3. 生成单机 HTML
python scripts/embed_v2.py- 数据: Python / Pandas / NumPy / SciPy
- 可视化: 原生 HTML + CSS + JavaScript(Chart.js + ECharts 词云)
- 部署: 单文件 HTML,无需服务器
MIT