Skip to content

TCBOMC/steam-analysis

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

24 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Steam 时代编年史

Steam 平台游戏数据的交互式可视化分析,覆盖 2006–2025 年共 20 年、超过 30,000 款游戏。

在线预览

👉 Steam 时代编年史 — GitHub Pages 自动部署

也可直接打开仓库中的 index_standalone.html 离线查看。

Screenshot 2026-05-01 at 00-19-27 Steam时代编年史:玩家偏好的演变

功能

  • 时间轴:拖动或点击浏览 2006–2025 年的 Steam 游戏生态变迁,默认定位最新年份
  • 多语言切换:支持中文 / 英文 / 日文,247 款推荐游戏名全覆盖翻译
  • 年度画像:每年度的游戏数量、价格、好评率、游玩时长等核心指标
  • 类型分布:各类型游戏的数量与好评率对比
  • 价格分析:价格区间分布及各区间的好评率
  • 标签词云:基于 Steam 用户标签投票 + 游戏描述文本,悬停显示真实出现次数,已过滤万能填充词(combat/fight/items 等)
  • 综合推荐:加权评分算法(好评率 30% + 热度 30% + 游玩深度 20% + 价格合理性 10% + 影响力 10%),每年 TOP 5 及各类型最佳
  • 时期洞察:年度综合推荐与趋势总结,游戏名跟随语言切换
  • 跨年趋势:游戏数量、价格、好评率、类型兴衰的时间序列变化

项目结构

steam-analysis/
├── index_standalone.html       # 单机版(所有数据内嵌,直接打开即用)
├── rebuild.bat                 # 一键重建数据(分析 → 翻译 → 嵌入 → 打开)
├── README.md
├── scripts/                    # 构建脚本
│   ├── analysis_v2.py          # 数据分析(kagglehub 自动下载数据集,生成 timeline_data.json)
│   ├── build_game_names_final.py  # 游戏名翻译构建(285条手动映射 + 外部数据)
│   ├── embed_v2.py             # 数据注入(JSON → 单机 HTML)
│   ├── explore.py              # 数据探索
│   └── fetch_names.py          # Steam API 名称预取
├── data/                       # 数据文件
│   ├── timeline_data.json      # 分析结果
│   ├── game_names.json         # 247款游戏多语言翻译(中/日)
│   ├── game_names_merged.csv   # 外部翻译合并数据
│   ├── data_module*.json       # 统计模块数据(描述统计/假设检验/相关性/方差/贝叶斯)
│   └── steam_store_games.csv   # 原始数据(.gitignore)
├── src/                        # HTML 模板
│   └── index_v2.html           # 主模板
└── tmp/                        # 一次性校验产物(.gitignore)

数据源

如何重新生成数据

方式一:双击 rebuild.bat(Windows 推荐,自动完成后打开预览)

方式二:手动执行

# 前置依赖
pip install kagglehub pandas numpy scipy scikit-learn

# 1. 运行分析(自动通过 kagglehub 下载数据集,无需手动下载)
python scripts/analysis_v2.py

# 2. (可选)重新构建游戏名翻译
python scripts/build_game_names_final.py

# 3. 生成单机 HTML
python scripts/embed_v2.py

技术栈

  • 数据: Python / Pandas / NumPy / SciPy
  • 可视化: 原生 HTML + CSS + JavaScript(Chart.js + ECharts 词云)
  • 部署: 单文件 HTML,无需服务器

License

MIT

About

从 Kaggle 的 Steam 游戏数据集中提取 2006–2025 年超过 30,000 款游戏的数据,经 Python 清洗分析后,生成包含年度画像、类型分布、价格分析、词云、综合推荐、跨年趋势等模块的交互式 HTML 页面。

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors