最好玩的游戏排行榜
前置准备:环境安装与依赖配置
本教程全程零代码基础也可操作,所有工具和命令均提供可直接复制的内容,无需自行搜索。
1. Python环境安装
直接打开官方下载地址:https://www.python.org/downloads/,下载对应操作系统的最新稳定版,安装时必须勾选底部「Add Python to PATH」选项,其余默认下一步即可。
安装完成后按Win+R输入cmd打开命令行,输入python --version,出现版本号即为安装成功。
2. 依赖库安装
直接在命令行执行以下命令,使用国内源安装,避免下载失败:
``` pip install requests lxml pandas matplotlib -i https://pypi.tuna.tsinghua.edu.cn/simple ```执行完成后无报错即为依赖安装完成。
实操步骤:完整代码与执行方法
步骤1:复制保存爬取代码
新建记事本,将以下完整代码直接复制粘贴到记事本中:
``` import requests from lxml import etree import pandas as pd 请求头,避免被反爬 headers = { "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/118.0.0.0 Safari/537.36", "Referer": "https://www.taptap.cn/top" } 爬取地址可替换:热玩榜为https://www.taptap.cn/top/hot,新品榜为https://www.taptap.cn/top/new url = "https://www.taptap.cn/top/download" response = requests.get(url, headers=headers) response.encoding = "utf-8" html = etree.HTML(response.text) 解析游戏数据 game_list = [] items = html.xpath('//div[@class="taptap-top-card-main"]') for item in items: rank = item.xpath('.//div[@class="rank-index"]/text()')[0].strip() name = item.xpath('.//a[@class="tap-router tap-app-title__link"]/text()')[0].strip() score = item.xpath('.//span[@class="tap-app-score__value"]/text()') score = score[0].strip() if score else "暂无评分" download = item.xpath('.//div[@class="tap-app-stats__item"][1]/text()')[0].strip() category = item.xpath('.//span[@class="tap-app-tag__text"]/text()') category = category[0].strip() if category else "暂无分类" game_list.append({ "排名": rank, "游戏名称": name, "评分": float(score) if score != "暂无评分" else 0, "下载量": download, "分类": category }) 导出为csv文件,可直接用Excel/WPS打开 df = pd.DataFrame(game_list) df.to_csv("最好玩的游戏排行榜.csv", index=False, encoding="utf_8_sig") print("排行榜生成完成,共爬取{}款游戏数据".format(len(game_list))) ```保存文件前先开启文件扩展名显示:打开资源管理器顶部「查看」选项卡,勾选「文件扩展名」,然后将记事本保存为game_rank.py,保存时编码选择UTF-8,避免中文乱码。
步骤2:运行代码生成排行榜
- 打开cmd命令行,进入代码保存的文件夹,比如代码存在D盘的game文件夹,依次输入命令:
d:回车,cd game回车。 - 执行命令:
python game_rank.py回车,等待1-2秒即可完成爬取。 - 运行完成后,同文件夹会生成「最好玩的游戏排行榜.csv」文件,直接双击即可用Excel/WPS打开查看、排序、筛选。
步骤3:自定义排行榜筛选规则
如果需要生成自定义维度的排行榜,只需在代码最后添加对应筛选逻辑即可,以下是常用筛选规则,可直接复制使用:
筛选评分≥8.5的高口碑游戏排行榜:
``` 放在原代码最后一行即可 high_score_df = df[df['评分'] >= 8.5] high_score_df.to_csv("高评分游戏排行榜.csv", index=False, encoding="utf_8_sig") ```筛选特定分类的游戏排行榜(比如动作类):
``` 放在原代码最后一行即可,分类名称可替换为角色扮演、休闲等 action_df = df[df['分类'] == '动作'] action_df.to_csv("动作类游戏排行榜.csv", index=False, encoding="utf_8_sig") ```切换排行榜数据源:将代码中url地址替换为注释里的热玩榜、新品榜地址,即可生成对应维度的排行榜。
进阶操作:排行榜可视化与定时更新
1. 生成TOP10游戏评分对比图
在代码最后添加以下代码,运行后会生成top10游戏评分的柱状图,可直接用于分享:
``` import matplotlib.pyplot as plt 解决中文显示问题 plt.rcParams['font.sans-serif'] = ['SimHei'] plt.rcParams['axes.unicode_minus'] = False top10 = df.head(10) plt.bar(top10['游戏名称'], top10['评分'], color='4285F4') plt.xticks(rotation=45) plt.title('TOP10游戏评分对比') plt.ylabel('评分') plt.tight_layout() plt.savefig('TOP10游戏评分对比图.png') ```2. 设置每日自动更新排行榜
Windows系统可通过任务计划程序实现自动更新,操作步骤:
- 搜索打开「任务计划程序」,点击右侧「创建基本任务」,名称填「游戏排行榜更新」,下一步。
- 触发器选择「每天」,设置你想要更新的时间,下一步。
- 操作选择「启动程序」,程序或脚本选择python.exe的路径(可在cmd输入
where python查看路径),添加参数填你保存的game_rank.py的完整路径,比如"D:\game\game_rank.py",下一步完成即可。
常见问题排查
- 提示ModuleNotFoundError:重新执行依赖安装命令,若仍报错将命令中的pip替换为pip3即可。
- 爬取数据为空:检查网络是否能正常访问TapTap官网,若页面结构更新,按F12打开开发者工具,选中对应数据右键复制xpath替换代码中的对应规则即可。
- csv文件打开乱码:用记事本打开csv文件,点击「另存为」,编码选择ANSI保存即可。
- 运行提示找不到文件:确认文件后缀是.py不是.txt,且cmd进入的路径和代码保存路径一致。
版权保护: 本文由 741卡盟 原创,转载请保留链接: http://741ka.com/gamenews/22529.html
- 上一篇:勇者之翼online
- 下一篇:羊了个羊无限道具bug分享
