NBA 数据的项目我最近刚摸了一个,叫做“NBA_statistical_analysis:NBA 统计”,做得还挺扎实的。数据从获取到建模,流程完整,工具也选得实用,像是Pandas、Matplotlib、Scikit-learn这些,基本前端搞数据会碰到的,都能找到对应用法。
数据源主要是官方和第三方网站的数据,包含得分、助攻、篮板这些基础数据,也有PER、WS这种进阶指标。预部分用了DataFrame
来做清洗、填空和格式转换,响应也快,代码也简单。
可视化做得比较细,像箱线图、热力图都上了。比如你想知道谁得分稳定,一眼就能看出;球员之间的配合图,团队打法看得也更清楚。
还有个亮点是预测模型,挺接地气的。用随机森林、SVM之类的模型预测比赛胜率,考虑了历史战绩、主客场影响,还有伤病信息。建模流程也比较清楚,适合刚入门机器学习的前端。
对深度学习感兴趣的也有得玩,用了CNN和RNN去球员动作、比赛录像。虽然前端直接用不多,但了解一下也是个不错的拓展方向。
顺便贴几个相关资源,想下手的可以顺着挖:
NBA 数据与可视化活动数据包、
Python 数据入门、
python 数据 pandas
如果你也在琢磨怎么把前端和数据结合起来,这个项目可以给你不少启发。不仅能提升数据敏感度,还能帮你快速熟起来 Python 那一套。