Skip to content

Latest commit

 

History

History
68 lines (42 loc) · 7.3 KB

File metadata and controls

68 lines (42 loc) · 7.3 KB
title 案例研究:通过数据分析玩转板球!
sidebar false

{{< figure src="/images/content_images/cs/ipl-stadium.png" caption="IPLT20, 印度最大的板球节" alt="印度高级板球联赛体育场和冠军奖杯" attr="(图片来源:IPLT20 (奖杯和标志) & Akash Yadav(体育场))" attrlink="https://unsplash.com/@aksh1802" >}}

你不是为人群而战,而是为国家而战。

— — M S Dhoni, International Cricket Player, ex-Captain, Indian team, plays for Chennai Super Kings in IPL

关于板球

印度人喜欢板球几乎人尽皆知。 这个游戏几乎在印度的任何角落都可以玩,无论是农村还是城市,与其它任何运动项目相比,只有板球可以轻松连接印度的数十亿年轻人和老年人。 板球受到了媒体的广泛关注。 无数 金钱 和 荣誉都压宝在这项运动上。 在过去的几年中,数据技术分析确实成为了运动场上的常胜将军。 流媒体、锦标赛、在移动设备上实时的观看板球等形式让不同观众的观看欲望得到最大满足。

印度超级联赛(IPL) 是成立于2008年的Twenty20板球职业联赛。 它是世界上参与人数最多的板球赛事之一,2019年价值为 67亿美元

板球本质上是关于数字的游戏-击球方的跑动得分,投球手击中门柱的次数,板球队赢得回合的次数,击球手以特定方式还击的次数等等。 借助类似NumPy等功能强大的数值计算分析软件,可以充分挖掘板球得分背后的原理,并对板球的商业化、市场化和经济效益提供重要的参考价值。 板球数据分析为比赛提供了独特的视角,并提供了有关比赛结果的智能预测。

时至今日,板球比赛的记录和统计数据非常丰富,几乎无穷无尽。例如ESPN cricinfocricsheet。 这些板球数据库使用最新的机器学习和预测建模算法来进行 板球分析。 媒体和娱乐平台以及与游戏相关联的专业体育机构使用技术分析来确定关键指标,以提高比赛获胜机率:

  • 击球时跑动步数均值的表现
  • 分数预测
  • 深入了解球员在面对不同对手时的身体表现状况
  • 在团队组成的决策过程中考察球员对比赛输赢的贡献值

{{< figure src="/images/content_images/cs/cricket-pitch.png" class="csfigcaption" caption="万众瞩目的板球场" alt="板球赛场上投球手和击球手蓄势待发" align="middle" attr="(Image credit: Debarghya Das)" attrlink="http://debarghyadas.com/files/IPLpaper.pdf" >}}

关键数据分析目标

  • 运动数据分析不仅用于板球运动,还适用于 其它运动 中,以改善团队的整体表现并最大程度的提高获胜机会。
  • 实时数据分析甚至可以在比赛过程中帮助提高洞察力,从而使团队和相关投资方改变比赛策略以获取更高的经济效益。
  • 除了历史数据分析之外,预测模型也被使用来确定可能的比赛结果,这些结果需要大量的数值处理和数据科学专业知识, 可视化工具以及在分析中增加新观察项的能力。

{{< figure src="/images/content_images/cs/player-pose-estimator.png" class="fig-center" alt="post estimator" caption="板球姿势预测" tot="(Image credit: connect.vin)" attrlink="https://connect.vin/2019/05/ai-for-cricket-batsman-pose-analysis/" >}}

面临的挑战

  • 数据清理和预处理

    IPL已经将板球运动从经典的测试赛扩展到更广的比赛形式。 每个赛季各种形式的比赛场次都有所增加,相应的数据规模、新算法、新的数据分析技术和模拟模型也有所增加。 板球数据分析需要对现场数据进行全方位跟踪,包括球员追踪、球的追踪、球员击球数据分析以及与如何传递球、球的角度、旋转、速度和轨迹有关的方面。 所有这些因素共同增加了数据清理和预处理的复杂性。

  • 数据动态建模

    在板球运动中,就像任何其他体育运动一样,可能存在大量的变量,这些变量包括跟踪球场上各种球员的状态、球员的属性、球本身以及球员多种可能的潜在动作。 数据分析和建模的复杂性与分析过程中提出的预测问题的种类成正比,并且高度依赖数据表示和模型建模能力。 在要求实时动态的预测板球比赛的结果时,对计算性能、数据比对质量提出了更高的挑战,比如击球手以不同角度或速度击球对比赛结果会产生何种影响。

  • 预测分析的复杂性

    板球比赛中的很多决定大都基于如下问题的答案:“针对特定类型的投球手,击球手特殊攻击的频率是多少”或者“如果击球手发动特殊攻击的话,投球手会如何改变他的投球位和投球距离”。 这些预测性分析的答案需要高精度且可用的数据集以及合成数据和构建高精度模型的能力。

NumPy在板球数据分析中的角色

体育分析是一个蓬勃发展的领域。 除了使用最新的机器学习和AI技术之外,许多研究人员和公司使用NumPy和其它Python数据处理包,例如Scikit-learn, SciPy, Matplotlib和Jupyter。 NumPy已用于各种与板球相关的体育分析中,例如:

  • 统计分析: NumPy的数值计算功能有助于在各种球员和比赛策略下估算观察数据或比赛事件的统计意义,并通过与生成模型或静态模型进行比较来预测比赛结果。 因果分析大数据分析 就常用于战术分析。

  • 数据可视化: 数据图形化和 可视化 对各种数据集之间的关系提供了有价值的见解。

总结

在专业赛事中,特别是需要战略决策的比赛,运动数据分析常常能起到力挽狂澜的效果,哪怕是现在,主要还是依赖“勇气和直觉”或对过去传统的经验来完成分析。 NumPy为大量的 Python 软件包奠定了坚实的基础,这些软件包提供了与数据分析, 机器学习和AI算法相关的更高层级的函数。 这些软件包被广泛应用以获取实时赛况的分析,从而有助于在现场做出最有利于自己的决策,实现在板球比赛过程中的商业利益最大化。 找出影响板球比赛结果的隐藏参数、模式和属性,有助于投资方获得隐藏在数字和统计数据背后的比赛洞察力。

{{< figure src="/images/content_images/cs/numpy_ca_benefits.png" class="fig-center" alt="numpy benefits" caption="NumPy核心能力的运用" >}}