2020美赛F奖论文(一):摘要、绪论和模型准备

2023-11-08

全文:

Soccer Teamwork Evaluation Models

足球团队合作评价模型

  • 2020MCM-ICM ProblemD
  • Finalist 方案

2020年美国大学生数学建模竞赛ICM-D题 特等奖提名

GitHub仓库

Certificate

Summary

  • This paper proposes a method, with graph theory, probability theory and calculus, to build machine learning models based on data analysis, which aims at providing strategies for soccer coach’s lineup arrangement and players’ training.

本文利用图论,概率论和微积分的方法,利用数据分析和建立机器学习模型,为足球教练的阵容安排和球员训练提供策略。

  • Firstly, the Pass Network Model can be established according to the graph theory, whose edge-weights are evaluation of coordination degree of each dyadic configurations. Pass Evaluate Index is designed for evaluate a single pass, and the summation of each pass can be defined as the edge-weights of PNM. For analysis, the adjacency matrix of N participating players within a period. Several outstanding M configurations can be found by the sort of M-element combination with the key of the sum of the sub-complete graph edge weights. What’s more, investigation of the influence of time on pass density depends on the constructed and approximate function of time and pass.

Firstly,根据图论,在球员之间建立传球网络,并建立单次传球的价值评价模型,用于评价两两球员间传球的配合程度,即传球网络的边权。建立在一定时间范围内所有参与比赛的N个球员的邻接矩阵,通过以M个点的子完全图边权之和为排序关键字找出若干组优秀的M元组合。同时建立基于时间尺度的价值模型,用于评价时间对传球效率的影响。

  • Secondly, performance indicators that reflect successful teamwork can be divided into dynamic indicators and static indicators. Static indicators include player position arrangement and line-up with which player season heatmap models and player position models can be established while the dynamic indicators include opponents’ strength, side, coach, passes, defense, attack and fail. etc. After visualized analysis of the correlation between the dynamic indicators extracted after data cleaning, and with the setting label by the goal difference, the random forest classifier, a machine learning model, is used as a evaluation model of dynamic indicators. After the Grid Search used for tuning parameters, and cross-validation, the accuracy of the model achieving 80% approximately.

Secondly,我们将反映成功团队合作的绩效指标划分为静态指标和动态指标。静态指标包括球员位置安排和球队阵型(line-up),我们建立球员赛季热点模型和球员分布模型。动态指标包括opponents,side,coach,passes,defence,attack and fail等。对经过数据清洗动态指标之间通过可视化进行相关性分析后,以净胜球分类作为比赛样本标签,以随机森林分类器作为机器学习的模型,用网格搜索调优参数,建立动态指标评价模型,进行交叉验证,达到了80%的准确率。

  • Thirdly, the study focuses on the role of static indicators in the performance of the team and establishes different players’ value evaluation models in different positions which comprehensively consider the player’s positions and technical statistical data evaluation. To optimize the value of 11-person permutation, we choose simulated annealing (SA) algorithm which searches the global optimal solution in cousin points in the same minimized search tree after the local optimal solution has attained. The model finally gave the best starting lineup formation. In addition, we also consider the following three secondary factors: tacit understanding between players, home and away influence, and coaching arrangements. All analysis above can be concluded as comprehensive suggestion to the coach.

Thirdly,通过上述中建立的模型进行观察分析,我们着重研究静态指标对球队的胜利起到的关键作用,综合考虑球员位置和技术数据评价模型,建立不同球员在不同位置价值评价模型。通过模拟退火算法,优化11人排列组合的考虑,在局部最优解的父级搜索树进行搜索全局最优解,最终给出价值最优的首发阵容阵型图。此外我们还考虑以下三个次要影响因素:球员间默契度,主客场影响和教练安排。给教练提出的综合建议。

  • Finally, we use the case of the Huskies to explain group dynamics. And use the conclusions obtained by the Huskies to build a model to explain how to design a more effective team and supplement the team performance indicators.

Finally,我们用哈士奇球队的案例来解释群体动力学。并用哈士奇球队建立模型得到的结论来说明如何设计更有效的团队,并对团队绩效指标进行补充。

Key words: Network; Graph theory; Calculus; Machine learning; Random forest classifier; Simulated annealing; Heat map; Group dynamics

0 Content

1 Introduction 3

  • 1.1 Background 3
  • 1.2 Problem Restatement 3

2 Preparation of the Models 3

  • 2.1 Processing Tools 3
  • 2.2 Data Cleaning 4

3 Establishment of PNM and Analysis of Influence Factors 4

  • 3.1 Pass Evaluation Index (PEI) 4
  • 3.2 Pass Network Model (PNM) and Recognition of Network Pattern 6
  • 3.3 Fluctuation of Passing State at The Time 6

4 Soccer Team Indexes and Performance Prediction Based on ML 7

  • 4.1 Static Index (SI) 8
  • 4.2 Dynamic Index (DI) 9
    • 4.2.1 Data Cleaning and Feature Engineering 9
    • 4.2.2 Visualization Analysis 9
  • 4.2.3 RFC Establishment, Optimization, and Training 12

5 Design of Structural Strategies Driven by SA 13

  • 5.1 Position Evaluation Engineering (PEE) 13
  • 5.2 Optimization of Permutation and Combination Based on SA Algorithm 14
  • 5.3 Other Structural Strategy Factors 15
  • 5.4 Structural Strategy Conclusion 16

6 Model Extension Combined with Group Dynamics 16

  • 6.1 Group and Soccer Team 17
    • 6.1.1 Group Cohesiveness 17
    • 6.1.2 Group Standard and Group Pressure 17
    • 6.1.3 Individual Motivation and Group Goals 17
    • 6.1.4 Leadership and Group Performance 18
    • 6.1.5 Group Structure 18
  • 6.2 Other influence factor of successful teamwork 18

7 Evaluation 18

  • 7.1 Strength 18
  • 7.2 Weakness 19

8 Reference 19

0 目录

1 绪论 3

  • 1.1 背景 3
  • 1.2 问题重述 3

2 模型准备 3

  • 2.1 预处理工具 3
  • 2.2 数据清洗 4

3 传球网络模型(PNM)的建立和影响因子分析 4

  • 3.1 传球评价指标 (PEI) 4
  • 3.2 传球网络模型(PNM)构建及识别网络模式 6
  • 3.3 时间尺度上传球状态波动 6

4 足球团队指标和基于机器学习的球队表现预测 7

  • 4.1 静态指标 (SI) 8
  • 4.2 动态指标 (DI) 9
    • 4.2.1 数据清洗和特征工程 9
    • 4.2.2 可视化分析 9
  • 4.2.3 随机森立分类器模型的建立、参数调优和训练 12

5 模拟退火算法驱动的结构策略设计 13

  • 5.1 位置评价工程(PEE) 13
  • 5.2 基于SA算法优化排列组合 14
  • 5.3 其他结构策略因素 15
  • 5.4 结构性策略总结 16

6 结合团队动力学的模型拓展 16

  • 6.1 团体动力学和足球队 17
    • 6.1.1 群体内聚力 17
    • 6.1.2 群体标准和群体压力 17
    • 6.1.3 个人动机和群体目标 17
    • 6.1.4 领导与群体性能 18
    • 6.1.5 群体的结构性 18
  • 6.2 成功团队合作其他影响因素 18

7 评价 18

  • 7.1 优势 18
  • 7.2 缺陷 19

8 参考文献 19

1 绪论 Introduction

1.1 背景 Background

Football has a long history. It has been loved all over the world since it was popularized. Football can be considered as the most popular sports in the world. Football, a seemingly simple sport, contains the secrets of individual ability and team cooperation. With the development of the times and the progress of science and technology, football players and coaches continue to improve in skills, showing the audience wonderful matches. As we all know, a wonderful football match is inseparable from the contributions of players and teams. By studying the actions of everyone in the team, coordinating the team relationship, reasonably arranging the minutes and line-up, we can score best.

1.2 问题重述 Problem Restatement

Football is a sport suitable for all ages. Since its inclusion in international tournaments, people have created a variety of methods to evaluate the team dynamics throughout the match and over the entire season to help determine specific strategies that can improve teamwork next season. We need to use the data provided by the ICM team to build a model to solve the following four problems.

足球赛是一项老少皆宜的运动,自从其纳入国际赛事以来,人们就创造出各种各样的方法来评价整个比赛和整个赛季的团队动态,来帮助确定下个赛季可以改善团队合作的具体策略。我们需要使用ICM团队提供的数据建立模型来解决以下四个问题。

  1. Consider each player as a node and create a passing network to identify dyadic, triadic and multiple configurations. We need to establish a value evaluation model of a single pass and a general evaluation model of the passing of the time structure index under the passing network.
  2. To Identify performance indicators that reflect successful teamwork, we need to consider static and dynamic indicators. Establish a model of the impact of each performance indicator on successful teamwork, and use one model to encompass these four sub-models.
  3. By observing and analyzing the model established in Questions 1 and 2, tell the coach that which form of structural strategy is applicable to the Huskies. Using the results of the model analysis to make suggestions for the coach to improve the team’s success rate next season.
  4. Use the case of the Huskies to explain the theory of group dynamics, and use the conclusion of the model established by the Huskies to explain how to design a more effective team, and supplement the team performance indicators.
  1. 将每一个球员当做一个节点,创建传球网络来识别二元配置,三元配置和 多元配置。我们需要建立在传球网络下,单次传球的价值评价模型,以及时间结构指标的传球总数评价模型。
  2. 确定反映成功团队合作的绩效指标,我们需要考虑静态指标和动态指标。建立每个绩效指标对成功团队合作影响的模型,并用一个模型来囊括这四个子模型。
  3. 通过对问题1,2中建立的模型的观察分析,告诉教练什么样的结构策略适用于哈士奇球队。用模型分析的结果为教练提高球队的下个赛季的成功率给出建议。
  4. 用哈士奇球队的案例来解释群体动力学理论,用哈士奇球队建立模型得到的结论来说明如何设计更有效的团队,并对团队绩效指标进行补充。

2 模型准备 Preparation of the Models

2.1 预处理工具 Processing Tools

Tool Uses
Visual Studio Code 1.42 Coding, Visualization
IPython 3.6.8 Run Code
Visio Design Flowchart
Excel Arrange Dataset
GitHub Synchronization, Storing
MindMaster Plot Mind Map

2.2 数据清洗 Data Cleaning

若空白则为上一个相同

Data Name Processing Type Feature Name
Side Map + Dummy Side_1, Side_0
Coach Dummy Coach_1, Coach_2, Coach_3
Opponent Strength Analysis Oppo
Shots Count Attack
Dribbles
Touch
Corner
Offside
Tackle Count Defence
Dispossess
Aerial Won
Interception
Clearance
Blocks
Saves
Passes Count Pass
Possession Search + Integrate
Pass Success Calculate
Foul Count Fail
Loss of Possession Search + Count

后接:2020美赛F奖论文(二):传球网络模型(PNM)的建立和影响因子分析
全文:

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

2020美赛F奖论文(一):摘要、绪论和模型准备 的相关文章

随机推荐

  • vue+elementUI的el-form的回车键登录,监听键盘来触发事件

    vue elementUI的el form的回车键登录 监听键盘来触发事件 1 当只有一个el input的时候 可以用elementUI的自带的回车键触发提交事件 但是有时候会同时触发刷新页面 这样可以在el form上添加 submit
  • [转]Linux存储入门:简易数据恢复方案--分区和LVM实战

    数据恢复有没有简易方案 IT工程师一般都知道如何操作和使用文件和目录 但是 对于系统如何构建出 抽象出文件和目录 一般就不熟悉了 至于更下层的概念 可能大家知道最多的就是驱动了 所以 为了规避这点 可行的简易方案之一 就是以黑箱方式使用te
  • 51. N-Queens

    The n queens puzzle is the problem of placing n queens on an n n chessboard such that no two queens attack each other Gi
  • 数据分析与可视化-R语言分析 (选择练习)

    1 多选题 可以运行R语言的操作系统包括 选项 A Linux B Windows C Mac OS D Android 答案 Linux Windows Mac OS 2 单选题 可以命令将R语言升级到最新版本 选项 A fleshR B
  • vue 的事件修饰符(v-on, v-model)

    先谈谈我对vue 的一些指令的理解吧 v bind 顾名思义是绑定的意思 但是只能绑定属性 语法糖 而 v on 是绑定一个事件 语法糖 v model 是双向数据的绑定 只能用于表单中 而值得一说的v model 相当于是 v bind
  • linux系统数据盘挂载

    前言 挂载前 最好是新的服务器 不要安装宝塔 我之前先安装宝塔 再挂载就有点费劲 需要考虑原来文件是否受损 当前教程属于新服务器下 先挂载数据盘 挂载步骤 查看磁盘信息 gt gt 将数据盘分区 gt gt 格式化数据盘 gt gt 创建一
  • Python怎么输出换行

    python怎样输出换行 Python怎么输出换行 0 摘要 由于特殊的输出要求 我们在使用print 函数时 不希望输出结束后自动换行 1 print 指定结束符 Print hello end Print world result he
  • Linux------网络基础1

    文章目录 计算机网络的发展历程 网络协议 计算机网络分层体系结构 局域网通信的原理 IP地址和 MAC地址的区别 TCP IP体系结构 计算机网络的发展历程 简单的了解一下就行 图就不提供了 1 最开始 计算机之间是相互独立的 不能沟通交流
  • python3.6 安装pyltp

    当时安装pyltp一直报错 缺少balabala 安装了都没有什么暖用 so成功后安利一下 1 安装wheel 下面两个文件针对不同的python版本下载一个即可 pyltp 0 2 1 cp35 cp35m win amd64 whl p
  • 2021年7月,关于技术和未来

    近期研究了一段时间梅花易数 作为一个从小接受唯物主义教育的社会主义接班人 自然曾经一度对这些所谓的封建迷信是不屑一顾的 后来随着年龄增长 才开始慢慢觉得应对这些传承下来的古老文化保持敬畏 然而 直到最近真正仔细研究了后才发现 梅花易数居然有
  • k8s 之 volume sc pv pvc 详解

    数据卷概述 Kubernetes Volume 数据卷 主要解决了如下两方面问题 数据持久性 通常情况下 容器运行起来之后 写入到其文件系统的文件暂时性的 当容器崩溃后 kubelet将会重启该容器 此时原容器运行后写入的文件将丢失 因为容
  • PWM移相

    PWM移相可以从两方面考虑 1 如果能够移动时基 那么移动时基是一种最简便的方法 2 如果没办法移动时基 那么改变比较值也是一种可行的办法 C2000系列DSP的ePWM模块对PWM移相有相关的应用说明 如下图所示 来源于2803x芯片手册
  • Qt实现跨窗口信号槽通信

    多窗口通信 如果是窗口类对象之间互相包含 则可以直接开放public接口调用 不过 很多情况下主窗口和子窗口之间要做到异步消息通信 就必须依赖到跨窗口的信号槽 以下是一个简单的示例 母窗口 mainwindow h ifndef MAINW
  • L1-7 前世档案

    L1 7 前世档案 网络世界中时常会遇到这类滑稽的算命小程序 实现原理很简单 随便设计几个问题 根据玩家对每个问题的回答选择一条判断树中的路径 如下图所示 结论就是路径终点对应的那个结点 现在我们把结论从左到右顺序编号 编号从 1 开始 这
  • 单机 steam_好玩不贵,一个人可以玩很久,steam百元单机游戏推荐

    steam市场上的游戏有琳琅满目 从一块钱到几百块的游戏充斥在市场中 如何在众多游戏中挑选自己喜欢适合的游戏呢 今天就来推荐一下2款百元左右的单机游戏 包你满意 1 缺氧 目前steam售价 本体58元 本体 7DLC Klei survi
  • 线性方程组解的分析:唯一解,无穷多解以及无解

    本文将总结关于线性方程组解的知识点 线性方程组 定义1 线性方程组 我们将形如下式的方程组称为线性方程组 a11x1 a12x2 a1nxn b1a21x1 a22x2 a2nxn b2 am1x1 am2x2 amnxn bm 9 9 a
  • window10配置OpenGL ES3.0

    1 下载书籍源码 地址 GitHub danginsburg opengles3 book OpenGL ES 3 0 Programming Guide Sample Code 2 下载mali opengl es模拟器 下载地址 建议下
  • allegro如何通过dra文件生产psm文件

    1 dra文件是可以用allegro打开的封装文件 但是要想被pcb调用 需要psm文件才可以 想要通过dra生成psm文件很简单
  • @ComponentScan注解进行扫描的几种方式。

    方式一 扫描包 返回是String的数组 所以可是多个包路径 也可是一个包路径 完整写法是 单个 ComponentScan basePackages xxx 多个 ComponentScan basePackages xxx aaa 注意
  • 2020美赛F奖论文(一):摘要、绪论和模型准备

    全文 2020美赛F奖论文 一 摘要 绪论和模型准备 2020美赛F奖论文 二 传球网络模型 PNM 的建立和影响因子分析 2020美赛F奖论文 三 足球团队指标和基于机器学习的球队表现预测 2020美赛F奖论文 四 模拟退火算法驱动的结构