可通过代码“head(worldcup)”查看数据的前 5 行&#xff0c

admin 国际新闻 2024-02-27 22 0

  在 faraway 包中包含一个名为 worldcup 的数据集(加载 faraway 包后,可通过代码“head(worldcup)”查看数据的前 5 行,该数据集是 2010 年世界杯上球员的信息数据,每个变量所表示的信息如下:

  Team: 国家

  Position:位置,包括后卫、前锋、守门员、中场

  Time: 上场总时间

  Shots: 射门的次数

  Passes:传球次数

  Tackles:铲球次数

  Saves: 救球次数

  数据概况:

  该数据集中,数据集包含595个样本,共有7个特征。其中Team,Postition是分类变量,后面的都是数值型变量,其中行名是球员名字。

导入需要的包和数据集 ,导入需要的包和数据集;

  上场时间和传球数量的关系

  运行结果

  在这里插入图片描述

  由图形可看出,各球员上场时间多集中于 400 以内,传球次数也对应集中于 200以内,其中 Midfifielder 位置的上场时间和传球次数较为出众。同时一定程度上,上场时间越长,传球数越大。

  3. 不同位置射门次数直方图

  运行结果

  在这里插入图片描述

  由图可发现,大部分球员射门次数集中于 5 个以内,其中 Defender 射门次数较少,而 Forward 射门表现较为优异,符合常理。

  4. 不同队伍射门次数直方图

  运行结果

  在这里插入图片描述

  5. 不同队伍射门次数直方图

  运行结果

  在这里插入图片描述

  由图可知 Brazil 队射门次数平均较高,但无极端异常高的值,可推测其与队伍战术风格有关,以进攻为主,但各队员水平相近,表现稳定,而 Ghana 等队虽然整体平均还行,但是有一个极端高值,可推测是有球员表现尤为优异,带动队伍射门进攻。

  6. 绘制球员分布国家地图可视化

  运行结果

  在这里插入图片描述

  可通过地理信息数据发现,球队主要来源于西半球,各队伍成员数量较为相近,无过于显著的差异。

  其中,安装REmap时,常规方式安装会报错,可利用下面方式解决:

  绘制球员人数分布直方图

  运行结果

  在这里插入图片描述

  可发现人数分布服从近似正态分布。

  8. 对不同位置人员进行上场时间与射门次数的分析

  运行结果

  在这里插入图片描述

  由图可发现,Forward 的射门次数都较高于其他位置,符合常理。

  9. 国家与射门次数之间的关系

  运行结果

  在这里插入图片描述

  从整体来看,Spain 总的射门次数最多,可看出在比赛中处在上风。Honduras 较少处于劣势。

  10. 每个运动员上场时间及射门次数关系

  运行结果

  在这里插入图片描述

  图形宽度代表上场时间,颜色深浅代表射门次数。可发现 Gyan,Villa 球员上场时间多,射门次数也多,是团队核心成员,而 Jong Tae-Se 上场时间中等,但射门次数较多,是很有潜力的成员。通过这个图寻找核心成员,同时挖掘潜力成员。

  11. 球员上场时间分布图

  运行结果

  在这里插入图片描述

  12. #位置、射门、救球、传球、铲球之间的关系(散点矩阵图)

  运行结果

  在这里插入图片描述

  由这个图可以得到许多信息。可发现后卫数量是最多的,而门卫是数量最少的。同时可看出,四个位置的传球数,射门数等都服从偏态分布。Tackles 后卫表现突出,Shots 前锋表现突出.符合常理。

可通过代码“head(worldcup)”查看数据的前 5 行,

可通过代码“head(worldcup)”查看数据的前 5 行,

评论