我有一个数据集,其中包含NBA球员每场比赛的平均统计数据。有些球员的统计数据是重复的,因为他们本赛季在不同的球队。例如: Player Pos Age Tm G GS MP FG
8 Jarrett Allen C 22 TOT 28 10 26.2 4.4
9 Jarrett Allen C 22 BRK 12 5 26.7 3.7
10 Jarrett Allen C 22 CLE 16 5 25.9 4.9 我想平均一下Jarre
我正在尝试创建一个数据库模式,在其中我可以存储体育联盟的统计数据,其中每场比赛都有团队统计数据。
我有以下几点:
Home Team | Away Team | Venue | Home stat #1 | Away stat #1 | Home stat #2 | Away stat #2 | ... | Home stat #n | Away stat #n
有两个以上的统计数据。例如,一个属性可能是目标,另一个可能是射门。主队和客场队都有记录相同类别的数据,但它们并不相关(例如,不可能通过知道客场队得分多少来找出主队的进球数)。
什么是最好的模式来存储这些?
此刻,我在想:
Teams(
我有一个数据帧列表,我希望将该列表中每个数据帧的摘要统计信息返回到一个新的数据帧中-能够选择每个初始数据帧中的列(值)来返回摘要统计信息。输出数据帧中的每一行对应于初始列表中的每个数据帧。 我可以使用for循环获得汇总统计信息输出,但它只会给我列表中最后一个数据帧的汇总统计信息,而不是列表中的所有数据帧。下面是一个for循环示例,它为我提供了列表中最后一个数据帧的输出统计信息。 for i in step2:
step3=i.describe() #gives me a single df of the last item (dataframe) in my list 下面是我的列表
我想使用statsd和石墨来监视linux进程(记录cpu和ram的使用统计数据,并在一段时间内以图形方式显示它们)。我已经将statsd和graphite配置为作为服务运行。
如何将linux资源使用统计数据(即CPU和RAM)发送到statsd,以便可以在graphically web UI中以图形方式查看它们?
谢谢。