我是潘达斯的初学者。我有一个包含10000种不同用户信息的数据文件。此数据包含5列和10000行。其中一个列是用户所在的区域,它根据用户的居住位置对用户进行划分(它只定义了7个不同的位置,每个位置都有一些用户居住)。例如,在这10000名用户中,有300个用户生活在美国,250个用户生活在加拿大。我想要定义一个DataFrame,它包括五个随机行的用户,分别是:美国、加拿大、洛杉矶、纽约和日本。另外,尺寸需要20*5,你能帮我怎么做吗?我知道我需要用随机的方法
s = df.sample(n=5)
但是,如何定义从具有这些位置的用户中选择5个随机信息并定义维度呢?
请注意,我是一个初学者。
我有两个问题:
1)如何对查询结果随机排序?
查询示例:
$get_questions = mysql_query("SELECT * FROM item_bank_tb WHERE item_type=1 OR item_type=3 OR item_type=4");
2)从表中随机选择行的最佳方法。假设我想从一个表中随机抓取10行。
非常感谢,
昨天,我学到了一种艰难的方法,把熊猫的数据保存到csv上供以后使用是个坏主意。我有一个+- 130 k tweet的数据格式,其中一行的dataframe是一个tweet列表。当我将数据保存到CSV,然后重新加载dataframe时,数据文件的行现在是String类型。这会导致各种各样的错误和大量的调试。当然,假设CSV能够保存关于我的数据的数据结构类型的信息是一个愚蠢的错误。
我现在的问题是:如何保存数据,以便以后使用,以保存有关列/行的数据类型的信息。