我是一个相对较新的sklearn用户,在sklearn.model_selection的train_test_split中遇到了一些意想不到的行为。我有一个熊猫数据框架,我想将其拆分成训练和测试集。我创建了一个示例测试来显示此行为:a = np.array([i for i in range(1000000)])c = [i%5 for i in a]
df = pd.<
我有一个带有列location的dataframe,如下所示:在屏幕截图中,您可以看到location列中有5个空格的情况,但是有更多带有3和4个空格的单元格,而最常见的情况是只有两个空格:我需要执行str.split() on location列,但是由于空格的数量不同,它将不能工作,因为如果我用空空间或逗号替换空格,就会得到不同数量的潜在拆分。因此,我需要找到一种方法,将位于城市名称中的空间转换为连字符,以便以后能够<