我想在由外部数据文件'ex1data1.txt‘创建的pandas dataframe的开头添加一列1。我写了下面的代码。问题是print(data)
命令最终返回的是None。这段代码有什么问题?我想让data
成为一个熊猫数据帧。raw_data
和X0_
都很好,我已经把它们打印出来了。
import numpy as np
import pandas as pd
raw_data = pd.read_csv('ex1data1.txt', header= None, names= ['x1','y'])
X0_ = np.ones(len(raw_data))
idx = 0
data = raw_data.insert(loc=idx, column='x0', value=X0_)
print(data)
发布于 2018-06-10 04:29:55
另一种解决方案可能如下所示:
import numpy as np
import pandas as pd
raw_data = pd.read_csv('ex1data1.txt', header= None, names= ['x1','y'])
raw_data.insert(loc=0, column='x0', value=1.0)
print(raw_data)
发布于 2018-06-10 04:27:17
pd.DataFrame.insert
您可以使用pd.DataFrame.insert
,但请注意,此解决方案已经就位,不需要重新分配。您可能还需要将dtype显式设置为int
df = pd.DataFrame([[1, 2, 3], [4, 5, 6]],
columns=['col1', 'col2', 'col3'])
arr = np.ones(len(df.index), dtype=int)
idx = 0
df.insert(loc=idx, column='col0', value=arr)
print(df)
col0 col1 col2 col3
0 1 1 2 3
1 1 4 5 6
直接定义+重新排序
一种干净的解决方案是简单地添加一行,并将最后一列移动到数据帧的开头。下面是一个完整的示例:
df = pd.DataFrame([[1, 2, 3], [4, 5, 6]],
columns=['col1', 'col2', 'col3'])
df['col0'] = 1 # adds column to end of dataframe
cols = [df.columns[-1]] + df.columns[:-1].tolist() # move last column to front
df = df[cols] # apply new column ordering
print(df)
col0 col1 col2 col3
0 1 1 2 3
1 1 4 5 6
https://stackoverflow.com/questions/50778190
复制相似问题