我在一个文件夹中有662个文本文件,为了打开它们,我使用了我在这里找到的代码:
os = '..'
path = './'
for infile in glob.glob(os.path.join(path, '*.*')):
print('current file is: ' + infile)
删除我使用的第一列:
with open(infile) as infile:
for line in infile:
print(line.split()[0])
但在这里,第一个问题是,它只提取最后一
假设我使用R的唯一函数来创建一个脚本来提取一个预先制作的数据文件中的特定列来生成一个新的列:
SUPSCIARIDS<-unique(SuperiorSciarids[,c(36,2,3,4:34)])
36-LOGID
2-Decay
3-Diameter
4:34 are the species
为什么您认为新的数据框架没有显示列2?
我有一个nxn .csv文件,其中我正在查找一列的累积和。我需要在现有.csv文件的末尾加上一个头累加,以使它成为nx(n+1)。这是怎么做到的呢?我附上一个样本:
filename A B
aa 23 34
aa 56 98
aa 8 90
aa 7 89
我正在找A列的累积和
23
79
87
94
我需要将这个列追加到.csv的末尾,作为
filename
我在Excel中有一个大型数据文件,其中大约有240列,每列代表一个变量。因为我只需要其中的56个变量,所以我想将相应的列提取到另一个Excel工作表中。
我使用下面的代码(我在中找到了它)通过一个宏来做到这一点:
Public Sub extractCol()
Set range1 = Range("A:D, BI:BI, BQ:BQ,CL:CL,CM:CN,CT:CT,DB:DB")
range1.Copy
Set newbook = Workbooks.Add
ActiveCell.PasteSpecial Paste:=xlPasteVa
我有一个有很多专栏的大文件。我希望在1列中计算每个值的出现数。因此,我使用cut -f 2 "file" | sort | uniq -c。我得到我想要的结果。但是,当我将这个文件读取给R时,它显示出我只有1列,但是数据与下面的示例类似:
123 Chelsea
65 Liverpool
77 Manchester city
2 Brentford
我想要的是两列,一列代表计数,另一列代表名字。不过,我只有一个。有人能帮我把列分割成2或更好的方法从大文件中提取吗?
提前谢谢!
我对perl很陌生,并试图理解散列。我试过使用基本哈希及其工作。我现在试图使用散列哈希来提取数据。例如,我有一个文本文件(input.txt),其中包含一些随机信息。如何使用散列结构提取所需的信息。
input.txt
hi how r you this is sample .txt. you can use it for learning hash and hash of hashes. Let say I have cell ("name") and it has value as below
cell ("name"){
pin : A, B;
f
我的目的是从多个数据文件中提取某一列。因此,我尝试使用glob模块读取文件,并尝试从每个文件中提取一个列,并使用如下所示的for语句:
filin = diri + '*_7.txt'
FileList=sorted(glob.glob(filin))
for INPUT in FileList:
a = []
b = []
c = []
T = []
f = open(INPUT,'r')
f.seek(0,0)
for columns in ( raw.strip().split() for raw i
我有如下所示的数据集
first 0 1
first 1 2
first 2 3
second 0 1
second 1 2
second 2 3
third 0 1
third 1 2
third 2 3
我需要检查这个文件并提取第一、第二和第三列的第三列,并将它们存储在不同的文件中。
输出文件应包括:
1
2
3
我正在尝试弄清楚如何使用正则表达式,以便能够从制表符分隔的文本文件中“提取”特定文本,并对下面的文件执行操作。
我有一个以下格式的文件:
#HEADER_IGNORE HEADING1 HEADING2 HEADINGN
Some Text Here value value2 value3
SOME_TEXTHERE x z
Some More Text Here A B
我希望能够提取第一个“列”。本质
我有几个csv文件,我所有的csv文件都是相同的,但csv文件中的一些列彼此不同。举个例子:
csv 1、2、3具有以下列:
id name post title cdate mdate path
但在csv 4,5中有以下列:
id name post title ddate mdate fpath
我的输出应该是这样的:
id name post title cdate mdate ddate path fpath
如何做到这一点?目前,我遵循这一点:
但是在这个过程中,我可以从csv中提取数据,但不能从首选输出中提取数据。