输入
一个名为input_file.csv的文件,它有7列和n行。
示例标题和行:
Date Location Team1 Team2 Time Prize_$ Sport
2016 NY Raptors Gators 12pm $500 Soccer
输出
N个文件,其中每个新文件中的行根据原始文件第7列中的值进行分组。每个文件都是以第7列中的共享值命名的。注意:每个文件都有相同的标题。(脚本当前执行此操作。)
示例:如果原始文件中的2行将golf作为第7列的值,它们将被分组到一个名为golf.csv的文件中。如果其他3行共享soccer作为第7列的值,则可以在soccer.csv中找到
我有一个巨大的CSV文件(3.5GB,每天都在变大),它有正常的值,还有一列名为“元数据”的嵌套JSON值。我的脚本如下所示,其目的只是将JSON列转换为其每个键值对的普通列。我正在使用Python3 (Anaconda;Windows)。
import pandas as pd
import numpy as np
import csv
import datetime as dt
from pandas.io.json import json_normalize
for df in pd.read_csv("source.csv", engine='c',
我目前正在使用pandas从csv文件中读取数据,但我正在尝试从输出中删除索引列、名称和dtype
import pandas as pd
df = pd.read_csv('C:/Users/Book2.csv')
list = [df['Column1']]
print (list)
输出:
[0 ST
1 VC
2 ST
3 ST
4 ST
5 CO
6 UT
Name: Column1, dtype: object]
我有两个csv文件,一个包含source_node、destination_node格式的两个列,另一个包含一个节点列表。现在,我正在尝试使用第一个文件创建一个图形
load csv with headers from "file:///C:/Users/neo4j_workspace/new_graph_db/import/sample_edges.csv" as table
merge (a:Node{name:table.destination_node })
with table, a
merge (b:Node{name:table.source_node})
背景
我有一个CSV文件的集合,每个文件都有相同的数据结构。每个文件都是在给定的日历日生成的,因此,例如,我可能在10/8/13中有一个包含20,000条记录的文件,在10/9/13中有一个包含50,000条记录的文件,等等。
所有这些CSV数据都需要导入到Server表中,但我为RecordDate添加了一个列,该列需要设置为生成记录之日的值。
总共有14个CSV文件,所以我不介意运行14个批量插入操作,如下所示:
BULK INSERT CSVTest
FROM 'c:\csvtest.txt'
WITH
(
FIELDTERMINATOR = ',',
R
我目前正在处理许多.csv文件,它们的名称都是"sim_data_L_m.csv“形式,其中L和m是两个实验参数。
我编写了以下代码,将所有csv文件导入R中的数据帧,然后将所有这些数据帧放入列表中以便于索引。
#Load all .csv in directory into list
dataFiles <- list.files(pattern="*.csv")
N <- length(dataFiles)
dataList <- vector("list",N)
j <- 1
for(i in dataFiles) {
我的perl脚本中有以下命令:
my @files = `find $basedir/ -type f -iname '$sampleid*.summary.csv'`; #there are multiple summary.csv files in my basedir. I store them in an array
my $summary = `tail -n 1 $files[0]`; #Each summary.csv contains a header line and a line with data. I fetch here the last line.
我目前正在使用csv文件和熊猫模块自动化SQL脚本。其中的条件是基于我的csv文件中的值。
示例csv文件如下所示。
First Last
X A
Y B
Z C
我想要一个新的dataframe,它应该是这样的(添加了新的列)。
First Last condition
X A First='X' and Last='A'
Y B First='Y' and Last='B'
Z C First=
我的第一个CSV文件看起来是这样的,其中包含了头(头只包含在顶部,而不是在每个条目之后):
NAME,SURNAME,AGE
Fred,Krueger,Unknown
.... n records
我的第二个文件可能如下所示:
NAME,MIDDLENAME,SURNAME,AGE
Jason,Noname,Scarry,16
.... n records with this header template
合并的文件应该如下所示:
NAME,SURNAME,AGE,MIDDLENAME
Fred,Krueger,Unknown,
Jason,Scarry,16,Noname
....
基本上
我正在读取多个csv文件(20个文件),并最终创建一个数据文件。虽然我用眼睛手动检查,但列名是相同的。但是,由于某些原因,我得到了以下错误。
Match.names中的错误(clabs,name(Xi)):名称与以前的名称不匹配
这是我写的代码
fnames <- list.files("C:/Users/code",pattern='^La') # getting all the files from directory. Update it as required
csv <- lapply(fnames,read.csv) # rea