使用python中的pandas将具有分离的值的txt文件转换为数据帧_将txt文件转换为python中的数据帧_Python将包含特殊字符的.txt文件转换为数据帧 - 腾讯云开发者社区

数据库、sql

我需要有一个数据库，超过50T的，像网盘一样，可以存储。因为经常要传输超过单个30G以上的文件，腾讯云能解决吗

浏览 164提问于2021-05-08

2回答

如何部分读取一个巨大的CSV文件？

python、pandas

我有一个非常大的csv文件，所以我无法将它们全部读取到内存中。我只想读取和处理其中的几行。所以我在Pandas中寻找一个函数，它可以处理这个任务，基本的python可以很好地处理这个任务： with open('abc.csv') as f: line = f.readline() # pass until it reaches a particular line number.... 但是，如果我在pandas中这样做，我总是读第一行： datainput1 = pd.read_csv('matrix.txt',sep=',',

浏览 0提问于2015-03-30得票数 47

回答已采纳

2回答

Pandas读取txt文件的问题

python、python-3.x、pandas

我很难让我的代码(python 3)读取一个txt文件。我使用Pandas让它工作，我让它读取文件并获得正确的行数，但是模块将文件作为一列读取，并将整个数据帧放入一列0中。以下是代码的示例。 import pandas as pd import numpy as np data = pd.read_csv(r'file.txt',header=None) 我也在代码行中使用了分隔符/分隔符设置，比如\t或‘’，但它无法读取文件。以下是该文件的外观示例。 JK+0923 7.05 19.3 200.4 -56.1 0.140 0.022 2010 GHT-J

浏览 31提问于2019-10-16得票数 2

回答已采纳

9回答

腾讯云时序数据库 CTSDB VS 传统时序数据库？

数据库、sql

很多公司已经开始持续收集、分析数据，用于异常处理、趋势预测、精准营销、风险控制等场景，希望利用数据的潜在价值，提高公司盈利能力和竞争力。那么腾讯云时序数据库 CTSDB VS 传统时序数据库，腾讯云时序数据库有没有什么进步？

浏览 1720提问于2018-09-26

2回答

日期包含点作为小数点，浮点数包含逗号作为小数分隔符的read_csv？

python、pandas

我有一个csv文件，其布局如下所示： date a b 2019-08-28 10:43:41.098 -1,9 -2,5 当我使用以下命令将其读入pandas时 df = pd.read_csv(file,sep=None,parse_dates[0],engine='python',decimal=',') 我看了一下结果数据帧，Pandas将date识别为dtype: datetime64[ns]，而将其他列识别为dtype: object。我已经尝试完全跳过decimal=','部分，但它没有帮助。我可以尝试将逗号单独

浏览 21提问于2019-09-05得票数 0

2回答

熊猫创建新的列并附加

python、pandas、concat

我试图将多个文本文件编译成一个数据框架。但是，当我使用Pandas Concat函数加入数据帧时，生成的数据帧的形状会添加新的列。在下面的代码示例中，数据框架3有12列，而不是8列。为什么？ **Input:** import pandas as pd df1 = pd.read_csv('2011-12-01-data.txt',sep = None, engine = 'python') df2 = pd.read_csv('2011-12-02-data.txt',sep = None, engine = 'python'

浏览 1提问于2017-06-24得票数 4

回答已采纳

2回答

打算用discuz建站，问下源码程序是上传到云服务器还是上传到数据库？

云服务器、对象存储、云硬盘、云数据库 SQL Server、文件存储

计划购买三个月的腾讯云服务器和一年的数据库，问下源码程序是上传到腾讯云服务器还是上传到数据库？

浏览 720提问于2019-01-01

回答已采纳

3回答

无法读取pandas数据帧中的glove.6B.300d.txt

python-3.x、pandas、glove

我正在尝试将glove.6B.300d.txt文件读取到Pandas数据帧中。(该文件可从此处下载：https://github.com/stanfordnlp/GloVe) 以下是我得到的例外情况： glove = pd.read_csv(filename, sep = ' ') ParserError: Error tokenizing data. C error: EOF inside string starting at line 8 glove = pd.read_csv(filename, sep = ' ', engine = 'pyt

浏览 160提问于2019-05-01得票数 1

2回答

筛选只包含起始引号或起始引号的CSV中的行，但列没有尾引号

python、python-3.x、pandas、python-2.7

我有一个示例CSV文件，其中有2行。如果行列中包含起始双引号和结束双引号，则pandas.read_csv是成功的。但是，如果一个行列只有开始双引号，并且没有该列的结束双引号，那么pandas.read_csv将出现错误，即"ParserError: error tokenizing data. C error: EOF if if开始于第2行“。我需要将这些坏行过滤为单独的数据帧，并处理其他记录。我尝试过的守则是： import pandas as pd import csv from io import StringIO pd.set_option('display.

浏览 10提问于2022-06-17得票数 0

回答已采纳

3回答

如何使用python pandas在本地系统Jupyter Notebook中读取两个更大的5 5GB文件？如何在本地连接两个数据帧进行数据分析？

python、python-3.x、pandas、jupyter-notebook、data-science

如何使用python pandas在本地系统Jupyter Notebook中上传两个大(5 5GB)的csv文件。请建议任何配置来处理用于数据分析的大型csv文件？ Local System Configuration: OS: Windows 10 RAM: 16 GB Processor: Intel-Core-i7 代码： dpath = 'p_flg_tmp1.csv' pdf = pd.read_csv(dpath, sep="|") Error: MemoryError: Unable to allocate array 或 pd.read_c

浏览 1提问于2020-01-24得票数 4

1回答

如何将文件夹中的多个ann文件(从brat注解)读取到一个pandas数据帧中？

python、pandas、dataframe、nlp、brat

我可以将一个ann文件读入pandas dataframe，如下所示： df = pd.read_csv('something/something.ann', sep='^([^\s]*)\s', engine='python', header=None).drop(0, axis=1) df.head() 但我不知道如何将多个ann文件读取到一个pandas数据帧中。我尝试使用concat，但结果并不是我所期望的。如何将多个ann文件读入一个pandas数据帧？

浏览 6提问于2021-08-16得票数 0

回答已采纳

1回答

与Cloud

google-app-engine、google-cloud-datastore、google-cloud-platform、google-compute-engine、google-cloud-sql

我正在用Google作为后端构建一个移动应用程序。它存储有关餐馆的信息，包括他们的菜单。我需要根据菜单项和地理位置进行搜索。我对使用哪种谷歌云解决方案相当困惑。最初我计划使用Google和Cloud一起存储数据，但后来发现它不支持地理位置搜索，即使我使用，我也不会得到“喜欢”文本搜索。关于使用云SQL，我担心它的价格。我还在考虑使用，并在其中安装所需的MongoDB或SQL，并使用一些自定义搜索库。，所以我的问题是，以下哪一种应该是存储大量数据和使用文本和地理位置搜索的可行和经济的解决方案。带云数据存储的GAE 使用Cloud的GAE 安装了MongoDB或SQL的GCE

浏览 5提问于2016-12-27得票数 2

2回答

Python记事本-导入带有两个字符分隔符的数据文件会导致错误。

python、pandas、azure、azure-sql-database

问题：我们在向Azure SQL Db加载数据文件(该文件有两个字符分隔符)时遇到以下错误。我们可能做错了什么，如何解决这个问题？使用Python笔记本在，我们试图加载一个数据文件到。数据文件中的分隔符有两个字符~*。在下面的代码中，我们得到如下错误：熊猫“python”引擎不支持的低内存数据码 import sqlalchemy as sq import pandas as pd data_df = pd.read_csv('/dbfs/FileStore/tables/MyDataFile.txt', sep='~*', engine=

浏览 11提问于2022-02-23得票数 0

回答已采纳

1回答

腾讯云API网关怎么无法restful？？新增里面只能填写网关名和描述，其他文档的设置选项全都没？

云 API、api、云函数、serverless

腾讯云API网关怎么无法restful？？新增里面只能填写网关名和描述，其他文档的设置选项全都没调用scf函数也是默认的直接调用函数名，，根本不需要restful的吗== =？？？

浏览 547提问于2020-06-02

1回答

Pandas:来自ftp文件的数据帧

python、pandas、dataframe、ftp

我想将通过ftp检索的一个以制表符分隔的大文本文件的内容直接放入pandas数据帧中。 import pandas as pd import urllib.request as ur # retrieve only the header column & set dtype to save some memory refseq_summary = "ftp://ftp.ncbi.nlm.nih.gov/genomes/refseq/assembly_summary_refseq.txt" req = ur.Request(refseq_summary) z_f = u

浏览 0提问于2019-05-14得票数 0

2回答

根据文件名将csv文件放入单独的pandas数据帧中

python、pandas、csv、dataframe、concat

我有一个包含文件名的列表。我想解析目录，从列表中的每个元素开始读取所有文件，并将其存储在dataframe中例如： list1=[abc,bcd,def] 目录： abc1.txt abc2.txt abc3.txt bcd1.txt bcd2.txt bcd3.txt 输出应该是这样的:以'abc‘开头的文件应该在一个pandas数据帧中，而在其他数据帧中以'bcd’开头的文件，等等我的代码： dfs = [] for exp in expnames: for files in filenames: if files.startsw

浏览 0提问于2018-11-02得票数 0

2回答

Python将txt文件读入dataframe

python、pandas

我正在尝试将txt文件(整个目录)摄取到pandas数据帧中，以便数据帧中的每一行都包含一个文件的内容。据我所知，文本文件不是分隔的，它们是电子邮件的正文。除一个文件外，所有文件都拆分为多行。所以不是有20多行(每个文件一行)，我有超过500行。我不知道这一个文件和其他文件有什么不同。它们都是纯文本的。我使用的代码是： import pandas as pd for i in files: list_.append(pd.read_csv('//directory'+i ,sep="\t" , quoting=csv.QUOTE_NONE,hea

浏览 3提问于2015-11-25得票数 2

回答已采纳

7回答

与Python相比，在Julia中阅读csv要慢一些

julia

与Python相比，用Julia读取大型文本/ csv文件需要很长时间。下面是读取大小为486.6 MB、有153895行和644列的文件的时间。 Python3.3示例 import pandas as pd import time start=time.time() myData=pd.read_csv("C:\\myFile.txt",sep="|",header=None,low_memory=False) print(time.time()-start) Output: 19.90 R 3.0.2例 system.time(myData<-re

浏览 14提问于2014-02-19得票数 29

回答已采纳

2回答

如何使用带有gzip压缩选项的pandas read_csv读取tar.gz文件？

python、csv、pandas、gzip、tar

我有一个非常简单的csv，包含以下数据，压缩在tar.gz文件中。我需要使用pandas.read_csv在数据帧中读取它。 A B 0 1 4 1 2 5 2 3 6 import pandas as pd pd.read_csv("sample.tar.gz",compression='gzip') 然而，我得到了一个错误： CParserError: Error tokenizing data. C error: Expected 1 fields in line 440, saw 2 以下是一组read_csv命令以及我在使用它们时

浏览 1提问于2016-09-01得票数 40

回答已采纳

1回答

我怎样才能使用for循环来简化这件事呢？

python、pandas、dataframe

我有一个这样的df： |File name|Sample|Thickness| |D210215-3-2-1 cell100_00_mes.txt|D210215-3-2-1|100| |D210215-3-2-4 cell500_00_mes.txt|D210215-3-2-4 |100| |D210215-3-2-2 cell200_00_mes.txt|D210215-3-2-2 |125| |D210215-3-3-1 cell500_00_mes.txt|D210215-3-3-1 |125| |D210215-3-2-3 cell600_00_mes.txt|D210215-3-

浏览 7提问于2021-03-25得票数 0

回答已采纳