使用Python从文本( CSV文件中)提取数据_我想提取数据从txt文件到csv文件使用python_从csv文件中提取数据 - 腾讯云开发者社区

python、pdf、text-extraction

我正在尝试从pdf文件中提取文本(类似于表单)。目前，我在Chrome上打开文件，选择/复制所有文本，将其粘贴到txt文件中，然后使用Python将其处理为CSV。Chrome让我的数据非常结构化和统一，这样pdf的每一页都会产生类似的文本块，让我可以轻松地处理它。我试图直接从pdf中提取文本，以将其处理为CSV格式，但由于原始pdf的生成方式，我总是得到一些混乱的结果。我尝试过pdfminer和pyPdf2，但当表单在某些字段中缺少值时，结果会变得混乱。也许这是一个泛化的问题，但是，我如何才能在提取过程中得到更结构化的结果？

浏览 35提问于2021-06-16得票数 0

2回答

如何在python中根据头部提取特定的csv数据

python、csv

如何根据python中的头文件从csv文件中提取特定数据？例如，假设csv文件包含以下信息： Height,Weight,Age 6.0,78,25 如何在python中仅检索年龄？

浏览 0提问于2013-04-17得票数 5

回答已采纳

1回答

如何使用aws从文档中提取服务和.net导出CSV表格

.net、amazon-web-services、amazon-textract

我试图使用AWS的DetectDocument (异步)从PDF文件中提取表格和数据，使用的是C#/.NET。我在数据提取方面很成功，但我不知道如何使用AnalyzeDocument提取PDF中的表格并导出到CSV文件中。阅读亚马逊网络服务的文档，在Python中找到CSV解压缩，而不是在.NET中。请参阅链接：- https://docs.aws.amazon.com/textract/latest/dg/examples-export-table-csv.html 尝试查看Python代码并复制.NET，但没有成功。

浏览 21提问于2019-09-03得票数 1

回答已采纳

1回答

如何在二进制文件中使用python csv.DictReader？(关于babel自定义提取方法)

python、python-3.x、csv、python-babel

我正在尝试为babel编写一个自定义提取方法，以便从csv文件中的特定列中提取字符串。我跟踪了文档。以下是我的提取方法代码： def extract_csv(fileobj, keywords, comment_tags, options): import csv reader = csv.DictReader(fileobj, delimiter=',') for row in reader: if row and row['caption'] != '': yield (rea

浏览 1提问于2018-07-03得票数 11

1回答

从html中的列中提取多种类型的文本。

python、html、url、csv、extract

我是Python新手，我正在尝试从html页面中提取数据。表中有一列是文本和URL的混合。我想从该列中提取所有信息，并保持指向csv文件的链接不变(稍后我会将其保存为Excel文件)。请给我提个建议。下面是我仅提取文本的代码。 trs = soup.find_all('tr') for tr in trs: tds = tr.find_all("td") try: RS_id = str(tds[5].get_text().encode('utf-8')) 列中的几个单元格有多个URL，我希望它们保持不变。

浏览 0提问于2014-07-08得票数 0

7回答

如何从CSV文件导入数据并将其存储在变量中？

python、csv、python-3.x、permutation、python-itertools

我对python 3非常陌生，我在这里学习。我想有人可以帮我解决一个基本问题:如何将CSV文件中的文本作为变量存储在代码的后面。因此，这里的想法是将CSV文件导入python解释器： import csv with open('some.csv', 'rb') as f: reader = csv.reader(f) for row in reader: ... 然后从该文件中提取文本并将其存储为变量(即w = ["csv file text"])，然后在代码中稍后使用以创建排列： print (list(iter

浏览 11提问于2014-05-28得票数 2

回答已采纳

1回答

CSV文件未正确填充详细信息

python、csv、export-to-csv

import csv TextFileContent = open('tickets.txt') with open('example4.csv', 'w') as csvfile: fieldnames = ['Author', 'ticket number', 'Revision'] writer = csv.DictWriter(csvfile, fieldnames=fieldnames) writer.writeheader() for TextLine i

浏览 0提问于2018-10-02得票数 1

1回答

Python Pandas DataFrame数据标识

python、excel、csv、pandas

我从.xlsx文件中提取数据并将其存储在数据帧中。数据帧称为df，数据帧的大小为(51,3)。51行。3列。列是未命名的，编号为0、1、2。行的索引从0到50。在python中，我将使用什么语法从带有pandas的数据帧中提取数据并将其放入csv？我知道我会使用DataFrame.to_csv("outputFile.csv" )，但是我不确定如何识别特定的数据(行/列对)，所以我可以将它放在csv表中的新位置，而不是旧的excel表。

浏览 1提问于2016-03-09得票数 0

4回答

如何从具有给定参数的csv文件中提取特定数据？

python、csv、sentiment-analysis

我想从给定的csv文件中提取中性词(到一个单独的.txt文件)，但是我对python相当陌生，对文件处理不太了解。我找不到一个中性词数据集，但是在到处搜索之后，这就是我能够找到的。下面是我想从其中提取数据的Gtihub项目(以防有人需要知道)： Neutral Words Word Sentiment Score a 0.0125160264947 the 0.00423728459134 it -0.0294755274737 and 0.0810574365028 an 0.0318918766949 or -0.

浏览 6提问于2018-04-02得票数 0

回答已采纳

1回答

如何迭代csv行以使用pandas从URLS中提取文本

python、pandas、python-newspaper

我有一堆新闻文章的csv，我希望使用newspaper3k包从这些文章中提取正文文本，并将它们保存为txt文件。我想创建一个遍历csv中每一行的脚本，提取URL，从URL中提取文本，然后将其保存为一个唯一命名的txt文件。有人知道我会怎么做吗？我是一名刚接触Python的记者，如果这太直接了，很抱歉。我只有下面的代码。在弄清楚如何将每个正文文本保存为txt文件之前，我认为应该尝试让脚本打印csv中每一行的文本。 import newspaper as newspaper from newspaper import Article import sys as sys import panda

浏览 10提问于2019-02-07得票数 0

回答已采纳

1回答

Python:如果列具有键值对格式的数据，如何读取csv数据

python、pandas、csv

我是python的新手。我需要读取csv文件，它有不同的列。在csv文件中，一列包含像键和值对这样的数据。使用pandas如何从csv中提取该列的键和值。例如:列名：fruit 该列中的数据： { ""apple": "1,2,3,4", "orange":"5,6,7,8"} 如何从csv文件中获取水果列的键及其值？有什么建议吗？

浏览 3提问于2018-06-01得票数 0

2回答

数据库中的异步csv.writer

python、database、asynchronous、pyodbc

我有一个从DB提取数据到CSV文件的Python脚本。我使用访问数据库并执行查询。我还使用csv.writer将查询输出到一个文件中： with open(source_filename, 'w', newline='') as source_file: csv.writer(source_file, quoting=csv.QUOTE_NONNUMERIC).writerows(db_cursor) 因为脚本输出数据库中的所有表，所以我希望通过使用后台处理来加速提取，而不是一个接一个。有没有办法在Python中做到这一点？我尝试使用多处理，但无法克服

浏览 3提问于2012-09-11得票数 0

1回答

从word文档中提取表格

python、vba、ms-word、extract

是否有工具可以从word文档中提取所有表格，并使用python或vba将其转换为csv文件或任何excel扩展文件？请注意，word文件同时包含文本和表格。

浏览 18提问于2021-02-24得票数 0

回答已采纳

1回答

在python中使用URLLIB从在线CSV文件中拉取数据

python、html、csv、urllib

因此，在Python中，我尝试使用csv模块从csv文件中提取数据(以处理curse的csv文件中的数据)，我有： import csv with open('GDMTH_CSV.csv')as csv_file: csv_file_read = csv.reader(csv_file) for line in csv_file_read: print(line) 然后我得到原始数据，所以我相应地修改以获得我需要的特定数据。但是GDMTH_CSV.csv实际上是一个在线文件，所以我使用urllib.request模块来尝试同样的事情： import urlli

浏览 47提问于2019-01-04得票数 0

回答已采纳

1回答

将非柱状文本文件转换为柱状CSV/Excel

java、python、regex、csv、text

我有一个输入文本文件，其中包含从PDF逐页提取的数据。此输入文本文件没有列和行格式的所有数据。如何将此文件转换为csv或excel格式，并将数据按图中所示的列和行排列。我已经附加了样本输入文件以及所需的样本输出文件。是否有免费软件或Java/Python？我该如何开始呢？这一过程的任何线索都是非常感谢的。输入文件和逻辑输出文件输入文件输出文件

浏览 2提问于2019-11-13得票数 1

1回答

从url导入数据集并在python3中将文本转换为csv

python-3.x、pandas、csv

我是Python (使用Python3)的新手，并且阅读Pandas来导入数据集。我需要从url - 导入数据集并将其转换为csv文件，我在转换后的csv ->��中获得一些特殊字符我正在下载txt文件并将其转换为csv，是正确的方法吗？转换后的csv将整个文本放入一列 from urllib.request import urlretrieve import pandas as pd from pandas import DataFrame url = 'https://newonlinecourses.s

浏览 6提问于2019-07-06得票数 1

2回答

使用lftp提取文件并迭代提取的文件。

python、linux、bash、scripting、lftp

我使用lftp从FTP服务器提取一些CSV数据文件，命令如下： lftp -e 'set ftp:use-mdtm false; set ftp:timezone Europe/Berlin; mirror --newer-than=now-1days --no-recursion --verbose -i "INERGIA.*\.csv" / /mnt/trailstone/itpf/DataInput; bye' -u [USERNAME],[PASSWORD] [SERVER-NAME] 它运行得很完美。但是，在提取CSV文件之后，我希望对每个文件进行迭代

浏览 2提问于2016-05-10得票数 0

回答已采纳

1回答

从zip文件夹将文本文件的内容读入熊猫数据

python-3.x、pandas、dataframe

我有一个zip文件，在zip文件中，我有一系列文件夹，这些文件夹依次包含文本文件。就像下面。 zip1 - folder 1 - folder x - file1.txt - file2.txt - folder y - file3.txt - file4.txt - folder z - file6.txt - file7.txt - folder 2 - folder m - file

浏览 11提问于2022-11-20得票数 0

回答已采纳

2回答

如何从.csv文件中提取特定数据并使用Python将其存储在变量中

python、dataframe、variables

我有.csv文件包含货币和汇率。我希望从.csv中提取突出显示的数据，并将其存储在变量中。我怎样才能用Python做到这一点呢？我现在是Python的初学者，我有很多东西要学。

浏览 2提问于2021-10-11得票数 0

回答已采纳

2回答

如何利用气流进行实时数据处理

etl、airflow

我有一个场景，我希望处理csv文件并加载到其他数据库：病例 pic csv文件并以与csv同名的名称加载到mysql。然后使用python任务文件对已加载的行进行一些修改。之后，从mysql中提取数据并加载到其他数据库。 CSV文件从远程服务器到文件夹中的一个气流服务器。我们必须通过python脚本选择这些csv文件并进行处理。假设我选择了一个csv文件，那么我需要以依赖关系的方式将这个csv文件传递给操作符的其余部分 filename : abc.csv task1 >> task2 >> task3 >>task4 因此，

浏览 0提问于2018-02-26得票数 0

3回答

将多个html文件中的文本提取到一个CSV文件中的最佳方法

python

读完这个论坛后，我不确定哪种方法最好将部分数据提取到CSV文件中，即Python/Beautiful Soup/html2text。因为有大量的文件，所以我想尝试编写一个可以在终端中运行的脚本。输出:一个CSV文件，包含一行文本和五列数据。例如第一行和最后一行 1002010-12-20 145 ABC 04110000 1 2010-11-10 133 DDD 041123847 谢谢!

浏览 2提问于2010-12-25得票数 1

回答已采纳

2回答

安装用于PDF文本提取的弹出器

python、pdftotext、poppler

我试图跟随这个博客，尝试从发票pdf文件中提取文本。我的文本提取需要提取发票的特定字段。我尝试过pdfminer，textract，但它们都将文本提取为杂乱无章的文本，之后很难提取文本。我偶然发现了下面的Poppler包下载：看起来像是一个.tar文件。而不是python包。我不确定如何使用这个.tar文件来解压包并在Python中使用它。任何建议，我如何在我的mac上安装它，然后在python中以编程方式使用它来运行一堆pdf文件来提取数据。

浏览 24提问于2020-04-24得票数 2

1回答

提取pdf内容在python中不起作用。

python、python-3.x、pdf、unicode、ocr

我正在使用python请求库从等urls中收集数百万可公开使用的pdfs。然后我试着提取pdf中的表格，然后用熊猫把这些摘录的文本写进csv。但问题是，这些摘录的文本是混乱或破损的孟加拉语文本，这是没有用的。如何从这些pdfs中正确地提取文本并写入csv。到目前为止我使用的代码- response = requests.get(url,headers=headers) pdf_txt = '' with io.BytesIO(response.content) as open_pdf_file: #global pdf_txt read_pdf = PyPDF

浏览 6提问于2022-07-22得票数 -1

1回答

从csv文件中识别和计数python中的不同输出

python

我正在从csv文件中提取数据，并让它从每行数据中打印出三个字母的国家代码。如何让python从输出的数据中识别出每个唯一的国家代码出现的次数？这就是我要打印的国家代码。 import csv with open('2017CountryData.csv') as csvfile: readCSV = csv.reader(csvfile, delimiter=',') for row in readCSV: countries = row[1] print(countries)

浏览 1提问于2018-06-01得票数 0

1回答

PYPDF2 -提取所有页面并转换为CSV

python、pypdf2

我刚接触Python，正在尝试将PDF中的数据提取到CSV文件中，下面是我使用的代码： import pdfplumber import pandas as pd file = 'Test Slip.pdf' lines = [] with pdfplumber.open(file) as pdf: pages = pdf.pages for page in pdf.pages: text = page.extract_text() for line in text.split('\n'):

浏览 2提问于2021-03-30得票数 2

2回答

从Oracle数据库表生成CSV文件的最快方法是什么？

oracle、snowflake-cloud-data-platform

我在oracle数据库中有一个表，其中有大约7亿条记录，大小约为5 5gb。我必须每天运行一个作业来将oracle表复制到snowflake。因为snowflake中没有到oracle数据库的直接连接器，所以我必须首先从oracle数据库提取数据到csv文件，然后使用python脚本将csv文件上传到snowflake。我尝试使用sqlplus将数据提取到csv。但是sqlplus提取数据需要很长时间。所以我的问题是: 1.从oracle数据库中提取数据的最快方法是什么? 2.由于我每天都要运行一个作业来将这个oracle表更新到snowflake中，有没有其他方法来完成这个任务？任何帮助都

浏览 0提问于2020-04-20得票数 0

1回答

使用Matlab提取数据并将数据写入特定行的代码

matlab、fwrite、matlab-guide、fread、fclose

我目前正在做一些需要专家帮助的事情。我是Matlab的新手。以下是要求。我有一个很大的数据文件(文件可以是最适合需要的任何格式，比如csv或txt或xlsx文件，具有混合内容)，我必须从其中提取数据，并在特定字符串或特定行(例如第15行)之后将其写入文本文件。我必须在for循环中运行此循环，以便从数据文件中提取的数据被写入到我已经有的多个文本文件中。我开发了一个代码，现在可以提取数据并将其写入文本文件，但它会从一开始就替换文本的内容。我想在指定的位置插入输出(输出有多行)。以下是当前可用的代码。 fidr = fopen('file1.csv','r') ;

浏览 8提问于2017-08-02得票数 0

2回答

从JSONL文件中提取嵌套数组

python、arrays、json、jsonlines

我正在使用json2csv.py (使用twarc编译)从JSONL文件中提取额外的字段，并且在提取保存在数组中的一些文本字段时遇到了问题。这就是数组，我希望能够拉出hashtag文本。 "entities": { "hashtags": [ { "text": "NoJusticeNoPeace", "indices": [ 65, 82 ] },

浏览 6提问于2020-06-20得票数 0

1回答

Python -运行使用多处理的多个python脚本会影响性能，有时会出现错误

python-3.x、multiprocessing、subprocess、pool

我有一个PYTHON脚本，它使用多进程将数据从DB2/Oracle数据库提取到CSV并摄取到Snowflake。当我运行这个脚本时，性能很好(在75秒内提取大型数据集的源表)。因此，我复制了这个python脚本，并更改了输入参数(基本上不同的源表)。当我同时运行所有这些python脚本时，性能会受到影响(对于同一个表，它会在100秒内提取)，有时我会看到错误“无法分配内存”。我使用的是Jupyter Nootebook和所有这些不同的python脚本，将不同的源表提取到CSV文件中，并将其保存在相同的服务器位置。我自己也在检查。但任何帮助都将不胜感激。谢谢巴拉

浏览 0提问于2020-10-10得票数 0

4回答

如何移除卷曲括号之间的文字

string、python-3.x

我从csv文件中提取了字符串。我想知道如何使用Python，ex从字符串中移除花括号之间的文本： string = 'some text hear { bracket } some text here' 我想要： some text hear some text here 我希望任何人都能帮我解决这个问题，谢谢。编辑:回答导入re =‘一些文本听到{括号}这里的一些文本’string =re.sub(r“\s*{.}s "，”，string) print( string )

浏览 2提问于2017-09-23得票数 3

回答已采纳

1回答

如何使用python从.csv文件中的行中提取数据到单独的.txt文件中？

python、csv

我有一个从h5文件导出的面试记录的CSV文件。当我将行读入python时，输出如下所示： line[0]=['title,date,responses'] line[1]=['[\'Transcript 1 title\'],"[\' July 7, 1997\']","[ '\nms. vogel: i look at all sectors of insurance, although to date i\nhaven\'t really focused on the reins

浏览 0提问于2015-08-19得票数 1

回答已采纳

1回答

从一个csv文件中提取指定的数据，然后使用python分配给另一个csv文件。

python、python-2.7、csv

我得到了一个csv文件，里面有这个表格中的数据，我想从列C中提取数据并将它们写入一个新的csv文件中，如下所示，所以我需要做两件事：将“节点”和数字从1到22写入第一行和第一列(因为在这种情况下，输入csv的A列中有22次重复循环) 我得到了C列中的数据，在输出csv中提取并写入，如下所示，我需要每22行一次转换这些数据，并从excel中的B2位置开始，然后从B3、B4、...etc.开始。显然，我必须遍历每一行才能有效地完成这一任务，但我不知道如何在python中应用csv模块。我应该下载xlrd包，还是只能使用内置

浏览 0提问于2014-04-01得票数 1

4回答

pandas数据帧中的python访问特定值

python、pandas

我刚刚开始使用python，并且正在努力从我的第一列数据帧的末尾提取一个值。假设我有一个包含3列的.csv文件： id,name,country 1,bob,USA 2,john,Brazil 3,brian,austria 我正在尝试从ID列中提取'3‘(最后一行ID值) fileName=open('data.csv') reader=csv.reader(fileName,delimiter=',') count=0 for row in reader: count=count+1 我能够获得行数，但不确定如何从该特定列中获得值

浏览 2提问于2019-10-03得票数 0

1回答

将数据从BigQuery导出到本地PostgreSQL/MySql数据库

python、google-bigquery

我是BigQuery和Python的BigQuery -处女膜。我的任务是:使用和Python 从BigQuery 中提取数据，将数据加载到MySql/PostgreSQL本地数据库(安装在我的PC上的数据库)中。我的看法(经过2小时的研究)是:将数据拉到本地csv文件()中，将数据从文件加载到数据库中。这是否类似于执行任务的正确方式？如果没有，请您提供一些建议/指示？提前谢谢。

浏览 1提问于2014-09-13得票数 6

回答已采纳

1回答

Python 2.7:如何分离提取的文本？

python、python-2.7、csv、beautifulsoup

我正在使用Python2.7和Beautiful soup从URL中获取一些文本，但我希望在每一行中分隔提取的文本。这就是我从URL中提取文本并将输出放入CSV文件的方法： # import libraries import csv import urllib2 from bs4 import BeautifulSoup # specify the url url = 'http://www.bkfrem.dk/default.asp?id=19' # query the website and return the html to the variable â€˜pag

浏览 3提问于2018-02-11得票数 0

回答已采纳

4回答

使用Python将文本文件转到csv

python、csv、transpose

我对Python完全陌生。我有一个很大的文本文件。我想对它做两件事。1.从它中提取出一个特定的区域，这是我一直能够做到的。2.现在转置提取的区域并写入csv文件。事实证明，这有点棘手。压缩功能没有做我想做的事。这是第一步的print语句中的数据，我想转换这个数据。 Number "A1" "A2" "A3" "A4" Data "ABCD" "ABCD" "ABCD" "ABCD" Date "Jan 04,2013&

浏览 0提问于2014-11-10得票数 1

回答已采纳

1回答

仅当另一个值为真时，如何从相邻单元格中提取数据？

python、csv

在Python中，我有一个CSV文件，其中A列有数据，如果A列中的某个值为真，我只尝试从B列的相邻单元格中提取数据。那密码是什么？例如：如果A列是TN，我只想从B列中提取相邻的数据。 A B NY 123 NY 456 TN 789 TN 100

浏览 2提问于2022-03-02得票数 -1

2回答

如何在python或R中将.docx文件中的表转换为.xlsx或csv文件？

我有一个类似下面提到的文档。在表格上方有一些文本，然后是一个表格。如何从R或python中的docx文件中提取表格，然后将其转换为csv文件或xlsx文件。我甚至不介意.txt文件保留表的确切格式。我只是不知道如何处理这个文档文件。

浏览 1提问于2016-03-18得票数 2

2回答

谷歌云数据流(Python)：读写.csv文件的函数？

google-cloud-platform、google-cloud-dataflow

我找不出GCP Dataflow Python SDK中读写csv文件(或任何非txt文件)的精确函数。对于BigQuery，我已经理解了以下函数： beam.io.Read(beam.io.BigQuerySource('%Table_ID%')) beam.io.Write(beam.io.BigQuerySink('%Table_ID%')) 对于读取文本文件，我知道ReadFromText和WriteToText函数。但是，我找不到任何GCP Dataflow Python SDK的示例，在这些示例中，数据被写入csv文件或从csv文件中读取数据。请您

浏览 0提问于2017-07-26得票数 2

1回答

基于压缩文件中文件的不同管道

python、google-cloud-dataflow、apache-beam

我在google云存储桶中有一个压缩文件。该文件包含一个大csv文件和一个基于xml的小元数据文件。我想提取这两个文件，确定元数据并处理csv文件。我正在使用Python，管道在某个时候将在上运行。当前的解决方案是使用Google函数提取两个文件，并使用从xml文件中解析的参数启动管道。我想消除Google函数，并处理Apache本身中的压缩文件。管道应该处理XML文件，然后处理csv文件。但是，我不得不将这两个文件提取到单独的集合中。我想了解我的解决方案是否有缺陷，如果没有，我想了解如何在一个压缩文件中处理不同的文件。

浏览 0提问于2018-05-13得票数 0

回答已采纳

1回答

从文本中提取推文ID

bash、twitter、tweets

我有一个很大的4.5M+行CSV (逗号是分隔符)，其中包含tweet。CSV来自一段时间以前，在列数据、字符等中有各种各样的换行。它在某些方面可能是畸形的，但对于我来说，很难准确地分辨这种大小的文件的位置和方式。我想把这个CSV文件作为一大段文本移动，提取所有的Tweet ID，并将每个提取的ID放入一个新文件的一行中。通过bash、perl、Python可以很好地实现这一点。这里有人能帮上忙吗？我甚至找不到推特ID的参数信息，尽管这个语料库中的参数似乎都是17个整数。

浏览 0提问于2018-03-13得票数 0

1回答

在一个HTML标记中嵌套的整个网站破坏Python刮板

python、html、web-scraping、insert、tags

我正在尝试创建一个Python，它从互联网上获取数据并将其转换为表，然后作为.csv文件导出。我正在尝试让这个程序工作的示例网站是：我本来打算使用BeautifulSoup库来实现这一点，但当我意识到感兴趣的网页的整个文本都嵌套在一个标记中时，我就撞到了墙上，如下面的图片所示。有没有人知道我可以从这个HTML文本块中提取特定的单词和值？例如，我想创建7列。当我使用findAll函数在文本中找到这些列标题时，打印结果时会返回整个文本块，因为所有文本都是在一个<p></p>标记之间连接的。一个假设是在代码行之间添加HTML标记，然后使用Python进行访问，但我不知道这

浏览 4提问于2021-12-24得票数 2

1回答

Python csv -匹配特定的行和列，并通过管道连接到新文件

python、csv

我有一个很大的csv文件，其中包含大约1000个人(行)的大约170列的数字数据(列)。我想要做的是将csv文件中特定案例的特定值通过管道传输到文本文件中。更具体地说，我的csv文件以一列ID号(案例)开头，大约170列包含每个案例的各种数字数据点。我希望遍历csv文件并提取"CASE156“(作为示例)的第17列(作为示例)，并将该位置的数据保存为： CASE156_column_17.txt 为了开始读取数据，我使用Python csv内置函数： f =csv.reader(open('genotypes.csv','rbU')) 我试过了 row

浏览 2提问于2013-01-03得票数 0

回答已采纳

1回答

编辑“文本连接”路径

excel、vba

我有一个Excel文件，它通过“连接”菜单从多个CSV文件中提取数据。我遇到的问题是，我需要能够从VBA内部更改CSV文件的路径。在反复使用(这几乎是个糟糕的词)之后，我遇到了一些解决方案，但它们涉及的是SQL连接，而不是文本连接。由于文件是CSV，Excel使其成为文本连接，因此没有任何ODBC连接字符串需要修改(我试图从VBA修改它时出错)。我还挖掘了MSDN文档，但没有结果。有谁知道在Excel中从VBA中更改“文本”连接路径的方法吗？而且，由于我正在讨论这个主题，相对于完整的文件路径(例如"\data\some_report.csv“而不是"c:\somedir\

浏览 2提问于2015-09-07得票数 2

回答已采纳

1回答

如何根据csv文件条目的数量动态创建tkinter按钮？

python、csv、tkinter

我正在制作一个应用程序，将自动添加文本到您的剪贴板。为了使其更具动态性，我试图将复制的文本放在CSV文件中。到目前为止，我已经设法使CSV文件导入并从中提取数据，但是，当我尝试将测试添加到剪贴板时，我只从最后一个按钮获得文本。这是我的CSV文件(script.csv) idnum,name,script 0,testone,This is a test 1,testtwo,I hope it works 2,testthree,This better work 3,testfour,Please work 下面是我的python程序 from tkinter import * import

浏览 0提问于2018-11-07得票数 0

回答已采纳

1回答

BeautifulSoup :从html标记中提取/解析数据

python、xml、parsing、beautifulsoup

我试图使用Python代码中的Beautiful从url中提取体育数据。这个数据源的问题是数据出现在html标记中。具体来说，这个标签的标题是"“ 我要的是玩家数据--这些数据似乎是XML格式的。然而，这些数据出现在"match“标记中，而不是作为开始/结束标记中的内容出现。就像这样： print(soup.match) 返回：(不包括所有文本)： <match :matchdata='{"match":{"id":"5dbb8e20-6f37-11eb-924a-1f6b8ad68.....ALL DATA HERE..

浏览 5提问于2021-04-08得票数 0

回答已采纳

1回答

雪花CSV双引号上传

python、sql、csv、snowflake-cloud-data-platform

我正在使用Python完成将信息批量加载到雪花中的工作。我使用熊猫从源系统中提取数据并加载到csv中。将数据复制到雪花时会出现此问题。我收到以下错误： snowflake.connector.errors.ProgrammingError: 100065 (22000): Found character '4' instead of field delimiter ',' 该字段挂在包含在字段中的下列文本上。 "[**EXTERNAL**]: BID: ""4597290 - PERSONNE" 正如你所看到的，在4597290

浏览 2提问于2021-03-09得票数 2

回答已采纳

2回答

从HDFS中存储的文档中提取数据以进行弹性搜索索引

hadoop、elasticsearch、full-text-search、elasticsearch-hadoop

我有一个HDFS档案来存储各种文件，如pdf，ms文件，ppt，csv等。我想建立一个使用elasticsearch搜索文件或文本内容的平台。我知道我可以使用 ES -hadoop插件来索引从HDFS到ES的数据。我想知道从存储在HDFS中的文档中提取文本数据和索引的最佳方法。任何帮助都将不胜感激。

浏览 0提问于2016-04-05得票数 0

回答已采纳

1回答

如何处理csv文件中丢失的数据？

python、python-3.x

我试图从标准普尔中提取数据，我得到了这个错误。 FileNotFoundError:文件b‘s& does /lmt.csv’现在不存在--这是由以下错误引起的:RemoteDataError(无法读取URL：{0}'.format(url)) pandas_datareader._utils.RemoteDataError:无法读取URL：为了避免这个错误，我尝试并接受了这个错误。但现在我的下一步是从csv文件中提取金融数据。如何运行Python并跳过这些丢失的文件？

浏览 4提问于2017-09-17得票数 0

回答已采纳

1回答

重定向C#标准输出并使用Python读取它

c#、python、stream、stdout

我正在尝试重定向我用C#编写的命令行项目的标准输出，并读取Python文件中的数据。目前，C#应用程序将从传感器读取的数据写入CSV文件。我必须稍后运行Python文件来获取和处理数据(必须在Python中完成，数据收集必须在.NET中完成才能使用SDK)。我希望能够同时运行C#和Python项目，并将数据流直接从C#传输到Python项目，而无需使用中间的本地文件( CSV)。我已经在SO和MSDN文档中进行了自己的搜索。我正在考虑使用来重定向C#应用程序的控制台输出。我还不知道如何从Python文件中提取这个Stream中的数据。在更好地理解如何处理它方面很有帮助，但我仍然被卡住了

浏览 25提问于2016-08-03得票数 1

回答已采纳