尝试从python中解析的文本代码创建两个CSV文件_无法在visual studio代码中从python创建csv文件。_从xml文件中的标记文本创建字典(python) - 腾讯云开发者社区

、、、

(Python3.5)我试图将一个大型用户review.json文件(1.3gb)解析为python并转换为一个.csv文件。我已经尝试寻找一个简单的转换工具在线，其中大多数接受的文件大小最大为1Mb或是超级昂贵。由于我对python相当陌生，我想我会问两个问题。这样做是否可能/有效，还是我应该寻找另一种方法？我尝试了下面的代码，它只读取并编写了我的.json文档中的342行，然后返回一个错误。块引号文件"C:\Anaconda3\lib\json__init__.py"，第319行，在加载返回_default_decoder.decode(s)

浏览 2提问于2016-09-21得票数 0

回答已采纳

1回答

如何迭代csv行以使用pandas从URLS中提取文本

、、

我有一堆新闻文章的csv，我希望使用newspaper3k包从这些文章中提取正文文本，并将它们保存为txt文件。我想创建一个遍历csv中每一行的脚本，提取URL，从URL中提取文本，然后将其保存为一个唯一命名的txt文件。有人知道我会怎么做吗？我是一名刚接触Python的记者，如果这太直接了，很抱歉。我只有下面的代码。在弄清楚如何将每个正文文本保存为txt文件之前，我认为应该尝试让脚本打印csv中每一行的文本。 import newspaper as newspaper from newspaper import Article import sys as sys import panda

浏览 10提问于2019-02-07得票数 0

回答已采纳

2回答

requests.get()所做的事情与我在浏览器中粘贴url时所做的事情不同

在Python 3.7上-我正在尝试从本地服务器下载文件。当我将url粘贴到浏览器中时，它会很好地下载文件。但是，当我尝试以下操作时： import requests url = 'url_for_local_download' r = requests.get(url, allow_redirects=True) open('test.csv', 'wb').write(r.content) 运行代码并创建test.csv，但是它充满了无意义的符号，而不是一个整洁的表，其中包含列中的数字值。你知道这里出了什么问题吗？

浏览 0提问于2019-07-15得票数 0

1回答

将带有破折号的列表转换为数字

我从CSV文件中做了一个列表。它看起来是这样的： ['18', '29', '0'...'0', '-14', '9'] 它的开头有一个文本元素，我把它弹出来了。现在，Python不能像正确的数字那样处理列表元素。例如，每当我尝试将元素解析为浮点数时，我都会收到错误消息： ValueError: could not convert string to float: - 我的代码如下所示： list2=[[float(column) for column in row] for row in list

浏览 4提问于2012-06-30得票数 1

回答已采纳

3回答

CSV文件创建问题

、、、

我使用以下几行代码从python脚本创建csv文件： def createFile(): logfile = csv.writer(open('logfile.csv', 'wb'), dialect='excel') formater = zip(dates, hours, threadids, loglevels, errorcodes, errormessage) for i in formater: logfile.writerow(i) 在我用Excel打开文件之前，一切都很正常，因为它会在一列中

浏览 0提问于2012-05-15得票数 1

回答已采纳

2回答

使用Scopus API检索特定作者的摘要？

、、

我对python比较陌生。我正在尝试使用scopus api创建一个csv文件，其中包含来自某个特定作者的所有摘要的文本。任何关于在哪里寻找示例代码的指导都将不胜感激！我找不到关于如何在python上使用<code>C0</code>的文档。

浏览 38提问于2020-03-14得票数 0

1回答

Gutenberg项目的read_csv错误标记文本

、

我正在尝试使用的一本书来创建。如果我选择朱勒·凡尔纳的书“”并下载纯文本UTF-8文件，我在使用read_csv时会从熊猫那里得到一个错误。这是我正在使用的代码： from wordcloud import WordCloud, STOPWORDS import matplotlib.pyplot as plt import pandas as pd df = pd.read_csv('pg18857.txt',delimiter=' ') 我收到以下错误消息： pandas.errors.ParserError:错误标记数据。C错误:第176行中

浏览 0提问于2019-02-18得票数 1

回答已采纳

7回答

如何从CSV文件导入数据并将其存储在变量中？

、、、、

我对python 3非常陌生，我在这里学习。我想有人可以帮我解决一个基本问题:如何将CSV文件中的文本作为变量存储在代码的后面。因此，这里的想法是将CSV文件导入python解释器： import csv with open('some.csv', 'rb') as f: reader = csv.reader(f) for row in reader: ... 然后从该文件中提取文本并将其存储为变量(即w = ["csv file text"])，然后在代码中稍后使用以创建排列： print (list(iter

浏览 11提问于2014-05-28得票数 2

回答已采纳

1回答

使用CLI对输入运行Python脚本以生成输出

、、

我很难理解如何使用CLI命令在输入文件参数上运行Python脚本来生成输出文件。据我所知，analysis.py是python脚本，-s和-p是变量名，分别包含来自Sales.csv和Products.csv的csv数据。在analysis.py中，我如何接受存储在-s和-p中的两个CSV，然后创建一个名为SalesReport.csv的输出？我是否会创建一个名为SalesReport.csv的空白csv文件，然后将分析过的数据写入该文件？或者命令行会使用存储在sales-report变量中的数据为我创建一个SalesReport.csv文件。 python analysis.py -s Sa

浏览 2提问于2019-07-20得票数 0

回答已采纳

3回答

Python:如何从混合内容的文本文件中提取浮点数？

、、

我有一个以制表符分隔的文本文件，其中包含以下数据： ahi1 b/se ahi test -2.435953 1.218364 ahi2 b/se ahi test -2.001858 1.303935 我想将这两个浮点数提取到一个单独的csv文件中，该文件有两列，即。 -2.435953 1.218264 -2.001858 1.303935 目前我的黑客尝试是： import csv from itertools import islice results = csv.reader(open('

浏览 0提问于2012-06-19得票数 3

回答已采纳

2回答

使用pyspark将两个csv文件连接到键值rdd中

、、、

我正在尝试使用pyspark将两个没有共同之处(没有键是公共的)的csv文件组合成一个键值成对的rdd 让我们假设A.csv有 a b c 而B.csv有 1 2 3 在pyspark中有没有一个选项可以通过连接这两个来获得一个rdd，就像这样 a:1 b:2 c:3 当然，两个csv文件中的行数应该匹配。这是在pyspark中很容易做的事情，还是应该首先在常规的python中完成。也就是说，对这两个文件进行嵌套循环，然后创建一个元组元组，如((a,1)，(b,2)...)然后将其传递给parallelize。

浏览 13提问于2019-12-17得票数 0

1回答

用Python读写固定格式(MODFLOW)文本文件

、、、、

我正在尝试使用python来读取、操作和编写文本文件。这些文件包含数字矩阵，是从名为MODFLOW的FORTRAN地下水流代码生成的，具有不寻常的形状，因为矩阵行被分割成几个文件行，因此每行不超过7个值。因此，一个包含37列的矩阵行输出为7值的5行(fmt='%14.6E')，后面是1行的2个值。然后，下一个矩阵行从新行开始。我试图读取两个这样的文件，每个文件有730个时间步骤x49行x37列(大约18 Mb)。然后，我想将数据按元素相乘，并将结果写入一个格式相同的新文件中。我可以用csv.reader和numpy.savetext逐行完成，但速度非常慢。我怎样才能用更快的

浏览 0提问于2015-02-24得票数 0

回答已采纳

1回答

在尝试使用read_csv w/ to _sql将行附加到SQL表时，熊猫解析由于列中的额外逗号而导致的错误

、、、

我正在尝试用.csv文件中的任何新行更新数据库中的一个表，该文件只包含两个列，以逗号作为分隔符。然而，每一列都包含许多额外的逗号(以及双引号、单引号、空格等)。这两列都是数据类型文本。以下是每一栏中的文本类型的示例：第1列(命名:文件名)注释:在整个文本中出现以下情况：，(逗号)，“”(连续双引号)，‘’(连续单引号) DOH_cumulative_text_filesSwimming PoolsSpas_52-60-1632726_6西岸海滩Cottages_13354海湾Boulevard_Madeira Beach_20181219_Inspection.69.pdf.txt 佛罗

浏览 0提问于2019-01-29得票数 0

3回答

一个文本文件到CSV转换中的Pythonic多个文本表

、、、

我仍然在学习python，我想知道用哪一种pythonic方式(也就是更少)来编写下面的问题。由于20世纪90年代技术的奇迹，每天都会有一个带有csv表的文本文件转储到服务器上。这是对的-一个文本文件和两个csv表。目标:解析csv表并使它们成为两个不同的csv文件。文件如下所示： start of file blah blah blah blah blah blah +-------- ,tbl1, tbl1, +-------- ,data, data, ,data, data, ..... ,data,data +-------- blah blah blah blah blah

浏览 2提问于2014-04-16得票数 0

回答已采纳

2回答

查找文本中的字符

、、、

我想创建一个python脚本来查找文本中的表达式。如果成功，则打印“找到表达式”。我的文本文件名为"file_id_ascii"；它来自名为"clinical_file_link“的链接。 import csv import sys import io file_id_ascii = io.open(clinical_file_link, 'r', encoding='us-ascii', errors='ignore') acc = 'http://tcga.n

浏览 0提问于2016-10-13得票数 0

1回答

获取“FileNotFoundError”

、

我刚接触Python，目前正在在线学习如何使用Python进行数据分析和可视化。我已经学习了Python基础知识课程，现在我将进入下一步。我一直在努力学习一堂题为“阅读和编写文本文件”的课程中的代码。我正在尝试从csv文件构建数据帧，但我一直收到'FileNotFoundError‘。我已将csv文件保存在c驱动器的名为Python Examples的文件夹中，但python找不到该文档。在Jupyter Notebook中，我甚至尝试在代码中输入正确的文件路径，但出现了一个不同的错误，一个'Unicode‘错误。这是我尝试过的： import numpy as np i

浏览 20提问于2020-08-10得票数 0

1回答

从.txt文件中提取文件目录？

、、

我有一个名为testConfigFile的文本文件，如下所示： inputCsvFile = BIN+"/testing.csv" description = "testing" 其中BIN是我的文件夹的父目录(已经在我的python脚本中使用os.getcwd声明了)。我现在面临的问题是，如何从testConfigFile.txt中读取和提取BIN+"testing.csv"。由于名称testing.csv可能会更改为其他名称，因此它将是一个变量。我计划这样做，首先脚本读取关键字"inputCsvFile = "，然后它会

浏览 23提问于2020-07-22得票数 0

回答已采纳

1回答

如何在PhpMyAdmin中组织CSV的Twitter数据

、、、

我正在开发一个应用程序，在这个应用程序中，我需要在MySQL数据库中存储一个Tweet集合以及诸如tweets、Tweet日期、语言和用户名等属性。这是我想要的图像：为此，我在python中创建了一个程序，该程序可以在Twitter上以JSON文件的形式收集100+ tweet。然后，我使用Microsoft将JSON文件转换为CSV文件。在此之后，我将CSV文件作为一个表导入到PHPMyAdmin中，得到了以下结果： (10行x185列)。上面的问题是，一些tweet有更多的数据，如媒体，这导致数据扩展到多列。我如何快速地清理这个表，使我只在表中有我想要的属性？我需要重新抓取Pyt

浏览 3提问于2017-11-15得票数 0

回答已采纳

1回答

从html中的列中提取多种类型的文本。

、、、、

我是Python新手，我正在尝试从html页面中提取数据。表中有一列是文本和URL的混合。我想从该列中提取所有信息，并保持指向csv文件的链接不变(稍后我会将其保存为Excel文件)。请给我提个建议。下面是我仅提取文本的代码。 trs = soup.find_all('tr') for tr in trs: tds = tr.find_all("td") try: RS_id = str(tds[5].get_text().encode('utf-8')) 列中的几个单元格有多个URL，我希望它们保持不变。

浏览 0提问于2014-07-08得票数 0

1回答

解析文件夹中的多个xml文件

、、

我是个新手，正在学习Python。我正在处理文件夹中的XML文件(5754个文件)。使用os模块，我可以毫无问题地打印所有的文件名。我可以解析一个文件并写入CSV文件，而不会出现任何问题。我在尝试解析文件夹中的所有文件时遇到问题。请帮帮忙，谢谢。代码片段和下面的所有代码。此命令运行良好，可打印所有5754个文件名 import os for path, dirs, files in os.walk(r"C:\Users\dan\Desktop\parse"): for f in files: clinical = os.path.join(path,

浏览 4提问于2020-01-09得票数 0

1回答

尝试创建文本时的断言错误(python，StanfordNLP)

、、

我想将文本放在数据框架的一列中。我的脚本似乎可以使用一个简短的测试数据框架，但是每次我试图在实际的项目文件上运行它时，我都会得到一个断言错误。我认为这可能与案文的篇幅有关，但我不知道如何处理。我的代码： import pandas as pd import stanfordnlp nlp = stanfordnlp.Pipeline(lang = "en", processors='tokenize,mwt,pos,lemma') def lemmatize(text): '''lemmatize'''

浏览 1提问于2019-11-15得票数 0

1回答

Python将组写入Coloumns

我已经成功地创建了一个文本文件的值，我需要写到csv或xlsx。是否存在向两列写入值对的问题，我的文本文件目前包含的数据如下： 1 2 3 4 5 6 7 8 因此，我需要这样写导出： A B 1 2 3 4 5 6 7 8 我知道如何使用代码中指定的列表来实现这一点，但是我的文本文件是前面函数的输出，包含了我需要分离成两个关联列的数千个值。目前我被困在 text = r"D:\Python\centers.txt" csv = r"D:\Python\centers.csv" with open(text) as text_file:

浏览 0提问于2017-06-27得票数 0

回答已采纳

1回答

如何使由Python中的openpyxl创建的Excel工作表中的单元格成为“可格式化的”？

、

我正在尝试使用openpyxl库(参见https://openpyxl.readthedocs.io/)来创建一些基本的Excel类型的文件，以便在Excel和Planmaker (来自Softmaker FreeOffice 2018)中使用。我使用的代码与openpyxl库网站上显示的代码基本相同，即： from openpyxl import Workbook import csv Excel_file = "Test.xlsx" csv_file = "test.csv" # ---- wb = Workbook() ws = wb.acti

浏览 51提问于2019-12-26得票数 0

6回答

Ruby:无法在OS X中解析导出为CSV的Excel文件

、、

我正在使用Ruby的CSV库来解析一些CSV。我有一个看似格式良好的CSV文件，它是我通过将Excel文件导出为CSV而创建的。但是，CSV.open(filename, 'r')会导致CSV::IllegalFormatError。文件中没有恶意的逗号或引号，我也看不到任何其他可能导致问题的东西。我怀疑问题可能与行尾有关。我能够通过文本编辑器(Aquamacs)解析手动输入的数据。只是当我尝试从Excel (适用于OS X)导出数据时，才出现问题。当我在vim中打开导出的CSV时，所有的文本都显示在一行中，^M出现在行间。从文档中看，您似乎可以为open提供一个行分隔

浏览 0提问于2009-10-10得票数 11

回答已采纳

1回答

CSV文件转到JSON，然后返回到CSV

、、

我正在尝试创建一个将读取CSV文件并创建一个JSON文件的页面。我需要json中的两列。CSV包含15,000至30,000行。我需要JSON的最大行数为10,000行，然后我将根据API检查JSON。结果必须从原始文件中获取值，然后将其写入一个包含所有列的新CSV文件中。 CSV文件如下所示： number,"surname","forename","emailAddress","taxIdentifier" 101719008,"John","smith","smith@hotmail.

浏览 7提问于2022-06-22得票数 0

1回答

将数据值从Python转换为C

、、、

对于这个项目，我正在使用libsvm。我有一个python文件，它能够输出一个特征向量列表，我有一个C可执行文件，它接受2个csv文件、一个特征向量列表和svm模型，作为参数并以csv文件的形式输出预测。现在，我想更改C文件，以便它将python文件的列表输出作为其输入参数来进行预测。这是因为我必须实时运行python代码和C。因此，如果我必须用python写入csv文件并以C语言读取该文件，则延迟将是一个问题。我已经尝试过搜索诸如cython、子处理模块和and解析之类的东西。然而，它们似乎用于在C中执行Python函数，而在Python中执行C中的Python函数。有人能帮助理解如何

浏览 1提问于2018-06-29得票数 0

回答已采纳

1回答

使用python脚本为C代码生成头文件

、

我试图使用pyhton脚本为C代码生成一个头文件。我想从csv文件中读取一些变量，这是因为我不能在c代码中使用库，所以我无法从c代码中读取csv文件。我需要开发python脚本，以便为这个C代码创建一种简单的输入列表。有什么建议吗？

浏览 5提问于2022-11-29得票数 0

2回答

同日期和单元格

、

我是一个完全的新手在这个Python和朱庇特笔记本的东西。我正在选修Python入门课程，并被分配了一项任务。这是从.csv文件中提取信息。下面是我的.csv文件的快照，名为"feeds1.csv“ 我可以将.csv导入到朱庇特笔记本中，并尝试使用groupby函数对其进行排序。但是，由于列中也有时间，它将无法工作。 import pandas as pd df = pd.read_csv("feeds1.csv") 我需要它输出如下：最终目标是用这些累积的数据创建一个csv文件，并使用它绘制一个图表，

浏览 2提问于2019-10-13得票数 0

回答已采纳

2回答

在JSP中解析CSV文件

、、

我正在创建一个webApp，它将从雅虎财经下载一些数据到一个CSV文件，然后(希望)能够读取创建的CSV数据到一个超文本标记语言表格。我已经成功地让程序连接到Yahoo feed，然后将数据下载到CSV文件中，而不想使用该文件中的数据到表中。下面是我用来创建CSV文件的代码： String ticker = request.getParameter("stockSym"); URL url = new URL("http://finance.yahoo.com/d/quotes.csv?s=" + ticker + "&f=a

浏览 0提问于2010-10-25得票数 0

1回答

循环访问网站链接中的多个json文件。

、、

我使用python从因特网链接中获取json文件中的信息，并将我想要的部分保存在csv中。我的代码适用于一个文件，但是有多个文件(我有不同的链接)。json文件是完全相同的格式(数据来自体育比赛在联赛I教练)。我的代码如下所示： import csv import json import pandas as pd import requests website = 'https://www.diferentwebsites.json' r = requests.get(website) contents = r.json() 然后我从json中获取一些元素并将其保存为csv

浏览 3提问于2020-08-12得票数 1

回答已采纳

1回答

保留csv数据的断线

、、

我使用kirby和一些php来从csv文件的数据生成一个文本文件。在我的csv文件的数据中，有几个段落对文本进行了换行符。我需要将这些换行符保留到生成的文本文件中。这是代码 <?php function csv(string $file, string $delimiter = ','): array{ $lines = file($file); $lines[0] = str_replace("\xEF\xBB\xBF", '', $lines[0]); $csv = array_map(functio

浏览 4提问于2020-10-05得票数 1

回答已采纳

1回答

读取CSV，如果文本匹配，则打开具有匹配文件名的html文件，并在文本中复制。

、、

好吧，我想我只是错过了连接器，我对python非常陌生。目标:阅读CSV 读取目录中的所有文件名如果索引(X)处的一行=目录中的文件名，则打开HTML文件，用HTML文件中的文本替换索引(X)处的文本目前为止的代码： import fileinput import csv import os import sys import glob from bs4 import BeautifulSoup htmlfiles_path = "c:\\somedirectory\\" #path to directory containing the html files fil

浏览 3提问于2019-11-13得票数 3

回答已采纳

1回答

os.walk()来匹配CSV文件中的文件内容

、、、、

我有两个词要搜索使用CSV文件，这是使用os.walk()方法递归地查看rootDir中的每个文件，但是不太确定我缺少什么来完成我的代码。我要找的两个词是在两个单独的文件中： XZOXNEOXXTWX, YOEYTWOYZYNY 首先，我创建了一个csv来查找特定的单词，然后创建了os.walk()方法，并尝试从CSV文件中读取文本以输出匹配的内容。我已经看了相当一部分的材料，但我希望它不符合我想要输出的东西。 appendData = [] mPath = r"C:\Users\test\Documents\test" wordstoSearch = r"C:

浏览 0提问于2018-03-29得票数 0

回答已采纳

8回答

python打开文本文件时，每个字符之间都有一个空格。

、、

每当我尝试使用python命令打开.csv文件时，它总是在每个字符之间使用空格打开文件。我猜这是文本文件出了问题，因为我可以用相同的命令打开其他文本文件，并且正确加载它们。有人知道为什么在python中会加载这样的文本文件吗？谢谢。更新好吧，我是在Jarret的帖子的帮助下得到的这是我用来将文件转换为ascii的代码。 fread = open('input.csv', 'rb').read() mytext = fread.decode('utf-16') mytext = mytext.encode('ascii',

浏览 6提问于2009-03-02得票数 21

回答已采纳

1回答

如何将excel-sheet单元格(使用ID- number )与文本文件中的数字匹配，然后提取并保存id和标签为csv的文本。

、、、、

首先，谢谢你抽出时间来帮助我！目前，我正在使用python解决机器学习问题，在这个问题上，我必须在一个大文本文件中提取几个特定的部分，以训练分类算法。然后，文本必须保存在CSV格式与其相应的ID-num和标签/类别从一个excel表。 CSV文件应该如下所示： excel工作表包含许多列，其中只应使用ID、number和label列。在这里，您可以看到一些excel表： IDNUM列是将excel工作表连接到特定文本的ID号。AType1列是相应的标签，也必须保存。在这里您可以看到一些文本文件：应该提取的文本来自单词：“到有两个"*" (星星)”，它们以两行的形式紧跟在

浏览 2提问于2020-04-21得票数 0

1回答

将.TTL文件与CSV文件进行比较，并将“相似”结果提取为新文件。

、、、、

我有一个很大的CSV文件，其中填充了数以百万计的不同行，每个行的格式如下： /resource/example 现在，我还有一个.TTL文件，其中每一行可能都有完全相同的文本。现在，我希望将包含与当前CSV文件相同文本的.TTL文件中的每一行提取为一个新的CSV文件。我认为使用grep是可能的，但这是一个linux命令，我对此非常非常缺乏经验。在Windows中可以这样做吗？我可以编写一个Python脚本来比较这两个文件，但由于这两个文件都包含数百万行代码，因此我认为执行起来需要几天时间。有人能为我指出正确的方向吗？谢谢！) 编辑： .TTL文件中的示例行： <nl.dbpedia.

浏览 1提问于2018-03-20得票数 1

回答已采纳

1回答

在python中读取文本文件时，是否删除重复的字符行？

、、

我正在读取从CSV文件复制的文本文件。当我用python读取这个文件时，我得到了大量不必要的重复行，如下所示。如何去除这三行不需要的行，包括每个文本开头和结尾的\cf0和\cell\row？或者我应该直接从csv文件本身读取文本？文本仅位于CSV文件的其中一列中。 \itap1\trowd \taflags1 \trgaph108\trleft-108 \trbrdrl\brdrnil \trbrdrr\brdrnil \clvertalc \clshdrawnil \clbrdrt\brdrs\brdrw20\brdrcf2 \clbrdrl\brdrs\brdrw20\brdrcf2

浏览 2提问于2014-01-10得票数 0

2回答

Python搜索和抓取

、、

我有一个问题，我想知道是否值得花时间尝试用Python来解决。我有一个很大的CSV文件，里面有鱼类的科学名称。我想交叉引用该CSV文件与一个大型数据库的鱼形态信息(www.fishbase.ca)，并有代码返回最大长度的每条鱼。基本上，我需要创建代码来搜索每条鱼的fishbase网站，然后在页面上找到最大长度的信息并在CSV文件中返回给我。后两个部分相对简单，但第一部分是我陷入困境的地方。提前谢谢。

浏览 4提问于2015-01-19得票数 0

回答已采纳

2回答

Tensorflow CSV解码错误

、、

我使用的是TensorFlow 0.10.0rc0。我在Ubuntu 14.04上的CUDA驱动版本是7.5，CUDNN是4。我有一个简单的CSV文件，它只有一行，如下所示： "field with newline",0 在Ubuntu上的VIM中，通过按enter键添加了换行符。我可以使用read_csv函数在pandas中读取这个文件，其中的文本字段显示为包含一个\n字符。但是当我尝试在TensorFlow中读取它时，我得到了以下错误： tensorflow.python.framework.errors.InvalidArgumentError: Quoted fie

浏览 10提问于2016-08-17得票数 1

2回答

如何在平面文件(CSV、TSV等)中发现文本限定符？

、、、

我们接收许多不同格式的文件- CSV、TSV或其他使用更具异国情调的分隔符(|，；等)的平面文件。这些文件也可以使用文本限定符，同样是一系列的格式(每个限定的字段与只包含分隔符限定的字段，使用的不同字符，等等)。我已经编写了一个工具，它能够使用频率分析技术成功地识别文件中的分隔符，这与这里提到的Python sniffer类类似：我现在正在尝试扩展该工具以支持文本限定文件。这里的困难在于，频率分析不足以识别文本限定符，因为许多形式的CSV只会用文本限定符包装包含分隔符的字段，因此例如，一个10k行的文件在整个文件中可能只有两次文本限定符。我目前的方法是扫描文件，查找分隔符-文本限定符对(

浏览 1提问于2013-05-28得票数 0

回答已采纳

1回答

在python中从属性文件读取文件名

我正在使用DictWriter从文本文件读取和写入CSV。现在，我想为几个文本文件实现相同的代码，并写入不同的CSV文件。为此，我想使用properties.py文件，如下所示： input1 = "file1.txt" output1 = "mycsv1.csv" input2 = "file2.txt" output2 = "mycsv2.csv" 诸若此类。我尝试使用导入和链接中指定的其他方法，如"what would be a quick way to read a property file in

浏览 9提问于2019-09-26得票数 1

2回答

如何在CPLEX的Python中导入CSV文件

、、、、

我想导入这个文件。CPLEX在Python中支持这种格式吗？我将文本文件转换为CSV文件，然后编写了这个代码cplex.read("scp61.csv")，但我得到了这个错误"CPLEX Error 1436: Max or Min missing."。文本文件中没有任何Max或Min word。

浏览 7提问于2021-01-31得票数 0

回答已采纳

1回答

在将数据插入到synapse表中时，数据类型会自动转换为来自Varchar的文本

、、

我尝试使用python代码将数据从csv插入synapse表中，但是当代码尝试创建表时，它会自动将字符串类型转换为文本。以下是用于连接数据库以及在表中创建或插入数据的代码 params=parse.quote_plus("connection string") engine=sqlalchemy.create_engine("mssql+pyodbc:///?odbc_connect=%s" %params,echo=True,connect_args={'automcommit':True}) wrt_df.to_sql(tbl_na

浏览 31提问于2021-05-01得票数 0

1回答

在<TEXT>和</ text >之间搜索列表细文本

、、

这是一个已处理的html文件，在python列表变量中。它也有一些换行符，所以文本是多行的。列表没有被标记。在边角括号(html标记)中有多组"TEXT“和"/TEXT”。我想提取这些匹配对之间的文本，并将它们附加到另一个列表中。感谢专家的帮助。 with gzip.open(.....) texty = [] for i, line in enumerate(opened_file): #reading file texty.append(line.strip(' \t\n\r') 阅读后，可以加入以下内容： lines.appen

浏览 1提问于2022-04-09得票数 0

2回答

如何修复在Python中读取CSV文件时出现的错误？

、、

我有一台Windows10笔记本电脑，我正在尝试用Python读取csv文件。我已经尝试过以下代码： import pandas as pd df = pd.read_csv(‪"C:\Users\dcolu\OneDrive\Documents\tennis.csv") 我直接从文件资源管理器复制了上面的路径。我也尝试过： import pandas as pd df = pd.read_csv("tennis.csv") 并且两者仍然给我相同的错误消息:没有这样的文件或目录

浏览 71提问于2021-06-21得票数 0

1回答

如何使用Talend将单行中的两个或多个分隔列拆分为多行

、、

我正在尝试将数据从CSV文件移动到DB表。CSV文件中有两个分隔的列(用“；”分隔)。我想为匹配索引处的每个分隔值创建一行，如下所示。假设两列将包含相同数量的分隔项。 CSV输入示例： Labels Values A;B;C 1;2;3 D 4 F;G 5;6 预期输出： Labels Values A 1 B 2 C 3 D 4 E 5 F 6 我如何才能做到这一点？我尝试过使用tNormalize，但它只适用于单个列。此外，我

浏览 0提问于2016-12-01得票数 0

2回答

如何根据python中两个不同CSV文件中的空值分离数据

、、、、

我是python开发的新手，并且我试图基于空值将csv文件分为两个不同的文本文件。我的csv文件的数据如下和我的csv文件包含四个字段工具，卡车、司机和执照卡车，司机有一些空值--我想为卡车值为null的行值创建两个单独的文件，而另一个文件将包含驱动器值为null的信息。我尝试了以下代码，但它没有消除空值，它在文本文件中显示0或空格。 License = pd.read_csv("E:\ActiveCityLicenses.csv") a=License.isnull().sum() print(a) print(L

浏览 1提问于2019-11-13得票数 0

回答已采纳

4回答

用于从CSV文件中删除列的Shell脚本命令

、

我正在尝试从csv文件中删除一列(我从预处理中获得此变量)。我查看了提供的示例，并尝试了以下方法 cut -d ',' -f 2 X.csv > Y.csv 上述命令无济于事-将X.csv中的第2列复制到Y.csv 我希望将第二列与分隔符一起删除例如： name,place,animal a,chicago,python b,new york,squirrel 使用cut命令后，文件应如下所示 name,animal a,python b,squirrel

浏览 53提问于2019-02-25得票数 1

回答已采纳

2回答

Excel无法打开Python生成的CSV文件

、、、

我有许多输出CSV文件的Python脚本。有时在Excel中打开这些文件会很方便。安装OS X Mavericks后，Excel不再正确打开这些文件: Excel不会解析这些文件，它会复制文件中的行，直到内存耗尽。具体地说，当Excel尝试打开该文件时，会出现一个提示：“文件未完全加载”。我用来生成CSV文件的代码示例： import csv with open('csv_test.csv', 'wb') as f: writer = csv.writer(f) writer.writerow([1,2,3]) writer.write

浏览 0提问于2013-10-27得票数 3

1回答

Perl机械化内容的逐行解析

、

创建perl来自动从各个账单网站下载CSV，但是我很难将$mech->content()中的数据转换成某种原因，我可以逐行解析CSV。内容是一个多行CSV文件， #!/usr/bin/perl use WWW::Mechanize; use IO::Socket::SSL qw(); my $mech = WWW::Mechanize->new(); ...stuff... my $data=$mech->content(); my (@lines)=split(/\n?\r/,$data); print "lines=".@lines."\n---

浏览 0提问于2016-10-28得票数 1

回答已采纳