嘿,我真的被困住了,我真的希望有人能帮我这个忙。我试图读取CSV文件的前5000行,用制表符分隔行,然后针对每一列和每一行搜索regex模式,并输出具有最多regex匹配/出现次数的列索引号。我会提供一个例子,以帮助更好地解释我的意思。
test.csv
john smith 1132 Anywhere Lane Hoboken NJ 10.0.0.1 07030 Jan 4
erica meyers 1234 Smith Lane Hoboken NJ 127.0.0.1 07030 March 2
erica meyers 1234 Smith Lan
我想用NaN值替换数据帧中最后的所有非NaN。我的数据框架中有300行和1068列。每一行都有不同数量的有效值,其中填充了NaNs。下面是一个行的示例:
数据中的一行= [1 2 3 NaN NaN NaN] output = [1 2 NaN NaN NaN NaN]
如何替换CSV文件中行中的最后一个非NaN值?
我有一个带有子字符串的列表,如果列表中的任何子字符串存在于CSV文件的该列中,则需要将其与CSV文件中的列进行比较。我想写那些在字符串列中没有这些子字符串的行。这个文件中有许多列,我只在一列中查找。
示例my_string列有值
{ "This is just comparison of likely tokens","what a tough thing?"}
de = ["just","not","really ", "hat"]
我只想写那一行有“什么难的事?”
如果列中只有单词,这就很好了
我一直在尝试找到此问题的解决方案,我正在从一个较大的文件创建CSV,选择特定的列,我从这里得到了极大的支持,该任务正在完成,但我的CSV文件包含我想要替换的值,例如,'User Name‘列,我只想保留1个用户,这意味着删除",“之后的所有内容。我得到了一个如下所示的正则表达式
(,.*$)|(not applicable)|(sscope)
这就是我想要用空字符串替换的内容,但我无法让它工作,它有时会删除所有内容。
User Name列中的值如下所示
User Name
B2 cell : not applicable
B3 cell : sscope, sscope
B4
Sub UpdateDMDCLCSIM()
Dim SIM_DM_DCLC As Worksheet
Dim TextFileUpdated As Date
Set SIM_DM_DCLC = ThisWorkbook.Sheets(Sheet52.Name)
TextFileUpdated = DateValue(FileDateTime("\\networkshare\dept\DCGSI\Extracts\SIM_DM_DCLC.csv"))
Application.DisplayAlerts = False
Application.StatusBar
我正在将几个csv文件读入var中,如下所示:
var myFullCsv = ReadFile(myFullCsvFilePath);
var masterCsv = ReadFile(csvFilePath);
每个csv中的一些行条目出现在两个文件中,我可以创建一个新的var,其中包含myFullCsv中存在的行,但在masterCsv中不包含行,如下所示:
var extraFilesCsv = myFullCsv.Except(masterCsv);
这很好,因为它很简单。但是,我现在希望在myFullCsv中标识行中出现一个特定字符串的行。该字符串将对应于csv数据的一列。我知道,