腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
pandas
数据
帧
中
的
匹配
文本
python
、
python-3.x
、
pandas
我
的
数据
框看起来像- id text2 don't call me.I am bzy.我
的
最终
数据
框看起来像- id text results 1 i am interested
浏览 7
提问于2020-07-16
得票数 0
1
回答
Pandas
在合并两个
数据
帧
和某些列
的
值时不会继续
python
、
pandas
、
merge
、
left-join
、
nan
我尝试在
pandas
中使用left merge在公共列上将两个
数据
帧
组合在一起,只有当我这样做时,我合并
的
数据
不会继续,而是提供NaN值。所有的列都是对象,并以这种方式
匹配
,所以我不太确定发生了什么。 这是我
的
第一个dateframe头文件,它是程序
的
输出 ? 这是我
的
第二个
数据
帧
头。第二个df是一个“关键”文档,用于将第一个输出与其正确
的
id/品味/等
浏览 18
提问于2020-11-06
得票数 0
0
回答
无法将excel行与
pandas
dataframe行数
匹配
python
、
python-3.x
、
pandas
、
unicode
我尝试对文件
中
的
Unicode字符进行编码,并将其传递到
pandas
数据
帧
中
。但是,我在Jupyter notebook中使用df.column.value_counts()获得
的
唯一行数与同一文件
的
excel行数不
匹配
(在删除重复值之后)。 我如何解决这个问题?我加载了一个
文本
文件(以制表符分隔),并使用encoding = 'ISO-8859-1‘将其转换为
pandas
数据</
浏览 13
提问于2019-01-21
得票数 0
1
回答
如何在Python字典
中
存储
数据
python
我已经开发了一个脚本,其中我正在读取文件
中
的
100k行。我需要从50,000到100,000
的
数据
,在此基础上,它将搜索可用性在1到50,000行,并从线路上获取相应
的
数据
。为了做到这一点,我在for循环中打开
文本
文件来搜索
数据
,你能帮助如何在python字典
中
存储
数据
,这样脚本就不需要多次处理大
文本
文件,并最终减少时间
浏览 19
提问于2021-08-05
得票数 0
2
回答
删除
文本
文件python
中
的
列
python
、
parsing
、
text
我有以下
文本
文件,并想从文件
中
完全删除(打开,高,低)。我想留下: Date,Time,Close,Up,Down"Date","Time","Open","High","Low","Close","Up","Down" 08/09/
浏览 102
提问于2018-09-12
得票数 -4
回答已采纳
1
回答
如何在多个dataframe lambda函数上实现dask映射分区?
python
、
pandas
、
dataframe
、
multiprocessing
、
dask
我已经使用
pandas
实现了两个
数据
帧
之间
的
模糊字符串
匹配
算法。我
的
问题是如何将其转换为使用多核
的
dask操作?我
的
程序在纯python上运行大约3-4天,我想并行操作以优化时间成本。phase','new']然后,我必须根据每个字符串关联
的
数
浏览 3
提问于2018-05-19
得票数 0
2
回答
用
pandas
,如何加载多个无头
的
TXT文件?
python
、
pandas
在Python 3和
pandas
中
,我加载了几个TXT文件。它们没有标题,具有相同
的
结构- 46列,在三种情况下
的
每列示例
中
具有相同
的
信息主题<
浏览 18
提问于2018-02-21
得票数 0
回答已采纳
1
回答
将正则表达式
的
有序表与
文本
匹配
python
、
regex
、
pandas
尝试尽可能高效地将包含复杂正则表达式(大量lookahead和lookbehinds)
的
大表(1500个表达式)与包含
文本
数据
的
大型
pandas
数据
框(10亿行)进行
匹配
,并为
匹配
的
regex表达式返回一个'TextString' : ['External Test String','123 Test String','Automatic String One
浏览 28
提问于2021-07-08
得票数 0
4
回答
比较两个dataframe列
的
匹配
百分比
python
、
string
、
pandas
、
dataframe
、
compare
我想将一个列
的
数据
帧
与另一个多列
的
数据
帧
进行比较,并返回具有最大
匹配
百分比
的
列
的
标题。 我在
pandas
中
找不到任何
匹配
函数。第一个
数据
帧
第一列: carsswift wagonor jeep 第一个
数据
帧
第二列: bikesRE
浏览 41
提问于2019-06-17
得票数 5
2
回答
在
pandas
数据
帧
中
插入sklearn CountVectorizer
的
结果
python
、
pandas
、
machine-learning
、
scikit-learn
我有一堆14784个
文本
文档,我正在尝试对它们进行矢量化,这样我就可以运行一些分析。我使用sklearn
中
的
CountVectorizer将文档转换为特征向量。我这样做是通过调用:features = vectorizer.fit_transform(examples) 其中examples是所有
文本
文档
的
数组为此,我将这些特性存储在一个
pandas
数据
帧
中
。目前,我
浏览 0
提问于2016-11-02
得票数 14
2
回答
如何在一个CSV文件
中
组合
文本
和
pandas
数据
帧
python-3.x
、
pandas
我刚接触
pandas
,想知道是否有可能将
文本
和
pandas
数据
帧
组合到一个csv文件
中
。提前谢谢你。
浏览 2
提问于2020-07-11
得票数 0
1
回答
pandas
.read_csv仅在一列
中
返回无法读取
的
文本
python-3.x
、
pandas
、
encoding
我使用
的
是Python3.7.3MSCv.1915 64位(AMD64),我试图用
pandas
.read_csv创建一个
数据
帧
,我有两个问题。一方面,列数(1而不是55)和行数(19.181而不是2.272)与.xlsm文件都不
匹配
。 另一方面,标题和行只显示不可读
文本
的
值,而不显示
文本
字符串和数字(整数、浮点数)。import
pandas
as pd df = pd.read_csv(r'MyFi
浏览 19
提问于2019-08-22
得票数 0
4
回答
Python
pandas
:如何在读取Excel文件时指定
数据
类型?
python
、
pandas
、
dataframe
我正在使用
pandas
.read_excel()函数将一个excel文件导入到
pandas
数据
框
中
。其中一列是表
的
主键:全部是数字,但存储为
文本
( Excel单元格左上角
的
绿色小三角形证实了这一点)。 但是,当我将该文件导入到
pandas
数据
帧
中
时,该列被导入为浮点型。有没有办法在导入列时指定
数据
类型?我知道这在导入CSV文件时是可能
的
,但在read_excel(
浏览 971
提问于2015-09-16
得票数 102
回答已采纳
1
回答
用Cython和
Pandas
读取TXT文件
python
、
pandas
、
cython
、
cythonize
我有一个将近4 4GB
的
大型
数据
集(
文本
文件),我想使用
pandas
数据
帧
来处理这个
数据
集。我可以读入文件,但需要几分钟才能读入所有
数据
。 因此,我想使用Cython库来利用C语言
的
速度。我很难知道如何使用Cython将
文本
文件读入到
pandas
数据
帧
中
。 任何指导都会很有帮助。
浏览 23
提问于2020-11-29
得票数 1
回答已采纳
2
回答
向dask.dataframe添加dask.array列
python
、
dataframe
、
dask
我有一个dask
数据
帧
和一个dask数组,它们以相同
的
逻辑顺序具有相同
的
行数。
数据
帧
行通过字符串进行索引。我正在尝试将一个数组列添加到
数据
帧
中
。我尝试了几种方法,但都以其特定
的
方式失败了。当结构在逻辑上兼容时,将dask数组列添加到dask
数据
帧
的
正确方法是什么?
浏览 15
提问于2018-01-09
得票数 8
1
回答
用python在excel
中
创建动态列表
python
、
python-3.6
我目前有一个由国家/地区组成
的
python列表。这个列表是动态
的
,因为它基于一个单独
的
文本
文件
中
的
国家/地区列表list_countries = ['China','
浏览 3
提问于2018-07-10
得票数 0
1
回答
将
文本
从DataFrame发布到IBM PersonalityInsights API
python
、
api
、
object-storage
、
data-science-experience
、
personality-insights
我正在尝试使用IBM DataScienceExperience
中
的
对象存储将
数据
从DataFrame文件发布到Watson Personality Insights API。我已经将txt文件加载到ObjectStorage
中
并创建了一个DataFrame。工作正常。不了解如何将dataframe
中
的
数据
发布到API。提供
的
文档没有将我引向正确
的
方向。这就是我所做
的
浏览 0
提问于2017-09-10
得票数 0
1
回答
Pandas
--通过选择较短
的
文本
来解决行合并冲突
python
、
python-3.x
、
pandas
、
algorithm
、
pandas-groupby
我有一个包含两列
的
Pandas
数据
帧
: String ID (不唯一),String text。 我想构建一个包含两列
的
dataframe : String ID (唯一),String text。要使我
的
ID唯一,我需要合并所有具有
匹配
ID
的
行。但是,具有相同ID
的
行都具有不同
的
文本
内容。合并时,我希望
文本
内容最短
的
行优先。 如何做到这一点? 提前谢谢你!
浏览 20
提问于2020-07-01
得票数 0
回答已采纳
2
回答
列表
中
的
Pandas
Dataframe通配符值
regex
、
pandas
、
dataframe
如何将
数据
帧
过滤为包含在列表
中
的
值
的
行?具体地说,
数据
帧
中
的
值将只是与列表
的
部分
匹配
,而不是完全
匹配
。我尝试过使用
pandas
.DataFrame.isin,但只有在
数据
帧
中
的
值与列表
中
的
值相同时才有效。
浏览 0
提问于2019-08-17
得票数 2
1
回答
pandas
数据
帧
中
的
匹配
(fuzzywuzzy)
python
、
pandas
、
string-matching
、
fuzzy-search
、
fuzzywuzzy
来比较我用
的
名字fuzzywuzzy。fuzz.partial_ratio(row['Name'], name)) >= 50), axis=1) byname_tt [] standing_re ['mystandying_tz']myst
浏览 39
提问于2021-08-20
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
将多个Excel工作表合并到一个Pandas数据帧中
使用 Pandas resample填补时间序列数据中的空白
tcp/ip模型中,帧是第几层的数据单元?
excel表格中怎么导入来自文本中的数据
讲座:Gale Scholar中的内容发现与文本数据挖掘
热门
标签
更多标签
活动推荐
运营活动
广告
关闭
领券