腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
3
回答
R
中
的
数据
清理
-
只需
从
列
中
获取
数字
r
、
data-cleaning
我已经抓取了一些汽车
数据
,没有,我想
清理
它与这些
数据
一起工作。6 Ford Fiesta \n€ 499,-\n \n55 kW (75 PS)\n \n189.137 km\n \nBenzin\n \n07/2000\n 例如,现在我想
清理
(122 PS)\n" [10] "\n98 kW (133 PS)\n" "\n74 kW (101 PS)\n" "\n75 kW (102 PS)\n" 除此之外,我只想获
浏览 16
提问于2021-05-01
得票数 0
回答已采纳
1
回答
使用正则表达式清洗熊猫
数据
python
、
python-3.x
、
pandas
、
dataframe
、
python-re
我有一个熊猫
数据
框架,我需要
清理
其中一个
列
。该
列
几乎没有可能
的
值。例如,如果它包含LC50 =1.4±0.2μM,我需要采取以下操作: 查找LC50 =if它找到了LC50 =,需要在±之前
获取
数字
(即,1.4)if查找μM、mM、µg/ml等尺度,
从
本专栏
中
删除并添加到我添加了before.How
的
新
列
中
?是否有任何资源可以使用示例代码更具体和实际地学习正则表达式和<e
浏览 2
提问于2022-09-21
得票数 -3
2
回答
只需
从
URL
中
获取
数字
javascript
、
jquery
、
url
我只想要我
的
URL
的
号码作为返回。现在我用:才能得到整个网址。但是,还有其他简单
的
解决方案可以
从
我
的
URL
中
只获得ID号吗?
浏览 1
提问于2013-10-24
得票数 3
回答已采纳
2
回答
您能为多个值使用df.str.replace()函数吗?
python-3.x
、
string
、
pandas
我使用熊猫df.str.replace()函数,并希望
从
字符串
中
删除多个字符。 我试图使用pandas
清理
CSV文件
中
的
一些事务
数据
。我有一个
列
,它将事务
的
数量存储为Object
数据
类型。在将其更改为float
数据
类型之前,我需要从大于999.99
的
数字
中
删除$字符和任何,字符。我已经能够一次做到这一点;但是,我想知道是否可以传递多个值来
清理
它。
浏览 0
提问于2019-08-25
得票数 2
回答已采纳
2
回答
熊猫:在现有的基础上创建新
列
,如果条件不匹配,返回现有
列
python
、
pandas
我有一个包含有分类值
的
列
的
数据
集。我需要标准化
列
,因为有些值被错误地编码了。例如,'1.0‘和'3.0’分别应为'01‘和'03’。但是,当值正确时,我
只需
要返回我正在
清理
的
列
的
值。我想把已
清理
的
数据
包括在一个新
的
专栏
中
。 我对Python和Pandas比较陌生。我通常在
R</em
浏览 3
提问于2022-06-01
得票数 0
1
回答
得到雪花中特定图案
的
正则表达式
replace
、
substring
、
snowflake-cloud-data-platform
我有一个
列
数据
的
表,如下所示。Column5 :2) ["[\"( ABC87654321\"]"] 我
只需
要
清理
这个
列
并按下面的方式
获取
它1) ABC12345678,ABC00123451,ABC0054321
浏览 1
提问于2022-08-08
得票数 0
回答已采纳
1
回答
如何转换行
r
、
sorting
、
dataset
、
data-manipulation
我上传了一个被称为“已获得
的
数据
集”
的
数据
集,它通常有16行
数字
和字符变量,其他一些类似性质
的
文件少于16个字符,每个变量都是
从
第17行开始
的
数据
头,“在这个特定
的
文件
中
”。
获取
的
数据
集和必需
的
数据
集对于
从
第一
列
开始
的
数据
,第一
浏览 2
提问于2014-08-08
得票数 0
1
回答
将多个范畴变量转换为
R
中
的
因子
r
、
neural-network
、
dataset
、
categorical-data
敬礼 目前正在创建一个神经网络,并需要有适当
的
数据
结构。对于其中一个
数据
列
,需要将字符串
数据
转换为
数字
。唯一
的
问题是,每行
中
的
字符串
数据
都是示例QWERTGCD, AWERTKRD, TWERTKRR'等。有超过1000行,每一行都有相同或不同
的
字符串,例如在发布
的
示例
中
。我不知道如何将多个字符串转换成这样规模
的
分类
数据</em
浏览 0
提问于2018-03-06
得票数 1
回答已采纳
1
回答
R
中
的
Kmeans聚类和文本挖掘
r
、
k-means
、
text-mining
我有一个包含twitter
数据
的
txt文件(只有一个文件)。我使用streamR和parseTweets函数将其加载到
R
中
。我需要对这些
数据
进行Kmeans聚类。首先,我需要
清理
和准备
数据
,但
数据
是
数字
和字符
的
混合,它不允许我这样做:(例如)内容转换到tolower。 如何
从
该
数据
中
删除所有不需要
的
字符?我
只需
要纯文本。无<em
浏览 1
提问于2016-11-26
得票数 0
1
回答
如何将第三个表连接到查询
中
,并仅从该表
中
获取
最新
的
记录(按日期)
mysql
因此,我有一个PHP脚本,可以同时
从
两个表中提取
数据
...我如何
从
第三个
数据
库中提取
数据
,但只
从
第三个
数据
库
中
获取
最新
的
记录?这是我现在
的
问题: SELECT c.firstname, c.lastname,
r
.reminder,
r
.cid, a.timestamp, a.practitioner FROM `records
r
.calid
浏览 19
提问于2019-05-17
得票数 0
回答已采纳
1
回答
数据
库“清洁”
数据
或
数据
类型
的
最佳策略?
database
我正在做一些
从
网站上抓取
数据
的
工作,这是一个相当简单
的
任务,从一些
列
中
获取
数据
,然而,这些
列
可以是空
的
,字符串或者
数字
混合在一个
列
中
。现在我
的
问题是,以一致
的
方式将“脏”
数据
引入表或
数据
库模式以进行持久化
的
最佳策略是什么?这里
的
主要问题是我可能遇到
的
浏览 0
提问于2017-11-24
得票数 -1
回答已采纳
1
回答
从
CSV文件更新Android
数据
库
android
、
database
、
sqlite
、
csv
我正在开发一个应用程序,它可以下载CSV文件并用CSV
的
数据
填充DB表。我不知道将发生哪些更改--删除/添加一行或更改记录。在这种情况下,最好
的
做法是什么?当下载新
的
CSV时,我应该删除该表并再次创建它吗?还是将现有的价值与新
的
价值进行比较,并作出必要
的
改变?
浏览 5
提问于2016-04-14
得票数 0
回答已采纳
2
回答
Power BI和Insightly
powerbi
、
insightly
我
从
Power BI (Power BI服务)连接到Insightly以使用Microsoft创建
的
默认报告。这是我第一次使用power BI服务,我发现Power BI桌面的一些功能是不存在
的
(例如,添加条件
列
)。
获取
的
数据
在某些情况下是脏
的
,我需要
清理
数据
。这是一个小项目,我不会把洞察力
数据
到
数据
库和
清理
那里
的
数据
。我<e
浏览 6
提问于2018-02-22
得票数 0
3
回答
分隔同一excel
列
中
的
数据
excel
、
csv
、
excel-formula
、
pivot-table
我有一
列
数据
,其中有多个值类型。我尝试将每种值类型分离到一个单独
的
列
中
。下面是一个
数据
示例:22 - Forte, Matt (Ovr: 88)我试图通过a)转到
数据
并单击文本到
列
来分隔
数据
;但是,
数据
的
"Ovr: 80“部分没有将"Ovr”与80分开。有没有公式可以用
浏览 0
提问于2016-06-08
得票数 0
2
回答
VBA (Excel宏)通过inputbox捕获变量/值,并将该值作为公式
的
一部分传递给单元格
excel
、
vba
我在试着
清理
一个安全漏洞电子表格。我创造了一个可以
清理
90%
的
垃圾
的
马可。我正在努力解决
的
最后一部分是收集用户输入并将其传递到公式
中
。有一
列
指定漏洞
的
代码位置/路径。我
只需
要这个
列
的
一部分,所以我
的
宏会创建一个新
列
,并从完整
的
location
列
中提取一条信息。要在没有输入框
的
情况下执行此操作,我<em
浏览 5
提问于2021-03-02
得票数 0
2
回答
将DB2
数据
上传到Oracle
数据
库-修复垃圾
数据
oracle
、
migration
、
db2
、
sql-loader
我得到了一个带有相关DB2控制文件
的
DB2
数据
导出(大约7 GB)。我
的
目标是将所有
数据
上传到Oracle
数据
库
中
。我几乎已经成功了-我采取了将控制文件转换为SQL*Loader CTL文件
的
方法,并且在大部分情况下都是有效
的
。但是,我发现一些
数据
文件在加载到
数据
库
中
的
一些
列
中
包含终止符和垃圾
数据
,这会导致与这些
数据</
浏览 0
提问于2011-02-04
得票数 0
回答已采纳
3
回答
R
/Power-查询:用匹配替换值
r
、
regex
、
powerbi
、
substring
、
powerquery
我正在试图
清理
一个巨大
的
数据
集中
的
一些
数据
。一
列
保存销售额
的
值。示例值可以如下所示: Sales Potential120脏
数据
4, 0, 0, 00, 200, 0 在脏
数据
的
第一种情况下,单元格应该只包含一个零:0 (在所有其他情况下,我想提取),
浏览 4
提问于2020-06-08
得票数 0
回答已采纳
1
回答
使用preg_match_all()来
清理
大量文本
的
模式
php
、
regex
我在谷歌上搜索了很多模式,以
清理
我
从
链接
中
获取
的
div。我使用了这个代码:来
获取
一个div,但是div很长,而且有很多
数据
。我
只需
要从这个div
获取
两个链接,它们不是在href标记之间,而是在JavaScript标记
中
。有人能给我一个模式来使用它和preg_matc
浏览 2
提问于2014-01-02
得票数 0
回答已采纳
2
回答
在Excel
中
清除删除/着色
数据
r
、
excel
我正在处理
数据
,其中
的
源是一个每月提供
的
Excel格式
的
手动更新。
数据
的
一个奇怪之处是,一些被取消
的
记录要么是通过在
数据
中键入以红色突出显示单元格的人来指示
的
,要么是将字体更改为删除。不幸
的
是,我无法控制
数据
输入源,因此我不得不定期手动搜索文件
中
的
红色单元格或删除字体,并手动清除它们(根据使用情况,删除或添加状态为已取消
的
列
)
浏览 2
提问于2014-06-23
得票数 1
回答已采纳
1
回答
Excel
数字
格式
数据
excel
、
macos
、
excel-2010
、
citrix
我有
从
Citrix
中
的
一些ERP导出到Citrix
中
的
同一个Excel
的
数据
,当我粘贴时,有一个例子:-4,248,057.0025,998,733.00-192,534.00192,534.00 但是,当我将它导出到MacOS
中
的
Excel时,无法识别
数字
格式,而只是像没有格式
的
数据
一样,
浏览 4
提问于2020-01-08
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
关于数字城市中数据获取、共享、应用的初步思考
Excel中如何把列标从字母转换为数字
Excel提取数组中的数据,用TAKE函数其实很简单
4个解决特定的任务的Pandas高效代码
Python与数据分析《一》
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券