腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何
使用
PySpark
拆分
字符串
数据
和
装载
表
中
的
数据
、
示例
数据
: FWD,29052016:09:01,10.56| FWD,29052016:10:53,11.23| FWD,29052016:15:40,23.20
浏览 2
提问于2019-03-07
得票数 0
1
回答
使用
map函数将Spark Dataframe转换为RDD
、
、
我正在尝试将spark
数据
框
中
的
列
拆分
为多个值。因此,我分隔了要
拆分
的
列,并检查了其类型:O:
pyspark
.sql.dataframe.DataFrame 当我
使用
以下命令分割
字符串
时TopicModelVectorSplit = TopicModelVector.select('TopicModelVector').map(lambda line
浏览 0
提问于2016-06-22
得票数 0
2
回答
在Google Cloud Bigtable
中
填充
数据
需要很长时间
、
我
使用
以下代码将
数据
填充到Bigtable
中
: } }else{ }我们有30个Bigtable节点,我
的
数据
流作业是与100个工作人员一起工作,整个过程必须处理大约100亿行
数据
,<e
浏览 19
提问于2016-08-26
得票数 2
1
回答
映射函数在DataFrame上
的
应用
、
、
我刚刚开始
使用
databricks/
pyspark
。我正在
使用
python/spark 2.1。我已将
数据
上载到
表
中
。该
表
是一个充满
字符串
的
单列。我希望对列
中
的
每个元素应用一个映射函数。我将
表
加载到
数据
帧
中
:我能看到
的
唯一方法
浏览 1
提问于2017-07-31
得票数 18
回答已采纳
1
回答
SQL Server Bulk Insert -在操作过程
中
是否应允许其他插入?
、
、
我有一些导出
的
行,我想导入到当前处于活动状态
的
数据
库
中
。在执行批量插入之前,我是否应该禁用与
数据
库交互
的
应用程序,以便BI是唯一正在执行
的
操作? 我认为这将是最佳实践,但只是想与社区确认一下。
浏览 0
提问于2011-05-27
得票数 0
回答已采纳
1
回答
将UITableView
数据
分成来自一个源
的
多个部分
、
我在我
的
核心
数据
源中有一个
表
,其中包含一些带有NSDate
的
文章。我基本上想将NSManagedObject分成几天,这样你就可以滚动浏览并按日期分开文章。 实现这一目标的最好方法是什么?我
的
上下文是按日期降序查询出来
的
,所以只需要将它分成UITableView部分
的
几天,而不是一个大部分。
浏览 0
提问于2010-08-29
得票数 1
回答已采纳
2
回答
更改
数据
类型
拆分
后
的
星火RDD
如何
在不更改
数据
类型
的
情况下
拆分
、
、
我已经将
数据
从文本文件加载到Spark,在
数据
类型
拆分
更改之后。
如何
在不更改
数据
类型
的
情况下
拆分
数据
,或者
如何
将
拆分
的
数据
转换为原始
数据
类型?我
的
代码conf = SparkConf().setMaster("local&quo
浏览 2
提问于2020-10-22
得票数 0
1
回答
如何
高效地将调用过程(Table Input)
中
的
大
数据
集加载到目标
表
中
?
、
、
我计划
拆分
来自procedure
的
行数,然后将它们
装载
到
表
中
,并
使用
循环继续将某些行
装载
到
表
中
。现在,我必须根据过程
中
的
某些字段从过程
中
检索几
浏览 0
提问于2018-11-28
得票数 0
1
回答
如何
确定错误发生在哪一列上?
、
、
使用
Pyspark
时,当将
数据
文件
中
的
数据
导入到Azure SQL Db
表
时,我将得到以下错误。错误本身是不言自明
的
.但是
数据
文件
和
目标
表
有大约100列,其中75列作为
字符串
列。并且,错误没有指定错误所在
的
列。问题:在
pyspark
中
,
如何
确定错误所在
的
列?来自
数据
浏览 3
提问于2022-08-07
得票数 0
1
回答
SparkSql从配置单元
表
中
获取浮点类型字段值null
、
、
我
使用
sqoop创建和导入hive
表
,并
使用
pyspark
获取
数据
。该
表
由一个
字符串
字段、一个整型字段
和
多个浮点型字段组成。我可以通过hue hive sql查询获得整个
数据
。但是,当我
使用
pyspark
sql编程时,可以显示非浮点型字段,而浮点型字段总是显示空值。色调配置单元sql结果: zeppelin
pyspark
输出: hive
表
的
浏览 18
提问于2017-06-29
得票数 0
3
回答
如何
将SQL String_split函数
中
的
数据
返回到
表
中
?
使用
最新
的
SQL update
和
字符串
拆分
函数,
如何
将
拆分
数据
重新插入到我
的
表
中
?.*, SS.valueouter apply string_split(firstname, ' ') AS SS
使用
该方法,我将FirstName列
拆分
为两个值,并在两个单独
的</
浏览 11
提问于2016-06-29
得票数 1
3
回答
Pandas:有没有一种方法可以在不遇到AttributeError
的
情况下
使用
.str访问器来检查对象是否真的是一个
字符串
?
、
、
我
使用
toPandas()将
pyspark
数据
帧转换为pandas
数据
帧。但是,因为某些
数据
类型不对齐,所以pandas会将
数据
帧
中
的
某些列强制转换为object。我也不能
使用
.str.contains,因为即使包含数值
的
列是dtype object,在
使用
.str时它也会出错。(作为参考,我尝试做
的
是,如果
数据
帧
中
的
列实际上具
浏览 1
提问于2020-06-23
得票数 1
1
回答
如何
在
Pyspark
Dataframe
中
训练
和
测试
拆分
的
时间序列
数据
、
、
、
我想对排序后
的
Pyspark
数据
帧进行基于时间
的
训练测试
拆分
。假设前300行将在训练集中,下200行将在测试
拆分
中
。我可以用以下命令选择前300行: train = df.show(300) 但是
如何
从
Pyspark
dataframe中选择最后200行呢?
浏览 14
提问于2019-03-13
得票数 1
2
回答
ValueError:无法将
字符串
转换为浮动:“���”
、
、
、
它有一个d类型
的
<U26,即26个字符
的
unicode
字符串
。我试图找出
如何
解决'���‘
的
字符串
格式错误。进口相关包裹from
pyspark
.sql import SQLContext from
pysp
浏览 0
提问于2019-03-19
得票数 1
回答已采纳
1
回答
Pyspark
:
如何
在dataframe列为NULL
的
两列上保留联接dataframe
和
dataframe
、
我正在为每日增量加载过程编写一个脚本,
使用
Pyspark
和
一个Hive
表
,该
表
最初已经
装载
了
数据
。我一直试图通过左侧创建一个UC dataframe,将INC dataframe
和
BASE dataframe连接到两个PK列src_sys_id & acct_nbr上,其中INC dataframe我没有运行sql函数或查询w/
Pyspark
的
丰富经验,所以任何建议或帮助都是值得赞赏
的</e
浏览 4
提问于2022-03-03
得票数 0
3
回答
SQL vs
PySpark
/Spark
、
、
、
如果我
的
数据
的
源
和
目标是相同
的
DB,那么是否有人能帮助我理解为什么我们需要
使用
PySpark
或SprakSQL等? 例如,假设我需要从
表
X
和
表
Y中将
数据
加载到PostgresDB
中
的
表
X
中
。仅仅在Postgres中
使用
数据
而不是
使用
SprakSQL或
PySpark</
浏览 8
提问于2022-08-17
得票数 0
1
回答
如何
使用
pyspark
来确定一列
的
字符串
句子
中
是否包含一个或多个单词
、
、
我有一个
数据
集,如下所示我正在尝试
使用
pyspark
标记或过滤列表
中
包含单词
的
行所以本质上它应该返回第一行
和
第三行。它应该返回第二行,因为树
的
末尾是s。我只想要全字匹配。 我
的
想法是
字符串
拆分
字符串
列,循环遍历引用列表,有没有更好
的
方法?
浏览 2
提问于2020-10-28
得票数 1
1
回答
筛选文本列
中
的
停止词- spark
、
、
、
我正在
使用
spark,并且有一个包含用户ID
和
产品评论
的
数据
框架。我需要过滤来自评论
的
停止词,我有一个文本文件
和
停止词来过滤。from
pyspark
.sql.functions import col stopWords = spark.read.text('/FileStore/tables
浏览 6
提问于2022-04-16
得票数 1
回答已采纳
3
回答
使用
拆分
并存储在
数据
表
中
、
我正在研究
如何
拆分
字符串
并将信息存储在datatable
中
。我可以让
拆分
和
存储正确地工作,但问题是我
如何
尝试
使用
拆分
。这是一个
字符串
示例:itemid是项
的
唯一id,在/n之后是用户选择了多少项后,逗号分隔条目。我有这样一个
数据
表
: DataTable table = new DataTab
浏览 1
提问于2011-11-30
得票数 0
回答已采纳
8
回答
oracle
中
的
拆分
函数,用于自动排序逗号分隔值
、
、
、
、
需要
拆分
函数,它将接受两个参数,
字符串
拆分
和
分隔符
拆分
字符串
,并返回一个包含Id
和
Data.And列
的
表
如何
调用
拆分
函数,它将返回一个包含Id
和
Data列
的
表
。Id列将包含序列,
数据
列将包含
字符串
的
数据
。
浏览 8
提问于2015-02-23
得票数 30
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
使用zabbix监控oracle中的表数据
Python中的字符串和字符数据(下)
Python中的字符串和字符数据(上)
如何使用DNS和SQLi从数据库中获取数据样本
在Navicat中如何新建数据库和表并做查询
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券