Scala子字符串并将其存储在DF中。_如何在pandas df中存储二维数组并读取它而不将其转换为字符串_在可变R-tree - Scala中存储Node子节点 - 腾讯云开发者社区

string、scala、apache-spark

我尝试在scala中拆分一个字符串，并将其存储在一个DF中，以便在Apache Spark中使用它。我拥有的字符串如下： fromTo: NT=xxx_bt_bsns_m,OD=ntis,OS=wnd,SX=xs,SZ=ddp,xxa_bt1_b1ns_m 然后将其存储在<

浏览 19提问于2021-10-21得票数 2

2回答

MongoDB和Spark:无法将字符串转换为TimestampType

mongodb、apache-spark

我使用官方的MongoDB Spark Connector从MongoDB集合中读取Spark中的数据，代码如下： INFO DAGScheduler: Job 1 failed: count:234) at scala.collection.TraversableLike$$anonfun$map$1.apply(

浏览 12提问于2018-11-28得票数 1

3回答

LInq查询集合内的集合

c#、linq、linq-to-objects

我喜欢获取所有子对象in并将其存储在字符串数组中。MainObject包含父级列表子属性为(Id，Name) 如何使用linq查询MainObject并找到所有子it并将其存储在字符串数组中？

浏览 0提问于2011-05-31得票数 7

回答已采纳

2回答

应用Dataframe中的子串操作创建新列

scala、dataframe、apache-spark

我想根据字母的位置执行子字符串操作，这样输出将如下所示为了创建新列，我必须使用子字符串操作 ? 我已经编写了一些spark scala代码，如下所示 val df=data.toDF("HI") val df1=df.select(col("*"), substring(col("HI"), 0, 2).as("c"

浏览 6提问于2019-12-12得票数 0

回答已采纳

3回答

我有一个6个字符的字符串，应将其作为时间数据类型加载到SQL Server中。但是spark没有任何时间数据类型。我尝试了几种方法，但时间戳中没有返回数据类型。我将数据作为字符串读取，并将其转换为时间戳，最后尝试提取时间值，但它再次以字符串形式返回值。df.select('time_col').withColumn("time_col",to_timestamp(col("time_col")

浏览 33提问于2020-07-08得票数 0

5回答

带有分隔符的子字符串与Scala

scala、apache-spark、apache-spark-sql

我是斯帕克和斯卡拉的新手，我想问你一个问题：具体来说，我想从“)”这个数字的最后一个字符开始，忽略它并提取整数，直到我找到一个空格。那就休息吧。

浏览 1提问于2018-12-23得票数 0

回答已采纳

1回答

试图从UDF执行spark sql查询

scala、apache-spark、dataframe、hadoop、apache-spark-sql

我正在使用scala在星火框架中编写一个内联函数，它将接受一个字符串输入，执行一个sql语句并返回一个字符串值。val testFunc_test = udf(testFunc) val df = sqlContext.table("some_table") 然后，我在withColumn中调用udf，并试图将其保存在一个新的

浏览 0提问于2016-08-12得票数 1

2回答

如何将火花数据的结果存储到scala val中

apache-spark、apache-spark-sql

有时它产生null，有时它产生0，有时它产生一个数字(BigInt)df: org.apache.spark.sql.DataFrame= [

浏览 0提问于2020-04-02得票数 0

回答已采纳

1回答

用正则表达式替换列子字符串

regex、apache-spark、apache-spark-sql

我在Scala Spark有一张桌子，有以下几张：我希望在列STREET中将

浏览 0提问于2020-11-26得票数 0

回答已采纳

1回答

尝试将"org.apache.spark.sql.DataFrame“对象转换为pandas dataframe会导致在数据库中出现错误"name 'dataframe‘is not defined

pandas、scala、apache-spark、jdbc、databricks

我正在尝试通过databricks中的jdbc连接来查询SQL数据库，并将查询结果存储为pandas dataframe。我在网上找到的所有方法都涉及到将其存储为Spark对象的一种类型，首先使用Scala代码，然后将其转换为pandas。我试过1号牢房：val df_table1 = sqlContext.read.format("jdbc").options(Map( ("url" -

浏览 239提问于2020-05-29得票数 0

1回答

Pandas / Python -合并数据帧，其中键位于2个子字符串中

python、pandas、for-loop、merge、substring

这个问题我已经问了好几次了，似乎没有人能回答它…… 我正在寻找一个循环/函数或一个简单的代码，可以在不同的数据帧中查找2列，并输出第三列。这个示例与简单的合并或合并有很大不同，在合并中我们有一个字符串和一个子字符串...在本例中，如果存储在子字符串行中的一个键存在于不同数据帧的另一个子字符串<

浏览 10提问于2020-11-12得票数 1

回答已采纳

1回答

火花读CSV -没有显示corroupt记录

apache-spark、apache-spark-sql、databricks

Spark有一个读取Permissive文件的CSV模式，它将corroupt记录存储到一个名为_corroupt_record的单独列中。允许--当所有字段遇到损坏的记录时，将其设置为null，并将所有损坏的记录放置在名为_corrupt_record的字符串列中。DecimalType}new StructField("value", DecimalType(25,10), false) ))

浏览 0提问于2019-10-30得票数 2

1回答

Spark Scala拆分字符串语法问题

apache-spark、apache-spark-sql

我尝试使用SparkSQL和Scala拆分DataFrame列中的字符串，这两种拆分条件的工作方式似乎有所不同使用Scala，这是可行的- val seq = Seq("12.1")val df = seq.toDF("val") val afterSplit = <

浏览 18提问于2019-01-08得票数 0

回答已采纳

1回答

如何将函数的返回值写入熊猫数据的新列

python、pandas、dataframe、apply

我有一个包含字符串(是逗号分隔子串)的列的熊猫数据文件。我希望移除一些子字符串，并将其余的子字符串写入同一dataframe中的新列中。这段代码背后的思想是获取df中每一行的每个字符串，在逗号处将其拆分为子字符串，并在结果列表中搜索我想要删除的子字符串。删除后，我将列表重新组合到一个字

浏览 5提问于2015-12-10得票数 1

回答已采纳

1回答

从火花数据框架中读取结构

scala、apache-spark

我从星星之火DataFrame中读到了这一行：scala> t(0)(0)但不幸的是，我不知道如何访问Any中的包装数组虽然我可以将其转换为string并解析输出<

浏览 2提问于2017-02-28得票数 1

回答已采纳

5回答

如何检查是否缓存了我的RDD或dataframe？

apache-spark

我已经创建了一个dataframe，比如df1。我通过使用df1.cache()来缓存它。如何检查这是否已缓存？还有一种方法，使我能够看到所有缓存的RDD或数据文件。

浏览 9提问于2015-09-07得票数 22

回答已采纳

1回答

处理多个记录的存储过程

sql-server、tsql、stored-procedures

我正在尝试将一个存储过程转换为一个存储过程，该存储过程在特定记录中接受一个参数，并更新一个表列，并将其转换为一个存储过程，进行同样的更新，但进行批量更新。由于在存储过程代码中设置了一个变量，所以当我移除该参数并运行它时，将得到一个错误，该错误如下：子查询返回的值超过一个。当子查询跟随=、!=、<、<=、>、>=或<em

浏览 1提问于2017-08-18得票数 0

回答已采纳

2回答

加入数据帧时火花正则表达式

regex、scala、apache-spark

我需要在做一些连接的时候写一些状态检查的正则表达式，n3_testindia1 = test-india-1|stag-america-2|+--------------+val joindf = df1.join(df2, df1("location1") == regex(df</em

浏览 2提问于2018-12-21得票数 1

回答已采纳

1回答

Byte对Json对象的高效解析

scala、play-json

假设我有一个json格式的字节数组(例如，"{"key":"a0998df"，“someVal”：45})，并希望将其转换为json对象。....val jsObject = Json.parse(str).as[JsObject] 但我在想，是否有更快的方法直接从字节数组中获取json对象，而不首先创建整个消息的字符串对象(无论是在Java还是Scala<e

浏览 3提问于2020-06-23得票数 0

回答已采纳

3回答

函数在某些情况下工作，但在最长的子字符串“重用”字符时失败。

java、linked-list

我有一个名为lengthOfLongestSubstring的函数，它的任务是在没有任何重复字符的情况下找到最长的子字符串。在大多数情况下，它可以工作，但是当它得到像"dvdf“这样的输入时，它会打印出2(而不是3)，并给出dv，df当它应该是d，vdf时。所以，我首先遍历字符串，看看是否有任何唯一的字符。如果有，我将其附加到ans变量中。(我认为这部分需要修正)。如果存在重复，则将其存储</em

浏览 1提问于2019-08-26得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云