目前Spark有两个Row实现:
import org.apache.spark.sql.Row
import org.apache.spark.sql.catalyst.InternalRow
有什么必要同时拥有它们呢?它们是否表示相同的编码实体,但一个在内部使用(内部API),另一个与外部API一起使用?
发布于 2019-06-26 08:23:56
Row是(好的..)的稳定版本实现排..。然而,顾名思义,InternalRow是在Spark SQL内部使用的。我引用了下面来自InternalRow的文档:
/**
* An abstract class for row used internally in Spark SQL, which only contains the columns as
* internal types.
*/
abstract class InternalRow extends SpecializedGetters with Serializable {
https://stackoverflow.com/questions/42013218
复制相似问题