我希望将存储在Hive中的表读入R中,并希望删除进程中的所有逗号(以确保我的列不会被弄糟)。我有以下命令
rHadoopClient::read.hive( "select regexp_replace( a_column, ',', '$$$' ), regexp_replace( b_column, ',', '$$$' ) from a_table" )
我得到以下错误:
失败: ParseException行1:63无法识别select表达式中“、”、“35671”附近的输入 Read.table中的错误( file=file,header = header,sep = sep,=,: 输入中没有可用的行
rHadoopClient::read.hive函数的结果是一个逗号分隔的表,所以我必须在查询中更改逗号。
更新:切换单引号和双引号解决了问题。
发布于 2017-05-11 06:10:23
问题不在于逗号。否则如何选择多列?
问题是引号。
在外部使用单引号,在内部使用双引号。
https://stackoverflow.com/questions/43912668
复制