首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >如何将一组Unicode .txt转换为ANSI,以便在R中进行文本分析

如何将一组Unicode .txt转换为ANSI,以便在R中进行文本分析
EN

Stack Overflow用户
提问于 2018-06-10 06:42:43
回答 1查看 505关注 0票数 0

我在Windows10 x64上使用的是R。我正在尝试将一组txt文件读入R中进行文本分析。我使用了以下代码:

代码语言:javascript
复制
setwd(inputdir)
files <- DirSource(directory = inputdir, encoding ="UTF-8" )
docs<- VCorpus(x=files)
writeLines(as.character(docs[[2]]))

最后一行用于显示文档#2的内容,该代码显示为空(以及集合中的所有其他文档)。我不知道为什么。我检查了txt文档的编码(打开,然后选择“另存为”),我的txt文件编码是“Unicode”。当我手动将任何文件保存为"ANSI“时,writeLines(as.character(docs[[2]]))会为我提供正确的内容。我想我应该把所有的文件都转换成ANSI。在这方面,我想问我如何在R中为我的"inputdir“中的所有txt文件做这件事?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-06-10 08:22:39

获取所有txt文件

代码语言:javascript
复制
files <- list.files(path=getwd(), pattern="*.txt", full.names=T, recursive=FALSE)

用于转换编码并覆盖它的循环

代码语言:javascript
复制
for(i in 1:length(files)){
  input <- readLines(files[i])
  converted_input <- iconv(input, from = file_encoding, to = file_encoding)
  writeLines(converted_input,files[i])
}

可以使用iconvlist()命令查看可能的编码

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/50779142

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档