不久前,我在code.google.com上看到了一个由Googlers人员创建的项目,该项目提供了一个程序,允许您导入CSV文件(或其他分隔格式),然后很快就可以查询文件,或者在每列中查找不同的条目(并且很容易修复冗余数据)等等。
我记得youtube上有一段视频描述了如何使用这个工具,她的描述给我留下了深刻的印象。我记得她用这个工具从公园服务这样的政府实体导入了一个大文件,然后通过在每一列中找到唯一的条目,她可以立即看到哪些条目拼写错误/重复/重复,等等。
我相信这个项目后来作为一个开源应用发布了..。我就是找不到。有人知道这是什么吗,我在哪里能找到它?
发布于 2014-07-07 22:59:17
听起来你可能在找OpenRefine。http://openrefine.org
发布于 2014-07-07 22:48:01
CSVFix有可能吗?最近从code.google.com迁移到bitbucket。
像https://github.com/rchowe/textsql这样的东西会有帮助吗?
https://stackoverflow.com/questions/24621026
复制相似问题