我正在清理一个项目的数据集。有一个名为"Review Text“的列,我需要清理包含奇怪字符的行中的数据,比如”宋体“”‡“。
使用excel,我能够使用“替换”函数创建一个公式来清理一行。但是,如果可能的话,我想知道如何创建一个嵌套的“替代”公式来清理数据集中的所有行。请随时分享我的问题的任何其他可能的解决方案。
Excel Function
=SUBSTITUTE(J7,"IΓÇÖve","I've")
发布于 2019-10-12 07:35:13
在这种情况下,我不建议使用公式化解决方案,因为它需要您手动确定给定行需要哪种类型的替换。如果有大量的错误类型,那么您将需要为每个唯一类型的错误创建一个唯一的公式。换句话说,您需要手动确定错误的类型以及修复错误的替代方法()。
因此,简单地查找并替换每个问题的,以避免创建执行相同清理任务的复杂公式要容易得多。如果您选择了整个"Review Text“列,您修复的每个错误都将自动应用于整个列。
要查看单元格中是否包含非字母数字字符,可以使用the formula in this related StackOverflow post.。您可以将此公式作为列应用到“审阅文本”列的旁边。然后,您可以继续对包含非Alpha字符的单元格进行排序,直到找到并替换每种类型的错误。
注意:如果您希望保留旧的“评论文本”列,只需将此列复制到一个单独的列中(例如,“评论Text_old")
https://stackoverflow.com/questions/58346338
复制相似问题