我有一个包含字符串信息的大文件:邮政地址。地址:"1780 wemmel rue hendrik de mol 59/7“
我需要对这些数据进行PCA分析,以便在个人图表上确定代表体检交付岗位的集群(建筑、公司、.)。要做到这一点,我需要从字符串中提取数字(或非数字)相关信息,并使其成为我的属性,然后我可以使用PCA来分析它。
我首先创建了36个属性(A和0-9),它们表示每个alpha字符和数字的出现情况。但是PCA还没有给出一个好的结果,我需要提取更多的属性来描述数据。
我需要你的想法,我可以从数据中提取什么,以便在单个图上有一个很好的集群表示。我在用R。
谢谢。
发布于 2015-06-17 10:59:42
https://stackoverflow.com/questions/30888087
复制相似问题