我有一个叫做评级的数据框架。它是一个单独的列,名为"tconst\taverageRating\tnumVotes",但需要将其拆分为3列,用"\“分隔。
我知道这句话可以用:ratings[['tconst','taverageRating','tnumVotes']] = ratings.???.str.split("\",expand=True,)
但是,当我替换?对于实际的列名,我得到了一个错误。我相信这是因为列标题中的\s。
任何帮助都将不胜感激。
发布于 2020-06-15 00:43:15
您确定读入的数据是正确的吗?看看头文件的名字,看起来你的数据实际上是\t
的,也就是tab
分开的(所以,\t
和numVotes
分开是有意义的)。在这种情况下,您应该像这样读取数据:
pd.read_csv('http://language.media.mit.edu/data/public/unesco_langlang_20120722_iso639-3.txt', sep='\t')
https://stackoverflow.com/questions/62379369
复制相似问题