问读取csv文件，解析数据，并将其存储在字典中
EN

Stack Overflow用户

提问于 2019-11-25 20:44:54

回答 2查看 526关注 0票数 1

我有一个文件，其中包含最近由电台播放的歌曲，艺术家和时间播放的这种格式：“11月4日，2019 8:02 PM"，”货车轮“，”达里乌斯鲁克“。我试图将该文件的内容存储在字符串变量playlist_csv中，使用splitlines()将记录存储在变量行中，然后遍历这些行将数据存储在字典中。键应该是时间戳的datetime对象，值应该是歌曲和艺术家的元组：{datetime_key：(歌曲，艺术家)}

以下是该文件的摘录：

"November 4, 2019 8:02 PM","Wagon Wheel","Darius Rucker" 
"November 4, 2019 7:59 PM","Remember You Young","Thomas Rhett" 
"November 4, 2019 7:55 PM","Long Hot Summer","Keith Urban"

所需的字典应该是这样的：

{datetime.datetime(2019, 11, 4, 20, 2): ('Wagon Wheel', 'Darius Rucker'), 
datetime.datetime(2019, 11, 4, 19, 59): ('Remember You Young', 'Thomas Rhett'), 
datetime.datetime(2019, 11, 4, 19, 55): ('Long Hot Summer', 'Keith Urban')}

到目前为止，我的代码是这样的：

# read the file and store content in string variable playlist_csv
with open('playlist.txt', 'r') as csv_file:
    playlist_csv = csv_file.read().replace('\n', '')
    # use splitlines() method to store records in variable lines (it is list)
    split_playlist = playlist_csv.splitlines()
    # iterate through lines to store data in playlist_dict dictionary
    playlist_dict = {}
    for l in csv.reader(split_playlist, quotechar='"', delimiter=',',
       quoting=csv.QUOTE_ALL, skipinitialspace=True):
       dt=datetime.strptime(l[0], '%B %d, %Y %I:%M %p')
       playlist_dict[l[dt]].append(dt)
print(playlist_dict)

但是，在试图将数据存储到字典中时，我经常会遇到错误(特别是"'datetime.datetime‘对象不可订阅“和”列表索引在修改代码时必须是整数或片“)。

我很感激你的帮助！

python-3.6

python

dictionary

人脸识别特惠活动

精准实时的人脸检测、分析、识别等服务，在线、离线满足多样需求，可应用于智慧零售、智慧社区、在线娱乐等多种应用场景

回答 2

Stack Overflow用户

回答已采纳

发布于 2019-11-25 21:14:23

您首先对csv文件进行拆分的尝试似乎是不必要的--所有这些都由csv.reader来处理。而不是playlist_dict[l[dt]].append(dt)，您需要类似于playlist_dict[dt].append((song, artist))的东西。这应该是可行的：

with open('playlist.txt', 'r') as csv_file:
    playlist = {}
    for time, song, artist in csv.reader(csv_file):
        time = datetime.strptime(time, '%B %d, %Y %I:%M %p')
        if time in playlist:
            playlist[time].append((song, artist))
        else:
            playlist[time] = [(song, artist)]

(您向csv.reader提供的可选参数可能也不需要--默认值应该适用于您所提供的输入类型。)

或者，如果您在每个约会时间只有一首可能的歌曲/艺术家，那么您不需要一个列表并可以这样做(这似乎是您正在寻找的输出)：

with open('playlist.txt', 'r') as f:
    playlist = {datetime.strptime(time, '%B %d, %Y %I:%M %p'): (song, artist) 
                for time, song, artist in csv.reader(f)}

票数 2

Stack Overflow用户

发布于 2019-11-25 22:42:40

由于它可能是一个更好的选择，在这种情况下，这里有一个解决方案使用Pandas。作为奖励，它计算了每首歌之间的时间。

import pandas as pd

df = pd.read_csv('../resources/radio_songs.csv', dtype={'song_name': str, 'artist': str},
                 parse_dates=[0], header=None, names=['time_played', 'song_name', 'artist'])

df['time_diff'] = df['time_played'].diff(periods=-1)

DataFrame输出：

          time_played           song_name         artist time_diff
0 2019-11-04 20:02:00         Wagon Wheel  Darius Rucker  00:03:00
1 2019-11-04 19:59:00  Remember You Young   Thomas Rhett  00:04:00
2 2019-11-04 19:55:00     Long Hot Summer    Keith Urban       NaT

如果出于某种原因，您曾经需要它，这里有一个有趣的方法重新创建字典格式：

tuples_dict = dict(zip(df['time_played'], zip(df['song_name'], df['artist'])))

输出：

{Timestamp('2019-11-04 20:02:00'): ('Wagon Wheel', 'Darius Rucker'), Timestamp('2019-11-04 19:59:00'): ('Remember You Young', 'Thomas Rhett'), Timestamp('2019-11-04 19:55:00'): ('Long Hot Summer', 'Keith Urban')}