文章/答案/技术大牛

发布

社区首页 >问答首页 >在python中使用read_excel函数将日期作为字符串保存

问在python中使用read_excel函数将日期作为字符串保存
EN

Stack Overflow用户

提问于 2015-12-08 13:13:28

回答 4查看 19.7K关注 0票数 11

Python2.7.10

尝试了熊猫0.17.1 --功能read_excel

试用了pyexcel 0.1.7 +pyexcel-xlsx0.0.7-函数get_records()

在Python中使用熊猫时，是否可以读取excel文件(格式: xls、xlsx)，并保留包含date或date + time值的列作为字符串而不是到datetime.datetime或timestamp类型？

如果这是不可能的使用熊猫，有人能建议一个替代的方法/库读取xls，xlsx文件，并保留日期列值为字符串？

对于熊猫解决方案尝试，df.info()和生成的日期列类型如下所示：

>>> df.info()
<class 'pandas.core.frame.DataFrame'>
Int64Index: 117 entries, 0 to 116
Columns: 176 entries, Mine to Index
dtypes: datetime64[ns](2), float64(145), int64(26), object(3)
memory usage: 161.8+ KB
>>> type(df['Start Date'][0])
Out[6]: pandas.tslib.Timestamp
>>> type(df['End Date'][0])
Out[7]: pandas.tslib.Timestamp

尝试/方法1:

def read_as_dataframe(filename, ext):
   import pandas as pd
   if ext in ('xls', 'xlsx'):
      # problem: date columns auto converted to datetime.datetime or timestamp!
      df = pd.read_excel(filename) # unwanted - date columns converted!

   return df, name, ext

尝试/方法2:

import pandas as pd
# import datetime as datetime
# parse_date = lambda x: datetime.strptime(x, '%Y%m%d %H')
parse_date = lambda x: x
elif ext in ('xls', 'xlsx', ):
    df = pd.read_excel(filename, parse_dates=False)
    date_cols = [df.columns.get_loc(c) for c in df.columns if c in ('Start Date', 'End Date')]
    # problem: date columns auto converted to datetime.datetime or timestamp!
    df = pd.read_excel(filename, parse_dates=date_cols, date_parser=parse_date)

并且也尝试了pyexcel库，但是它做了相同的自动魔术转换行为：

尝试/方法3:

import pyexcel as pe
import pyexcel.ext.xls
import pyexcel.ext.xlsx

t0 = time.time()
if ext == 'xlsx':
    records = pe.get_records(file_name=filename)
    for record in records:
        print("start date = %s (type=%s), end date = %s (type=%s)" %
              (record['Start Date'],
               str(type(record['Start Date'])),
               record['End Date'],
               str(type(record['End Date'])))
              )

datetime

pandas

python

excel

Stack Overflow用户

发布于 2022-02-02 17:05:15

在从excel中提取日期时，我也遇到了同样的问题。我的列有MM/DD/YYYY格式，但以Pyhton格式读取它并转换为CSV格式之后，格式被转换为MM/DD/YYYY 00:00:00。幸运的是找到了解决办法。使用

excel = pd.read_excel(file, dtype=object)

而不是

excel = pd.read_excel(file, dtype=str)

很管用。

我不知道为什么，也会感谢一些有经验的python程序员来解释。

票数 0

查看全部 4 条回答

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/34156830

复制

相似问题

问在python中使用read_excel函数将日期作为字符串保存
EN

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在python中使用read_excel函数将日期作为字符串保存EN

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在python中使用read_excel函数将日期作为字符串保存
EN