首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

数据导入与预处理-第4章-数据获取python读取docx文档

Word(Microsoft Office Word)是微软公司的一款文字处理软件,在日常工作、学习中常被用于处理或存储文字信息。Word文件有两种扩展名.doc和.docx,其中扩展名.doc为微软专用格式,并未对外完全授权,兼容性低;而扩展名为.docx的文件无论是从文件体积大小、响应速度、兼容性等方面都优于.doc文件。 由于Pandas库中没有提供读取Word文件的功能,这里需要借助第三方库python-docx读取Word文件(扩展名为.docx)中的数据。 python-docx是一个Python中专门用于创建和修改Word(以.docx为后缀名)文件的库,该库中提供了Word文件的全套操作,可以轻松地对Word文件进行读写操作。 如果当前的环境中没有安装过python-docx库,那么需要先通过pip命令安装该库。

03
您找到你想要的搜索结果了吗?
是的
没有找到

报名 | 清华大学大数据能力提升项目全新升级!快来报名啦!(2022秋)

清华的小伙伴们看过来,听说校内有一个能力提升项目备受各院系师生推崇,因为它: 群星璀璨——项目吸引了25个院系的名师加盟; 人气超高——历年报名同学累计超3000人,几乎涵盖校内所有院系; 校企联动——知名企业深度参与,提供各种资源和实践机会; 没错,它就是清华大学大数据能力提升项目~  通过项目学习,同学们将进阶为具有跨学科交叉应用能力的复合型人才!非信息类同学将更具数据思维和跨学科交叉能力,信息类同学将更具产品营销思维和业务管理能力! 2022年秋,大数据能力提升项目全新升级为“3+X”培养方案,

03
领券