前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >python数据分析-第一讲:工作环境及本地数据文件

python数据分析-第一讲:工作环境及本地数据文件

作者头像
小海怪的互联网
发布2019-08-23 16:53:24
1.1K0
发布2019-08-23 16:53:24
举报

1.数据分析工作准备环境

1.1数据分析基本概念

1.用适当的统计分析方法对收集来的大量数据进行分析 2.提取有用信息和形成结论 3.对数据加以详细研究和概况总结 目的:从数据中挖掘规则、验证猜想、进行预测

1.2数据分析的流程

明确目的(提出问题)->准备数据->数据解析->分析数据->获得结论->成果可视化

1.3 为什么要学习数据分析

1.有岗位需要 2.是机器学习的基础 3.数据科学的基础

1.4 环境部署

1.4.1 认识jupyter

1.基于web的在线编辑器 2.可交互式 3..ipynb文件分享(文件后缀) 4.支持markdown

1.4.1.1jupyter的安装

pip install jupyter

1.4.1.2jupyter的启动

通过命令行进入到想要打开的位置,然后输入执行: jupyter notebook 就可以打开浏览器进行编程

1.4.1.3jupyter的停止

命令行中,按 ctrl+c停止

1.4.2 pycharm社区版

1.集成开发环境 2.下载地址:https://www.jetbrains.com/pycharm/download/#section=windows

2.本地数据的采集与操作

2.1 常用的本地文件格式

1.TXT文件操作 2.JSON文件操作 3.CSV文件操作 4.Excel文件操作

2.2 TXT文件操作

1.打开文件 2.文件操作(读写) 3.关闭文件 示例代码:

代码语言:javascript
复制
'''
# 1.打开文件
file = open(filename,mode)
filename   文件名称
mode 模式(打开文件的模式)
r read 只读
w writer 写入(覆盖式的)
a append 追加
b byte 打开二进制

# 2.文件操作(读写)
2.1 读操作
read      读取全部文件
readline  逐行读取
readlines 返回列表,再遍历数据
2.2 写操作
write
append
# 3.关闭文件
'''
# file = open("1.txt",'r',encoding='utf-8')
#通过open打开文件的方式,当文件不存在时,程序会报错,抛出异常

# print(file.read())
# print(file.readline())
# print(file.readlines())
file = open("1.txt",'w',encoding='utf-8')
file.write('55555')
file.close()
exit()

2.3 with语句(上下文管理器)

包括了异常处理,自动调用文件关闭操作,推荐使用

代码语言:javascript
复制
with open(filename,mode) as f:
     文件操作

2.4 JSON文件操作

Json是一种轻量级的数据交换格式。Json源自JavaScript语言,易于人类的阅读和编写,同时也易于机器解析和生成,是目前应用最广泛的数据交换格式。 Json是跨语言,跨平台的,但只能对Python的基本数据类型做操作,对Python的类就无能为力。JSON格式和Python中的字典非常像。但是,json的数据要求用双引号将字符串引起来,并且不能有多余的逗号。

2.4.1 json 写操作

写入文件 json.dump() 写入字符串变量 json.dumps()

示例代码:

代码语言:javascript
复制
'''
JSON文件操作
写操作
json.dump 写入文件中
json.dumps 写入字符串变量
'''
import json
# s = 'json'
# json.dump(s,open('json.txt','w'))
s = json.dumps(["zjk",{'age':18}])
print(s)

2.4.2 json 读操作

从文件读取 json.load() 从字符串变量读取 json.loads() 代码示例:

代码语言:javascript
复制
'''
json 文件读操作
json.load() 从文件中读取
json.loads() 从字符串中读取
'''
import json
s=json.load(open("json1.txt",'r'))
print(s)

2.5 CSV文件操作

以纯文本形式存储的表格数据(以逗号作为分隔符),通常第一行为列名

2.5.1 CSV文件写操作

代码语言:javascript
复制
import csv
with open("demo.csv", "w", newline="") as datacsv:
#  不设置newline=“”的时候,写入会增加一个空白行
#默认打开的方式是excel表格
csvwriter = csv.writer(datacsv, dialect=("excel"))
csvwriter.writerow(["A", "B", "C", "D"])

2.5.2 CSV文件读操作

代码语言:javascript
复制
mport csv
rf = open('demo.csv','r')
reader = csv.reader(rf)
print(next(reader))
for i in reader:
print(i)

2.6 Excel文件操作

Excel和CSV区别:

1.都可以Excel程序打开

2.Excel除了文本,数据也可以包含图表、样式等 3.CSV每条记录都存储为一行文本文件,每一条新行都表示一个新的数据记录

2.6.1Excel文件读操作

代码语言:javascript
复制
import xlrd
book = xlrd.open_workbook('1.xls')
sheet = book.sheet_by_index(0) # 获取第一个sheet
print(sheet.nrows) # 获取行数
print(sheet.cell(1,1)) # 获取单元格的值,根据行列
print(sheet.row(1)) # 获取第一行
print(sheet.row_values(1,1)) # 获取第一行,跳过第一列

2.6.1Excel文件写操作

代码语言:javascript
复制
import xlwt
wbook = xlwt.Workbook()
wsheet = wbook.add_sheet('sheet1')
wsheet.write(0, 0, label = 'Row 0, Column 0')
wsheet.write(0, 1, label = 'Row 0, Column 1')
wbook.save('output.xls')
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2019.08.19 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1.数据分析工作准备环境
    • 1.1数据分析基本概念
      • 1.2数据分析的流程
        • 1.3 为什么要学习数据分析
          • 1.4 环境部署
            • 1.4.1 认识jupyter
            • 1.4.2 pycharm社区版
        • 2.本地数据的采集与操作
          • 2.1 常用的本地文件格式
            • 2.2 TXT文件操作
              • 2.3 with语句(上下文管理器)
                • 2.4 JSON文件操作
                  • 2.4.1 json 写操作
                  • 2.4.2 json 读操作
                • 2.5 CSV文件操作
                  • 2.5.1 CSV文件写操作
                  • 2.5.2 CSV文件读操作
                • 2.6 Excel文件操作
                  • 2.6.1Excel文件读操作
                  • 2.6.1Excel文件写操作
              相关产品与服务
              文件存储
              文件存储(Cloud File Storage,CFS)为您提供安全可靠、可扩展的共享文件存储服务。文件存储可与腾讯云服务器、容器服务、批量计算等服务搭配使用,为多个计算节点提供容量和性能可弹性扩展的高性能共享存储。腾讯云文件存储的管理界面简单、易使用,可实现对现有应用的无缝集成;按实际用量付费,为您节约成本,简化 IT 运维工作。
              领券
              问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档