前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >数据科学 IPython 笔记本 9.1 NumPy

数据科学 IPython 笔记本 9.1 NumPy

作者头像
ApacheCN_飞龙
发布2022-12-02 18:58:16
2370
发布2022-12-02 18:58:16
举报
文章被收录于专栏:信数据得永生信数据得永生

9.1 NumPy

致谢:派生于 Olivier Grisel 分享的 scikit-learn 和 IPython 并行机器学习 译者:飞龙 协议:CC BY-NC-SA 4.0

  • NumPy 数组,dtype和形状
  • 常见数组操作
  • 原地修改形状和更新
  • 合并数组
  • 创建示例数据
代码语言:javascript
复制
import numpy as np

NumPy 数组,dtype和形状

代码语言:javascript
复制
a = np.array([1, 2, 3])
print(a)
print(a.shape)
print(a.dtype)

'''
[1 2 3]
(3,)
int64
'''

b = np.array([[0, 2, 4], [1, 3, 5]])
print(b)
print(b.shape)
print(b.dtype)

'''
[[0 2 4]
 [1 3 5]]
(2, 3)
int64
'''

np.zeros(5)

# array([ 0.,  0.,  0.,  0.,  0.])


np.ones(shape=(3, 4), dtype=np.int32)

'''
array([[1, 1, 1, 1],
       [1, 1, 1, 1],
       [1, 1, 1, 1]], dtype=int32)
'''

常见数组操作

代码语言:javascript
复制
c = b * 0.5
print(c)
print(c.shape)
print(c.dtype)

'''
[[ 0.   1.   2. ]
 [ 0.5  1.5  2.5]]
(2, 3)
float64
'''

d = a + c
print(d)

'''
[[ 1.   3.   5. ]
 [ 1.5  3.5  5.5]]
'''

d[0]

# array([ 1.,  3.,  5.])

d[0, 0]

# 1.0

d[:, 0]

# array([ 1. ,  1.5])

d.sum()

# 19.5

d.mean()

# 3.25

d.sum(axis=0)

# array([  2.5,   6.5,  10.5])

d.mean(axis=1)

# array([ 3. ,  3.5])

原地修改形状和更新

代码语言:javascript
复制
e = np.arange(12)
print(e)

# [ 0  1  2  3  4  5  6  7  8  9 10 11]

# f 是 e 的内容的视图
f = e.reshape(3, 4)
print(f)

'''
[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]]
'''

# 将 e 从索引 5 开始的值设为 0
e[5:] = 0
print(e)

# [0 1 2 3 4 0 0 0 0 0 0 0]

# f 也更新了
f

'''
array([[0, 1, 2, 3],
       [4, 0, 0, 0],
       [0, 0, 0, 0]])
'''

# OWNDATA 展示了 f 并没有自己的数据
f.flags

'''
C_CONTIGUOUS : True
F_CONTIGUOUS : False
OWNDATA : False
WRITEABLE : True
ALIGNED : True
UPDATEIFCOPY : False
'''

合并数组

代码语言:javascript
复制
a

# array([1, 2, 3])

b

'''
array([[0, 2, 4],
       [1, 3, 5]])
'''

d

'''
array([[ 1. ,  3. ,  5. ],
       [ 1.5,  3.5,  5.5]])
'''

np.concatenate([a, a, a])

# array([1, 2, 3, 1, 2, 3, 1, 2, 3])

# 广播在需要时自动完成
np.vstack([a, b, d])

'''
array([[ 1. ,  2. ,  3. ],
       [ 0. ,  2. ,  4. ],
       [ 1. ,  3. ,  5. ],
       [ 1. ,  3. ,  5. ],
       [ 1.5,  3.5,  5.5]])
'''

# 在机器学习中,使用 hstack
# 来扩充或者添加新的/交叉特征很有用
np.hstack([b, d])

'''
array([[ 0. ,  2. ,  4. ,  1. ,  3. ,  5. ],
       [ 1. ,  3. ,  5. ,  1.5,  3.5,  5.5]])
'''

创建样例数据

代码语言:javascript
复制
%matplotlib inline

import pylab as plt
import seaborn

seaborn.set()

# 创建特定区间上的等间隔的数字
x = np.linspace(0, 2, 10)
plt.plot(x, 'o-');
plt.show()

代码语言:javascript
复制
# 创建样例数据,添加一些噪声
x = np.random.uniform(1, 100, 1000)
y = np.log(x) + np.random.normal(0, .3, 1000)

plt.scatter(x, y)
plt.show()
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2019-01-05,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 9.1 NumPy
    • NumPy 数组,dtype和形状
      • 常见数组操作
        • 原地修改形状和更新
          • 合并数组
            • 创建样例数据
            领券
            问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档