首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >Python:将numpy字符串数组转换为数字数组的最快方法

Python:将numpy字符串数组转换为数字数组的最快方法
EN

Stack Overflow用户
提问于 2016-02-24 21:18:51
回答 2查看 1.2K关注 0票数 4

任何人都可以告诉我将这个字符串数组转换为数字数组的最快方法是什么,如下所示:

代码语言:javascript
运行
复制
import numpy as np
strarray = np.array([["123456"], ["654321"]])

     to

numberarray = np.array([[1,2,3,4,5,6], [6,5,4,3,2,1]])

将str映射到list,然后再将str映射到int对于大型数组来说太慢了!

请帮帮我!

EN

回答 2

Stack Overflow用户

发布于 2016-02-25 00:12:19

您可以使用数组view方法将字符串拆分为单个字符:

代码语言:javascript
运行
复制
In [18]: strarray = np.array([[b"123456"], [b"654321"]])

In [19]: strarray.dtype
Out[19]: dtype('S6')

In [20]: strarray.view('S1')
Out[20]: 
array([['1', '2', '3', '4', '5', '6'],
       ['6', '5', '4', '3', '2', '1']], 
      dtype='|S1')

有关数据类型字符代码,请参见here

那么最明显的下一步就是使用astype

代码语言:javascript
运行
复制
In [23]: strarray.view('S1').astype(int)
Out[23]: 
array([[1, 2, 3, 4, 5, 6],
       [6, 5, 4, 3, 2, 1]])

但是,将字符串底层的内存重新解释(查看)为单字节整数并减去48的速度要快得多。这是可行的,因为ASCII字符占用一个字节,并且字符'0''9'是二进制等价于(U)int8的48到57 (检查ord builtin)。

速度比较:

代码语言:javascript
运行
复制
In [26]: ar = np.array([[''.join(np.random.choice(list('123456789'), size=320))] for _ in range(1000)], bytes)

In [27]: %timeit _ = ar.view('S1').astype(np.uint8)
1 loops, best of 3: 284 ms per loop

In [28]: %timeit _ = ar.view(np.uint8) - ord('0')
1000 loops, best of 3: 1.07 ms per loop

如果使用Unicode而不是ASCII,则需要执行稍微不同的步骤。或者先用astype(bytes)转换成ASCII码。

票数 3
EN

Stack Overflow用户

发布于 2016-02-25 00:30:26

这里有一种将输入字符串转换为N长度数字数组的方法,即将每个字符串转换为长度为N的一维数组,其中N是每个字符串的长度。这个实现看起来像这样-

代码语言:javascript
运行
复制
A = (strarray.astype(int)/(10**np.arange(len(strarray[0][0])))).astype(int)
out = np.column_stack((A[:,-1],(A[:,:-1] - 10*A[:,1:])[:,::-1]))

示例运行-

代码语言:javascript
运行
复制
In [177]: strarray  = np.array([["0308468"], ["6540542"], ["4973473"]])

In [178]: A = (strarray.astype(int)/(10**np.arange(len(strarray[0][0])))).astype(int)
     ...: out = np.column_stack((A[:,-1],(A[:,:-1] - 10*A[:,1:])[:,::-1]))
     ...: 

In [179]: out
Out[179]: 
array([[0, 3, 0, 8, 4, 6, 8],
       [6, 5, 4, 0, 5, 4, 2],
       [4, 9, 7, 3, 4, 7, 3]])
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/35603340

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档