首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

Python的GPU编程实例——近邻表计算

GPU加速是现代工业各种场景中非常常用的一种技术,这得益于GPU计算的高度并行化。在Python中存在有多种GPU并行优化的解决方案,包括之前的博客中提到的cupy、pycuda和numba.cuda,都是GPU加速的标志性Python库。这里我们重点推numba.cuda这一解决方案,因为cupy的优势在于实现好了的众多的函数,在算法实现的灵活性上还比较欠缺;而pycuda虽然提供了很好的灵活性和相当高的性能,但是这要求我们必须在Python的代码中插入C代码,这显然是非常不Pythonic的解决方案。因此我们可以选择numba.cuda这一解决方案,只要在Python函数前方加一个numba.cuda.jit的修饰器,就可以在Python中用最Python的编程语法,实现GPU的加速效果。

02

聊聊python的一些常见工具

关于性能测试,主要是针对哪个函数调用过多,或者占用太多内存,或者导致太多的磁盘和网络I/O 首先是IPython的%timeit和time.time()两个函数,他们可以用来计算语句和函数的运行时间。 1.cProfile,这是一个内建工具可以看函数的运行时间 2.line_profiler,这个更加细节,可以关注到每行被调用的次数以及每行花费的时间。 3.perf stat命令可以了解最终执行于CPU的指令的个数和CPU缓存的利用率 4.heapy模块,可以追踪内存中的所有对象,这是为了解决内存泄漏,即使是引用计数,也不可避免一些奇怪的内存泄漏。 5.memory_profiler,可以以图的形式展示RAM的使用情况随时间的变化 最后更重要的是,要学会阅读字节码。在优化性能之前,请注意保持代码的正确性。 一些小细节在于,你应该学会将代码需要的任何管理性工作都放在初始化去做,比如内存分配,读取配置文件等等。 在了解这些行为后,可以选择合适的方法去处理问题。 让我们在看看几个python的解释器. 1.Cython 2.Shed Skin 3.Numba 4.Pythran 5.PyPy 其中Cython,Shed Skin,Pythran是基于C的编译,Numba是基于LLVM的编译,属于AOT编译,而PyPy则是代替了虚拟机,还包含了一个内置的JIT。 这建立在一个很重要的前提,这些工具都会提前帮你做好类型检查,这样python内部就不需要做太复杂的类型检查了,自然效率就提高了。

03
领券