Python使用pycuda在GPU上并行处理批量判断素数

借助于扩展库pycuda，可以在Python中访问NVIDIA显卡提供的CUDA并行计算API，使用非常方便。安装pycuda时要求已正确安装合适版本的CUDA和Visual Studio（注意，并不是版本越新越合适，目前2015暂时还不行，最好使用VS2013），然后再使用pip安装pycuda。

下面的代码用来统计100000000之内的所有素数个数。

import time

import pycuda.autoinit

import pycuda.driver as drv

import numpy as np

from pycuda.compiler import SourceModule

#编译C代码进入显卡，并行判断素数

mod = SourceModule('''

__global__ void isPrime(int *dest, int *a, int *b)

{

const int i = threadIdx.x+blockDim.x*blockIdx.x;

int j;

for(j=2;j<b[i];j++)

{

if(a[i]%j == 0)

{

break;

}

if(j >= b[i])

{

dest[i] = a[i];

}

''')

#定义待测数值范围，和每次处理的数字数量

end = 100000000

size = 1000

#获取函数

isPrime = mod.get_function("isPrime")

result = 0

start = time.time()

#分段处理，每次处理1000个数字

for i in range(end//size):

startN = i * size

a = np.array(range(startN, startN+size)).astype(np.int64)

b = np.array(list(map(lambda x: int(x**0.5)+1, a))).astype(np.int64)

dest = np.zeros_like(a)

isPrime(drv.Out(dest), drv.In(a), drv.In(b),

block=(size,1,1), grid=(2,1))

result += len(set(filter(None, dest)))

print(time.time()-start)

#上面的代码中把1也算上了，这里减去

print(result-1)

测试结果：在4核CPU、640核GPU的笔记本上运行，本文代码为在CPU上运行的类似代码运行速度的8倍左右。

Python使用pycuda在GPU上并行处理批量判断素数

BITSKY

相关推荐

9. C语言判断素数（求素数）（两种方法）

【python_PAT_乙类】1007_素数对猜想，Python运行超时解决方案

Miller-Rabin?素数测试算法

求超越，计算小于等于N的素数个数

c语言实现一个函数，判断一个数是不是素数

C语言求梅森素数代码及解析

C语言求回文素数代码及解析

C语言求给定范围内的所有素数代码及解析

C语言验证哥德巴赫猜想代码及及解析

C语言实现求梅森素数代码解析

Python实现输出某区间范围内全部素数的方法

python素数筛选法浅析

动脑时间-一个数学问题，用python代码实现-判断素数

Python求出0~100以内的所有素数

Python 判断是否为质数或素数的实例

Python编程判断一个正整数是否为素数的方法

使用Python判断质数(素数)的简单方法讲解

C语言求素数(质数)的算法

python判断数字是否是超级素数幂

python求素数示例分享

检查素数的正则表达式分享

正则表达式与数学（方程式、线性方程）

51nod 1061 最复杂的数V2

欧拉函数 + 线性求法

求 0-N 内有多少个素数

素数的筛法

超素数

数学问题_素数筛法

数学问题——素数

PAT——1013. 数素数

梅森素数应用 nefu 120

梅森素数判定总结 - Lucas-Lehmer算法 & Miller-rabin算法

高效判断素数方法

十万美元的悬赏互联网梅森素数大搜索

判断素数类问题ACing