import pyopencl as cl
import numpy as np
import numpy.linalg as la

mf = cl.mem_flags

a = np.random.rand(50000).astype(np.float32)

ctx = cl.create_some_context()

queue = cl.CommandQueue(ctx)

a_buf = cl.Buffer(ctx, mf.READ_WRITE, size=a.nbytes)

cl.enqueue_copy(queue, a_buf, a)

<pyopencl._cl.NannyEvent at 0x7f722c1a9888>

prg = cl.Program(ctx, """
    __kernel void twice(__global float *a)
    {
      int gid = get_global_id(0);
      a[gid] = 2*a[gid];
    }
    """).build()

prg.twice(queue, a.shape, None, a_buf)

<pyopencl._cl.Event at 0x7f72249540f8>

result = np.empty_like(a)

cl.enqueue_copy(queue, result, a_buf)

<pyopencl._cl.NannyEvent at 0x7f722c916e08>

print(la.norm(result - 2*a), la.norm(a))

0.0 128.81612

Hello GPU¶