This discussion has been locked.
You can no longer post new replies to this discussion. If you have a question you can start a new discussion

mali gpu 与opencl相关的几个问题

  1. 请问opencl中的pe在mali gpu中对应哪个硬件单元?

  2. 对于mali gpu ,opencl中的kernel执行API, 它的参数loal_work_size的值如何确定? 对于mali gpu,它与cpu是共享内存的,是否这个值可以可以设置为NULL,我在有的书籍中看到推荐为NULL.

Parents
  • Hi Terry,

    Please check my comments as below:

      1. 请问opencl中的pe在mali gpu中对应哪个硬件单元?

    [Mali GPU core]

      2. 对于mali gpu ,opencl中的kernel执行API, 它的参数loal_work_size的值如何确定? 对于mali gpu,它与cpu是共享内存的,是否这个值可以可以设置为NULL,我在有的书籍中看到推荐为NULL.

    [local_work_size 可以设为NULL,如果你不知道设成什么值比较合适。也可以通过clGetKernelWorkgourpInfo()查询得到一个driver推荐的值,但是这个值通常也不是最优的。一般来来说,设置这个值需要考虑CL kernel的memory access pattern是什么样的。最快捷的方式,是测试几组不同的值,找到性能最好的那组值。不同的kernel,最优化的local work size通常是不一样的。]

    Sheri

Reply
  • Hi Terry,

    Please check my comments as below:

      1. 请问opencl中的pe在mali gpu中对应哪个硬件单元?

    [Mali GPU core]

      2. 对于mali gpu ,opencl中的kernel执行API, 它的参数loal_work_size的值如何确定? 对于mali gpu,它与cpu是共享内存的,是否这个值可以可以设置为NULL,我在有的书籍中看到推荐为NULL.

    [local_work_size 可以设为NULL,如果你不知道设成什么值比较合适。也可以通过clGetKernelWorkgourpInfo()查询得到一个driver推荐的值,但是这个值通常也不是最优的。一般来来说,设置这个值需要考虑CL kernel的memory access pattern是什么样的。最快捷的方式,是测试几组不同的值,找到性能最好的那组值。不同的kernel,最优化的local work size通常是不一样的。]

    Sheri

Children