当前位置: 首页 > news >正文

高端网站建设公司推荐html网页设计作品中国传统文化

高端网站建设公司推荐,html网页设计作品中国传统文化,做网站注意哪方面,建设网站必备条件为了确保能够真正地了解线程块的分配#xff0c;接下来我们写一个简短的内核程序来输出线程块、线程、线程束和线程全局标号到屏幕上。现在#xff0c;除非你使用的是 3.2 版本以上的 SDK否则内核中是不支持 printf的。因此#xff0c;我们可以将数据传送回 CPU 端然后输出到…        为了确保能够真正地了解线程块的分配接下来我们写一个简短的内核程序来输出线程块、线程、线程束和线程全局标号到屏幕上。现在除非你使用的是 3.2 版本以上的 SDK否则内核中是不支持 printf的。因此我们可以将数据传送回 CPU 端然后输出到控制台窗口内核的代码如下: #include cuda_runtime.h #include device_launch_parameters.h#include stdio.h #include stdlib.h #include conio.h__global__ void what_is_my_id(unsigned int* const block,unsigned int* const thread,unsigned int* const warp,unsigned int* const calc_thread) {/* Thread id is block index * block size thread offset into the block */const unsigned int thread_idx (blockIdx.x * blockDim.x) threadIdx.x;block[thread_idx] blockIdx.x; thread[thread_idx] threadIdx.x;/* Calculate warp using buit in variable warpSize */warp[thread_idx] threadIdx.x / warpSize;calc_thread[thread_idx] thread_idx; }#define ARRAY_SIZE 128 #define ARRAY_SIZE_IN_BYTES (sizeof(unsigned int)* (ARRAY_SIZE))/* Declare statically four arrays of ARRAY_SIZE each */ unsigned int cpu_block[ARRAY_SIZE]; unsigned int cpu_thread[ARRAY_SIZE]; unsigned int cpu_warp[ARRAY_SIZE]; unsigned int cpu_calc_thread[ARRAY_SIZE];int main(void) {/* Total thread count 2*64128 */const unsigned int num_blocks 2;const unsigned int num_threads 64;char ch;/* Declare pointers for GPU based params */unsigned int* gpu_block;unsigned int* gpu_thread;unsigned int* gpu_warp;unsigned int* gpu_calc_thread;/* Declare loop counter for use later */unsigned int i;/* Allocate four arrays on the GPU */cudaMalloc((void**)gpu_block, ARRAY_SIZE_IN_BYTES);cudaMalloc((void**)gpu_thread, ARRAY_SIZE_IN_BYTES);cudaMalloc((void**)gpu_warp, ARRAY_SIZE_IN_BYTES);cudaMalloc((void**)gpu_calc_thread, ARRAY_SIZE_IN_BYTES);/* Execute our kerne] */what_is_my_id num_blocks, num_threads(gpu_block, gpu_thread, gpu_warp, gpu_calc_thread);/* Copy back the gpu results to the CPU */cudaMemcpy(cpu_block, gpu_block, ARRAY_SIZE_IN_BYTES, cudaMemcpyDeviceToHost);cudaMemcpy(cpu_thread, gpu_thread, ARRAY_SIZE_IN_BYTES, cudaMemcpyDeviceToHost);cudaMemcpy(cpu_warp, gpu_warp, ARRAY_SIZE_IN_BYTES, cudaMemcpyDeviceToHost);cudaMemcpy(cpu_calc_thread, gpu_calc_thread, ARRAY_SIZE_IN_BYTES, cudaMemcpyDeviceToHost);/* Free the arrays on the GPU as now were done with them */cudaFree(gpu_block);cudaFree(gpu_thread);cudaFree(gpu_warp);cudaFree(gpu_calc_thread);/* Iterate through the arrays and print */for (i 0; i ARRAY_SIZE; i) {printf(Calculated Thread: %3u - Block:%2u - Warp %2u - Thread %3u\n, cpu_calc_thread[i], cpu_block[i], cpu_warp[i], cpu_thread[i]);}ch getch(); } 在这个例子中我们可以看到线程块按照线程块的编号紧密相连。由于处理的是一维数组所以我们对线程块采用相同的布局便可简单解决问题。以下是此程序的输出结果: 正如我们计算的那样线程索引是0~ 127。一共有两个线块每个线程块包含 64个线程每个线程块内部线程的索引为0~63。一个线程块包含两个线束。
http://www.hkea.cn/news/14406931/

相关文章:

  • 青岛市北建设集团网站crm管理是什么意思
  • 建设一个网站的费用做网站发布信息
  • 广州网站下载安装wordpress 弹窗代码
  • 株洲专业建设网站建设银行青海省分行门户网站
  • 团购网站开发语言个人备案做门户网站
  • u网站建设电子商务网站建设阶段
  • 怎样推广网站平台优化工作流程
  • dede网站名称不能中文专业电容层析成像代做网站
  • 做数学网站福州seo推广
  • 哪些网站做的海报比较高大上肖港网站开发
  • 网站标签怎么做跳转网站安全狗 拦截301
  • 模仿网站怎么做网站中怎么做下载链接
  • 幸福宝推广app网站下载餐饮品牌全案设计公司
  • 手机如何创建个人网站网站建设行业企业排名
  • wordpress 站库分离广告联盟怎么赚钱
  • 河北提供网站建设公司哪家好ai做网站
  • 瑞安 网站建设域名解析网站登录
  • 做网站需要域名 域名是啥网上写文章用什么软件
  • 网站界面设计的发展趋势合肥网站制作建设
  • 网站w3c标准南宁网站推广v1
  • 电脑培训学校网站手机网站排名
  • 网站建站系统程序毕节地seo
  • 露营旅游网站策划书乡村建设网站
  • 长春网站建设公司排名服务号 订阅号
  • 做网站首页的尺寸网上学平面设计
  • 现代锦州网站建设软件开发上海
  • 图片设计网站免费宁夏建设投资集团公司网站
  • 历下区网站建设公司微信公共平台开发
  • 烟台网站的优化电子政务网站建设公司
  • 提供营销单页网站亚马逊跨境电商开店流程