IT168首页 | 产品报价 | ChinaUnix社区 | ITPUB社区 | 文库 | 博客 | 自测 | 专题 | ITPUB学院

CUDA技术

进入九月,天气逐渐凉了,但CUDA频道的热度依旧不减。在这里,笔者将为大家盘点CUDA频道八月份最热门的文章。在这个排行榜中,最受欢迎的文章你都看过了吗?

21日更新
CUDA频道八月热文排行榜 Top5

之前的文章中,给大家介绍了如何将OpenCV 2.2与CUDA 4.0的巧妙结合。今天尝试把CUDA 和 OpenCV 两者进行硬性结合。

20日更新
标签: CUDA CUDA技术
OpenCV 2.2与CUDA 4.0的硬性结合

继《Windows环境下的CUDA 4.0入门》系列文章后,笔者发现大多数CUDA爱好者是以自学为主的,因此这些入门类的文章很受欢迎。除了Windows系统,开发者最常用的就是Linux了。Linux是一种受到广泛关注和支持的操作系统,和Windows相比,Linux具有低成本、高安全性等优势。

12日更新
标签: CUDA CUDA技术
Linux环境CUDA 4.0入门:安装前的准备

本次测试目的仅仅为了尝试能否使用pthread实现多线程对CPU和GPU分别进行控制。

08日更新
标签: CUDA CUDA技术
使用pthread实现多线程CPU+GPU计算

近来测试了矩阵(规模为2048*2048)乘法在不同参数下两个算法分别使用的时间:第一个算法为没有使用shared memory的直接相乘,每个thread负责矩阵C的一个元素的计算;第二个算法为使用了shared memory的分块算法,每个block就是一个小的矩阵分块。

06日更新
标签: CUDA CUDA技术
Ubuntu环境下的CUDA编程(四)

Ray-Casting:光线跟踪(ray tracing,raytracing,ray-tracing)是一种在二维(2D)屏幕上呈现三维(3D)图像的技术。光线跟踪程序可以识别和复制光线的路线,但是方向相反(从眼睛到原点)。每个光线路径由多个直线部件组成,并且包括点的反射、折射和阴影效应。

30日更新
CUDA应用:基于CUDA实现Ray-Casting

个人错误记录:一、出现了 shared data 过多的现象。在编译的时候,Kernel调用的那一行报错,说是用了过多的 share data,程序出错,本来以为时参数过多,后来才发现,计算的时候不小心将每个 block 里面 shared data 分配过多,超过了每个 block 中 shared memory 的总数,所以报错。

23日更新
标签: CUDA CUDA技术
Ubuntu环境下的CUDA编程(三)

在《Ubuntu环境下的CUDA编程(一)》中给大家介绍了如何在Ubuntu环境下安装和配置CUDA软件,今天给大家介绍Ubuntu环境下CUDA编程的基本过程。

18日更新
标签: CUDA CUDA技术
Ubuntu环境下的CUDA编程(二)

NVIDIA在其SoC(System on a Chip)系列产品中增加了Tegra Kal-El(Tegra 3),该款产品配备了四核CPU或者双核心CPU,同时集成有GPU核心。一般认为Kal-El是在Tegra 2的基础上增强了顶点着色器和像素着色器而构成。那么在Kal-El之后,Tegra的架构获怎么发展呢?

16日更新
标签: CUDA CUDA技术
2万5千个CUDA核心?Tegra 3发展解析

在之前的文章中,介绍了《Windows环境CUDA 4.0:安装前的准备》,本文介绍CUDA 4.0的安装与验证过程。

15日更新
标签: CUDA CUDA技术
Windows环境CUDA 4.0:安装与验证

最终从我的机子里测试出来是运行了309.483ms。当我们把36行到80换成CPU的计算时只需要了0.004736ms。从而可以看出2046*2046的数据量计算,GPU只是处理单纯的的数组加法,并不能发挥优势。GPU的优势到底在哪里,我们得慢慢找,怎么样的计算,才能让GPU发挥比CPU好。

11日更新
标签: CUDA CUDA技术
CUDA开发:检验执行时间

本文向大家介绍如何在Ubuntu环境下进行CUDA编程,1、更新Ubuntu软件;2、下载CUDA安装软件;3、安装CUDA;4、编译CUDA SDK;5、运行。

09日更新
标签: CUDA CUDA技术
Ubuntu环境下的CUDA编程(一)

作为一名CUDA的开发者,首先应当学会如何搭建CUDA的开发运行环境。通过今后的几篇文章,笔者将同大家分享在Windows、Linux和Mac OS X环境下如何安装和配置CUDA运行环境,并结合NVIDIA的官方教程,相信这一系列文章将会是最全面、最权威的CUDA 4.0安装手册。

08日更新
标签: CUDA CUDA技术
Windows环境CUDA 4.0:安装前的准备

在win7(windows7 ultimate SP1)下成功安装VS2010(Visual Studio 2010 ultimate x86)。这个zip文件中有5个文件,分别把这5个文件放到如下文件夹中。

05日更新
标签: CUDA CUDA技术
VS2010下配置使用OpenGL的glut库

前段时间Nvidia公司放出的CUDA4.0RC只能让注册用户使用,现在CUDA4.0RC2终于面向所有用户了,更新的部分就不提了,这只是GPU通用计算走向成熟的一步。在安装了最新驱动的N卡计算机上,下载CUDA Toolkit并安装。

04日更新
标签: CUDA CUDA技术
在Visual Studio 2010下配置CUDA 4.0

本文将为大家介绍如何将OpenCV 2.2与CUDA 4.0的巧妙结合。主要思想是:并行的程序写在.cu文件中,编译成.dll的形式,之后用.cpp文件直接调用.dll文件,完成两者结合。

03日更新
标签: CUDA CUDA技术
OpenCV 2.2与CUDA 4.0的巧妙结合

本文将为大家介绍在Visual Studio 2010中如何将CUDA文件进行高亮设置,让Visual Studio 2010中的CUDA文件高亮起来。

01日更新
标签: CUDA CUDA技术
让VS2010中的CUDA文件高亮起来

前两部分是有关ILP隐藏计算和访存延迟,从而在GPU低占用率的情况下达到高并行度和吞吐率。下一部分是讨论在共享内存(shared memory)和寄存器(register)之间的权衡,作者从吞吐率的角度上说明使用共享内存达不到最好性能,最好降低占用率从而尽可能多的使用寄存器。

28日更新
标签: CUDA CUDA技术
CUDA:使用更少线程运行更快

这两天看到Vasily Volkov的ppt,对如何更有效的使用GPU做通用计算提出了增加线程级并行以外的另一种方法---增加指令级并行,受益匪浅。刚好也没找到中文版本,就翻译过来与大家交流下,有错误请指正,所有的实验结果和图片均出自原ppt。请参考《Better Performance at Lower Occupancy》后面两个案例。

26日更新
标签: CUDA CUDA技术
CUDA:使用更少线程隐藏计算延迟

Nvidia采用ARM架构的融合处理器计划Project Denver(丹佛工程)实际上已经宣布多时了,但是对于丹佛处理器的详细规格目前还没有获悉,Nvidia方面也是直到今日才给出了丹佛处理器的一些比较具体的信息。

22日更新
NVIDIA丹佛处理器:八核配256个CUDA单元
金秋十月 与你饮酒论道
热门文章
it168文库会议频道上线

热门标签

热点推荐