IT168首页 | 产品报价 | ChinaUnix社区 | ITPUB社区 | 文库 | 博客 | 自测 | 专题 | ITPUB学院

CUDA开发

日前,作为中国国产品牌服务器市场老大的浪潮发布了业界首款万亿次桌面超级计算机——“倚天”。与去年曙光发布的所谓个人HPC不同的是,浪潮的“倚天”的运算速度更快,价格更便宜。而这一切的根本是源于其采用了NVDIA开发的Tesla的CPU+GPU的异构多核架构。

27日更新
CPU+GPU:高性能计算到桌面

这个是个典型的利用 shared memory 来使内存读写加速的例子, CUDA SDK 中有个 transpose_native, 是采用比较原始的办法, 将每列的第一个元素读出来凑成一行, 这个办法显而易见是比较的慢的,比上面这个程序要慢10倍以上.

27日更新
CUDA 矩阵转置

创建DLL,首先从CUDA SDK里面拿出来一个源文件中只有一个.cu文件的项目,例如:cudaOpenMP。修改项目的lib目录设定,加入CUDA SDK的目录。

27日更新
C#调用CUDA DLL

如果想建立一个完全使用CUDA的程序,那么下载http://sourceforge.net/projects/cudavswizard/这个就可以了,但是很多时候对于大型工程,主要还是以c或者cpp代码为主,只是在需要性能优化的地方使用CUDA代码,这个时候需要一点点小知识来实现CUDA和VC8的混合编译.步骤如下。

27日更新
CUDA和VC8的混合编译

CUDA 是 Compute Unified Device Architecture “统一计算构架” 的简写,很多人都认为Photoshop cs4支持native的cuda 是错误的.

27日更新
Photoshop with CUDA?

CUDA Stream processor 里的运算单元,基本上是一个浮点数的 fused multiply-add 单元,也就是说它可以进行一次乘法和一次加法

27日更新
CUDA运算单元速度和选择

CUDA的nvcc编译器支持数据结构struct的对齐,以此来提高速度。但当我们想从C++里创建数据结构,然后传到GPU里,用GPU处理的时候,我们就必须注意这个对齐了,怎么在C++里模拟CUDA的对齐呢?今天我发现,其实,结构的内存对齐并不是nvcc的魔法,nvcc其实也只是使用了C++的对齐机制。但为什么要多出一个__align__关键字呢?原来,C++的结构对齐并不是一个跨平台的标准,所以nvcc用__align__来统一。

27日更新
CUDA 结构对齐的C++模拟

OpenCL是一个开放的国际标准,可以用来在不同架构的CPU, GPU使用统一的接口来编程, 包括了编程语言, API接口, 运行时库. 最大的好处,也是我最喜欢的特性,就是可以写出高效的可移植代码.简单的说,过去你用CUDA写的代码就只能在Nvidia的卡上跑,StreamSDK写的代码就只能在ATI的卡上跑,但是有OpenCL,你就不用这么烦恼了,nvidia, ati, intel的GPU都可以通吃了.

27日更新
opencl 体系结构 - 平台

CUDA 目前有兩種不同的 API:Runtime API 和 Driver API,兩種 API 各有其適用的範圍。由於 runtime API 較容易使用,一開始我們會以 runetime API 為主。

27日更新
第一個 CUDA 程式

這裡我們會簡單介紹,NVIDIA 目前支援 CUDA 的 GPU,其在執行 CUDA 程式的部份(基本上就是其 shader 單元)的架構。這裡的資料是綜合 NVIDIA 所公布的資訊,以及 NVIDIA 在各個研討會、學校課程等所提供的資料,因此有可能會有不正確的地方。主要的資料來源包括 NVIDIA 的 CUDA Programming Guide 1.1、NVIDIA 在 Supercomputing '07 介紹 CUDA 的 session,以及 UIUC 的 CUDA 課程。

27日更新
GPU 的硬體架構

目前 NVIDIA 提供的 CUDA Toolkit(可從這裡下載)支援 Windows (32 bits 及 64 bits 版本)及許多不同的 Linux 版本。

27日更新
安裝 CUDA

最近,Khronos公布了OpenCL(Open Computing Language)的第一个测试版本,一经发布便在通用计算领域掀起来轩然大波!OpenCL是由苹果公司发起,业界众多著名厂商共同制作的面向异构系统通用目的并行编程的开放式、免费标准,也是一个统一的编程环境。便于软件开发人员为高性能计算服务器、桌面计算系统、手持设备编写高效轻便的代码,而且广泛适用于多核心处理器(CPU)、图形处理器(GPU)、Cell类型架构以及数字信号处理器(DSP)等其他并行处理器,在游戏、娱乐、科研、医疗等各种领域都有广阔的发展前景。

26日更新
谁主沉浮 OpenCL与CUDA架构深入解析

现代的显示芯片已经具有高度的可程序化能力,由于显示芯片通常具有相当高的内存带宽,以及大量的执行单元,因此开始有利用显示芯片来帮助进行一些计算工作的想法,即 GPGPU。CUDA 即是 NVIDIA 的 GPGPU 模型。

26日更新
CUDA 简介

在成像技术中,一个非常有趣的领域就是裸眼立体成像技术,它无需特殊眼镜就能显示三维立体图像。这种有趣的技术不仅有着娱乐方面的应用潜力,也可作为多种专业应用程序的实用技术。

26日更新
适用于实时医疗成像的裸眼立体成像系统

在CUDA编程中,结构的对齐(alignment)是非常重要的。在我写的CUDA 结构对齐的C++模拟这篇文章中,我介绍了如何在C++里模拟CUDA对结构的内存对齐机制,从而使得我们可以在C++里构造结构。

26日更新
标签: CUDA开发 CUDA
对齐的结构无法使用stl vector解决方案

2009年9月30日,美国加利福尼亚州圣克拉拉市 - 橡树岭国家实验室(ORNL)于今日正式宣布,实验室将计划采用NVIDIA?(英伟达?)公司代号为“Fermi”的第三代CUDA GPU架构来打造世界上最快的超级计算机。

26日更新
“Fermi”架构打造全新超级计算机

2009年9月30日—美国加利福尼亚州圣克拉拉市 - NVIDIA公司于今日正式推出代号为“Fermi”的下一代CUDA GPU架构。Fermi采用全新开创性设计,是全球首款计算GPU的基础,能够在图形处理与GPU计算两方面均实现突破。

26日更新
NVIDIA 推出下一代CUDA GPU架构

当年一场场CPU革命把人类推上了IT列车,如今GPU正把火车换成飞机。而一直在IT方面不断追赶的中国,此次也搭上了头等舱。

26日更新
GPU重分IT奶酪

2009年9月30日,美国加利福尼亚州圣克拉拉市 - NVIDIA?(英伟达?)公司于今日正式推出NVIDIA? Nexus,它是业内首款面向大规模并行计算的开发环境,现已集成在Microsoft Visual Studio之中。

26日更新
NVIDIA 为开发者推出Nexus

2009年9月29日—美国加利福尼亚州圣克拉拉市 - 图形处理器的发明者NVIDIA公司于今日正式宣布,索尼图形图像运作公司在其最新电影大作《美食从天而降》中利用了NVIDIAQuadro?处理器来加速动画与视觉特效的制作。

26日更新
NVIDIA技术助力打造意大利酱龙卷风效果
金秋十月 与你饮酒论道
热门文章
it168文库会议频道上线

热门标签

热点推荐