IT168首页 | 产品报价 | ChinaUnix社区 | ITPUB社区 | OA维修站 | 文库 | 博客 | 会议 | 自测 | 专题 | 订阅 | IT选型顾问 | ITPUB学院
热点推荐 加盟IT168选型顾问俱乐部 获享5大权益

CUDA技术

本文将讲述CUDA编程接口中关于纹理存储器的基础知识,包括以下内容:纹理参考属性的相关概念、纹理参考的声明和运行时纹理参考属性。CUDA支持纹理硬件的一个子集,GPU为图形使用这个子集访问纹理存储器和表面存储器。后文将介绍到,从纹理存储器或表面存储器而不是全局存储器中读数据有许多性能好处。

04日更新
标签:GPU CUDA CUDA技术

本文将CUDA编程接口三方面的内容:同意虚拟地址空间、错误检查和调用栈。对于计算能力2.0或以上的设备,当应用以64位进程运行时,以TCC模式在win7/Vista(只支持Tesla系列设备)、在win XP或者在Linux上,主机通过cudaHostAlloc()分配的存储器和使用cudaMalloc*()分配的设备存储器使用单个虚拟地址空间。

29日更新
标签:CUDA CUDA技术

在12月14日举办的百亿亿次(ExaScale)研讨会上,中国科学院过程工程研究所博士侯超峰发表了“基于天河一号千万亿次分子动力学晶体硅模拟” 的演讲,分享了天河一号二期(天河-1A)在分子动力学的应用。

23日更新
基于GPU技术 天河一号分子动力学应用

本文将介绍CUDA中编程接口的多设备系统,主要包括以下内容:枚举设备、设备选择、流和事件行为、p2p存储器访问、p2p存储器复制。枚举设备:主机系统上可以有多个设备。下面的代码展示了怎样枚举这些设备、查询他们的属性、确定有多少个支持CUDA的设备。

22日更新
标签:CUDA CUDA技术

本文主要描述了支持系统中不同层次的异步并发执行的概念和API。  1.主机和设备间异步执行:为了易于使用主机和设备间的异步执行,一些函数是异步的:在设备完全完成任务前,控制已经返回给主机线程了。它们是: 内核发射; 设备间数据拷贝函数; 主机和设备内拷贝小于64KB的存储器块时......

20日更新
标签:CUDA CUDA技术

聚类是信息检索、数据挖掘的一类重要技术,是分析数据并从中发现有用信息的一种有效手段。它将数据对象分组成为多个类或簇,使得在同一个簇中的对象之间具有较高的相似度,而不同簇中的对象差别很大。作为统计学的一个分支和一种无监督的学习方法,聚类从数学分析的角度提供一种准确、细致的分析工具。

19日更新
标签:GPU CUDA CUDA技术
基于GPU并行计算的K-Means聚类算法

2011年由英伟达(NVIDIA)公司主办的GPU技术大会亚洲站(GTC Asia)隆重开幕,本次GPU技术大会邀请了高性能计算领域顶级科学家分享GPU计算中最新的科学研究及其商业应用,尤其是GPU计算落地中国的最新成果。

GPU技术大会:惠普工作站进行GPU计算

2011年由英伟达(NVIDIA)公司主办的GPU技术大会亚洲站(GTC Asia)隆重开幕,该大会主要探讨的话题是热门的“GPU计算”等,本次会议邀请了高性能计算领域顶级科学家分享GPU计算中最新的科学研究及其商业应用,尤其是GPU计算落地中国的最新成果。为期两天的2011年图形处理器(GPU)技术大会14日在北京开幕。

GPU技术大会:基于模式的数据并行编程

2011年由英伟达(NVIDIA)公司主办的GPU技术大会亚洲站(GTC Asia)隆重开幕,该大会主要探讨的话题是热门的“GPU计算”等。大会第二天12月15日,记者参加了由浪潮集团高性能计算应用开发经理张清发表了主题为“石油地震处理算法的GPU迁移优化方法与实例分析”的主题演讲。

GPU技术大会:GPU迁移优化与实例分析

2011年由英伟达(NVIDIA)公司主办的GPU技术大会亚洲站(GTC Asia)隆重开幕,该大会主要探讨的话题是热门的“GPU计算”等,本次会议邀请了高性能计算领域顶级科学家分享GPU计算中最新的科学研究及其商业应用,尤其是GPU计算落地中国的最新成果。

GPU技术大会:异构技术构建云计算平台

GPU技术大会亚洲站(GTC Asia)上,东京工业大学全球科学信息与计算中心教授Satoshi Matsuoka发表了“Tsubame 2.0:满负荷运行具有4000颗GPU的超级计算机”的演讲,分享了东京工业大学超级计算机Tsubame 2.0的研究与应用成果。

最节能的超算机 日本Tsubame 2.0揭秘

2011年由英伟达(NVIDIA)公司主办的GPU技术大会亚洲站(GTC Asia)隆重开幕,该大会主要探讨的话题是热门的“GPU计算”等,本次会议邀请了高性能计算领域顶级科学家分享GPU计算中最新的科学研究及其商业应用,尤其是GPU计算落地中国的最新成果。

GPU大会:CUDA先驱Acceleware畅谈GPU

运行时提供了使用分页锁定主机存储器(也称为pinned)的函数(与常规的使用malloc()分配的可分页的主机存储器不同):cudaHostAlloc()和cudaFreeHost()分配和释放分页锁定主机存储器;cudaHostRegister()分页锁定一段使用malloc()分配的存储器。

14日更新
标签:CUDA CUDA技术

CUDA C向熟悉C语言的用户提供了一种编写设备上执行的代码的简单路径。CUDA C包括C的最小扩展集和一个运行时库。cudart动态库是运行时的实现,它包含在应用的安装包里,所有的入口点前缀都是cuda。本文对运行初始化进行介绍,并给出一个操纵设备存储器的函数的简介。

13日更新
标签:CUDA CUDA技术

共享存储器使用__shared__限定词分配。正如在前面的文章提到的,共享存储器应当比全局存储器更快,详细内容将在后续文章中介绍。任何用访问共享存储器取代访问全局存储器的机会应当被发掘,如下面的矩阵相乘例子展示的那样。 下面的代码是矩阵相乘的一个直接的实现,没有利用到共享存储器。

12日更新
标签:CUDA CUDA技术
CUDA编程接口:共享存储器实现矩阵相乘

nvcc是一个编译器驱动,简化了C或PTX的编译流程:它提供了简单熟悉的命令行选项,同时通过调用一系列实现了不同编译步骤的工具集来执行它们。本文简介了nvcc的命令选项。完整的描述可在nvcc用户手册中找到。

09日更新
标签:CUDA CUDA技术

在详细介绍CUDA之前,首先让大家了解下Ubuntu CUDA,然后全面介绍Ubuntu CUDA,希望对大家有用。Linux用户、系统管理员和Linux系统自学者的参考书或培训教材,还可供希望转入嵌入式领域的科研和工程技术人员参考使用。在Ubuntu环境下搭建Ubuntu CUDA环境其实很简单,只有一点要注意,就是驱动版本。

06日更新

笔者的显卡是GeForce GTX 460SE。而本人是一个灰常灰常的新手,结合网上的教程和自已屡试屡败的经验终于把显卡驱动安装成功了,我安装总是出现下列错误:ERROR: The Nouveau kernel driver is currently in use by your system.This driver is incompatible with the NVIDIA driver, and must ……

01日更新

CUDA C向熟悉C语言的用户提供了一种编写设备上执行的代码的简单路径。CUDA C包括C的最小扩展集和一个运行时库。

30日更新

有一个最新的技术发展使得CUDA程序能够透明的编译并全速的在x86架构上运行,这一革新使得CUDA可以像OpenMP一样,成为一种对所有应用程序的开发均可用的编程模型。PGI CUDA C/C++ compiler for x86,它是第一个能透明的生成运行在x86处理器上二进制代码的原生CUDA编译器,

29日更新
CUDA轻松移植多平台 五大兼容工具盘点
金秋十月 与你饮酒论道
热门文章
it168文库会议频道上线

热门标签

热点推荐