搜索结果: 1-15 共查到“知识库 CUDA”相关记录25条 . 查询时间(0.015 秒)
NTRU Modular Lattice Signature Scheme on CUDA GPUs
NTRU digital signatures lattice techniques
2016/5/18
In this work we show how to use Graphics Processing Units (GPUs) with Compute Unified Device Architecture (CUDA) to accelerate a lattice based signature scheme, namely, the NTRU modular lattice signat...
Porting and optimizing MAGFLOW on CUDA
GPGPU modeling HPC parallel computation hazard lava
2015/8/27
The MAGFLOW lava simulation model is a cellular automaton developed by the Sezione di Catania of the Istituto Nazionale di Geofisica e Vulcanologia (INGV) and it represents the peak of the evolution o...
提出和实现了一种基于遗传算法和CUDA(ComputeUnifiedDeviceArchitecture)技术的可逆逻辑并行综合方
法. 其特点是预先求出并存储可逆逻辑门的组态编码和真值表,通过可逆逻辑门的“定轨级联”构成染色体
暨可逆逻辑电路,在迭代中按照预期的逻辑功能和优化目标等部分并行地评估适应度,再利用选择、交叉、
变异等部分并行化遗传操作,逐步找到功能正确、性能优化的可逆逻辑电路....
基于CUDA实现经典功率谱估计
CUDA Matlab 经典功率谱 并行运算
2013/11/23
针对目前通常使用Matlab等软件调用CPU进行功率谱估计的现状,提出了一种借助于CUDA平台调用GPU并行计算功率谱的方法;根据经典功率谱估计方法的原理,实现了GPU进行功率谱估计,通过Matlab的C语言接口输出结果,并给出了程序执行流程;最后通过数据对比,显示了CUDA并行计算带来的性能优势。
基于MPI+CUDA的异构并行可压缩流求解器
消息传递接口 统一计算设备架构 异构计算 可压缩流
2016/6/6
在CPU/GPU异构体系结构计算集群上,建立了基于MPI+CUDA的异构并行可压缩流求解器。讨论了异构结构上的可压缩流并行算法的并行模式,在CPU上执行计算密集度低、指令复杂的计算任务,在GPU上执行计算密集度高、指令单一的计算任务。通过数个算例,对比了异构并行计算和传统CPU并行计算计算结果和计算效率。将该算法运用于高超声速流动的数值模拟中,数值结果显示,基于MPI+CUDA的异构并行可压缩流求...
基于MPI+CUDA的异构并行可压缩流求解器
消息传递接口 统一计算设备架构 异构计算 可压缩流
2016/7/14
在CPU/GPU异构体系结构计算集群上,建立了基于MPI+CUDA的异构并行可压缩流求解器。讨论了异构结构上的可压缩流并行算法的并行模式,在CPU上执行计算密集度低、指令复杂的计算任务,在GPU上执行计算密集度高、指令单一的计算任务。通过数个算例,对比了异构并行计算和传统CPU并行计算计算结果和计算效率。将该算法运用于高超声速流动的数值模拟中,数值结果显示,基于MPI+CUDA的异构并行可压缩流求...
基于CUDA的大型γ辐照装置通用并行排源算法
并行模拟植物生长算法 并行排源算法 GPU 大型&gamma 辐照装置
2013/4/19
本文利用CUDA执行模型实现了植物模拟生长算法的完全并行化,结合标准排源质量评价数学模型,得到了一种高效率的并行排源算法,对应的代码能运行在GPU上。在此基础上,利用若干不同规模的排源算例对新版本算法进行了测试。测试结果表明,在保持已有版本算法优点的基础上,新算法的计算效率相对CPU版本提升了500倍以上,相对CPU+GPU混合版本,也提升了30倍以上。对111 PBq以下装置,新算法的计算时间小...
转换波叠前时间偏移计算量巨大、耗费时间长,影响了多波多分量地震数据的处理效率,也限制了转换波技术在生产上的应用规模。目前转换波叠前时间偏移主要采取CPU集群计算方式,但CPU集群存在功耗大、占用空间大和维护成本高等缺点,为缩短偏移计算耗时和降低计算成本,本文提出一种基于CUDA技术的转换波Kirchhoff叠前时间偏移并行算法。应用理论数据和实际转换波数据在CPU和GPU测试平台对算法进行了对比验...
邻居搜索问题在CUDA上基于KD-TRIE方法的优化与实现
KD-TRIE k-最邻近结点算法 CUDA 图形处理器
2012/12/10
介绍如何在CUDA上搭建KD-TRIE,并对其进行搜索,使其能适应解决邻居搜索问题.实验结果表明,当搜索半径较小(如整个空间直径的0.01和0.001),数据规模较大(如106)时,使用KD-TRIE进行搜索的效果最佳,与蛮力算法相比可以达到加速比5 000~15 000倍的效果;当搜索半径较大时,加速比会相应减少.采取优化措施,可以提高加速比.
基于CUDA 的格子Boltzmann 方法: 算法设计与程序优化
格子Boltzmann 方法 CUDA 并行计算 GPU 优化
2013/8/29
格子Boltzmann 方法(LBM)由于其具有计算简单, 天然并行, 易于程序实现, 易于处理复杂边界等优点而成为流体建模和模拟的一种重要方法. LBM 的上述优点也使得其非常适合利用图形处理单元(graphic processing unit, GPU)进行大规模流体计算. 基于GPU 的CUDA(compute unified device architecture)编程平台, 首先设计了相...
Fastplay-A Parallelization Model and Implementation of SMC on CUDA based GPU Cluster Architecture
secure multiparty computation (SMC), Oblivious Transfer (OT), ECC, Graphic Processing Unit (GPU)
2011/3/10
We propose a four-tiered parallelization model for acceleration of the secure multiparty computation (SMC) on the CUDA based Graphic Processing Unit (GPU) cluster architecture. Specification layer is ...
Fastplay-A Parallelization Model and Implementation of SMC on CUDA based GPU Cluster Architecture
implementation / secure multiparty computation (SMC) Oblivious Transfer (OT) ECC Graphic Processing Unit (GPU)
2012/3/29
We propose a four-tiered parallelization model for acceleration of the secure multiparty computation (SMC) on the CUDA based Graphic Processing Unit (GPU) cluster architecture. Specification layer is ...
Fastplay-A Parallelization Model and Implementation of SMC on CUDA based GPU Cluster Architecture
implementation / secure multiparty computation (SMC) Oblivious Transfer (OT) ECC Graphic Processing Unit (GPU)
2012/3/29
We propose a four-tiered parallelization model for acceleration of the secure multiparty computation (SMC) on the CUDA based Graphic Processing Unit (GPU) cluster architecture. Specification layer is ...
基于GPGPU和CUDA的高速AES算法的实现和优化
通用图像处理器 统一计算架构 AES算法 并行计算
2011/12/27
随着高性能计算需求的不断增长,人们开始将目光投向具有强大计算能力及高存储带宽的GPU设备.与擅长处理复杂性逻辑事务的CPU相比,GPGPU(general purpose graphic processing unit,通用图形处理器)更适合于大规模数据并行处理.CUDA(compute unified device architecture,统一计算架构)的出现更加速了GPGPU应用面的扩张.基...