实验环境:
系统是Ubuntu,cuda的版本是7.5。
具体怎么搭建还是参考官方文档documents
1、Introduction
1、1 From Graphics Processing to General Purpose Parallel Computing
由于市场对实时性、3D高清图像的无限制需求的驱动,可编程的GPU(Graphic Processor Unit)已经发展成为一个高度并行的、多线程、多core的处理器。拥有大计算功率和高网络带宽。如下图所示:
图1对比了cpu和GPU每秒的浮点运算,图2对比了cpu和GPU的网络带宽。