本文作者:StubbornHuang
版权声明:本文为站长原创文章,如果转载请注明原文链接!
原文标题:如何选择一块合适的用于深度学习的GPU/显卡
原文链接:https://www.stubbornhuang.com/1435/
发布于:2021年07月15日 14:32:23
修改于:2021年07月15日 14:35:46

1 决定GPU性能的硬件参数
- GPU架构
不同款的GPU可能采用不同设计架构,比如GeForce 10系列的GTX 1080/1080Ti采用的是Pascal架构,而GeForce 20系列的RTX 2080/2080Ti采用的是Turing架构。不同架构的GPU,即使其他参数差不多,性能差别可能非常大。 -
显存带宽
显存代表GPU芯片每秒与显存交换的数据大小,这个值等于 显存位宽*工作频率,单位为GB/秒,该值越大,代表GPU性能越好。Geforce GTX 1080的显存带宽为320GB/秒,而它的升级版Geforce RTX 2080的带宽为448GB/秒。 -
显存位宽
显存位宽代表GPU芯片每个时钟周期内能从GPU显存中读取的数据大小,这个值越大代表GPU芯片和显存之间数据交换的速度越快,性能越好。Geforce GTX 1080的显存位宽为256bit,Geforce RTX 2080Ti显存位宽为352bit。 -
GPU工作效率
代表GPU每秒钟工作次数,单位为MHz,跟CPU的频率类似。该值越大代表性能越好。 -
CUDA核心数量
CUDA核心数量越大越好,Geforce GTX 1080的CUDA核心数量是2560个。而Geforce RTX 2080Ti的CUDA核心数高达4352个。 -
功耗
GPU能耗主要关乎你交电费的多少,像Geforce这种消费级的显卡一般功耗非常高,Geforce GTX 1080的最大功耗为175W,Tesla P4的最大功耗为75W。像那种数据中心大规模级别的GPU部署,低功耗的显卡一年电费能省很多。
2 如何选择适合自己的GPU
2.1 考虑显卡的算力
一般来说,进行深度学习要求算力在5.1以上,显卡的算力越高,计算速度越快,神经网络训练的也越快。如何富的流油,尽管作死的往贵的买,一分钱一分货。
Nvidia公司目前在售的一些常用GPU计算能力对比:


2.2 考虑显卡的显存
显卡的显存决定了一次可加载多少batch数据进显卡训练的容量,如果你的数据集输入数据是视频、图片、音频等,那么显存就必须要足够大,8G显存是目前深度学习的常用显存,不过建议最好可使用更大显存的GPU,这样每次训练的batch_size数量增加,就会减少单个epoch的训练时间,充分利用显存。
Nvidia公司目前在售的一些常用GPU显存对比:

2.3 考虑价格
没钱别买GPU,老老实实使用CPU慢慢跑。
有钱尽量买显存大、CUDA数量多的GPU。
我现在只想说一句:赶紧矿难!!!
当前分类随机文章推荐
- yolov5 - 原始仓库检测代码detect.py中文注释 阅读2558次,点赞1次
- 深度学习 - 语音识别框架wenet的非流式与流式混合训练机制 阅读927次,点赞0次
- Numpy - 保存和加载numpy数组、字典、列表数据 阅读591次,点赞0次
- Mediapipe - 将Mediapipe handtracking封装成动态链接库dll/so,实现在桌面应用中嵌入手势识别功能 阅读9091次,点赞19次
- Pytorch - masked_fill方法参数详解与使用 阅读593次,点赞0次
- 深度学习 - 语音识别框架wenet源码wenet/utils/mask.py中的mask机制 阅读669次,点赞1次
- Pytorch - torch.cat参数详解与使用 阅读1144次,点赞1次
- Pytorch - .to()和.cuda()的区别 阅读602次,点赞0次
- Mediapipe – 将Mediapipe HolisticTracking封装成动态链接库dll/so,实现在桌面应用中嵌入全身关节点识别、手势识别、抬手放手检测识别功能 阅读5771次,点赞14次
- 深度学习 - 语音识别框架中wenet最大动态chunk大小为什么取值为25? 阅读735次,点赞0次
全站随机文章推荐
- 深度学习 - 语音识别框架wenet中的CTC Prefix Beam Search算法的实现 阅读183次,点赞0次
- Modern OpenGL从零开始 - 多个帧缓存Framebuffer绘制到同一个铺满屏幕四边形Quad上 阅读2590次,点赞1次
- 资源下载 - 地球编年史1-7本高清带书签PDF下载 阅读14460次,点赞21次
- Pytorch - 训练网络时出现_pickle.UnpicklingError: pickle data was truncated错误 阅读733次,点赞0次
- 书籍翻译 – Fundamentals of Computer Graphics, Fourth Edition,第5章 Linear Algebra中文翻译 阅读1485次,点赞5次
- FFmpeg - 根据视频比特率和音频比特率计算视频文件大小 阅读284次,点赞0次
- C++ - 格式化json字符串,方便展示json字符串的层次结构 阅读2554次,点赞0次
- 书籍翻译 - Fundamentals of Computer Graphics, Fourth Edition,第1章 Introduction中文翻译 阅读4145次,点赞15次
- 资源分享 - Augmented Reality - Principles and Practice 英文高清PDF下载 阅读1371次,点赞0次
- 工具API推荐 - 通过QQ号获取QQ头像 阅读1181次,点赞0次
评论
167