本文作者:StubbornHuang
版权声明:本文为站长原创文章,如果转载请注明原文链接!
原文标题:如何选择一块合适的用于深度学习的GPU/显卡
原文链接:https://www.stubbornhuang.com/1435/
发布于:2021年07月15日 14:32:23
修改于:2021年07月15日 14:35:46

1 决定GPU性能的硬件参数
- GPU架构
不同款的GPU可能采用不同设计架构,比如GeForce 10系列的GTX 1080/1080Ti采用的是Pascal架构,而GeForce 20系列的RTX 2080/2080Ti采用的是Turing架构。不同架构的GPU,即使其他参数差不多,性能差别可能非常大。 -
显存带宽
显存代表GPU芯片每秒与显存交换的数据大小,这个值等于 显存位宽*工作频率,单位为GB/秒,该值越大,代表GPU性能越好。Geforce GTX 1080的显存带宽为320GB/秒,而它的升级版Geforce RTX 2080的带宽为448GB/秒。 -
显存位宽
显存位宽代表GPU芯片每个时钟周期内能从GPU显存中读取的数据大小,这个值越大代表GPU芯片和显存之间数据交换的速度越快,性能越好。Geforce GTX 1080的显存位宽为256bit,Geforce RTX 2080Ti显存位宽为352bit。 -
GPU工作效率
代表GPU每秒钟工作次数,单位为MHz,跟CPU的频率类似。该值越大代表性能越好。 -
CUDA核心数量
CUDA核心数量越大越好,Geforce GTX 1080的CUDA核心数量是2560个。而Geforce RTX 2080Ti的CUDA核心数高达4352个。 -
功耗
GPU能耗主要关乎你交电费的多少,像Geforce这种消费级的显卡一般功耗非常高,Geforce GTX 1080的最大功耗为175W,Tesla P4的最大功耗为75W。像那种数据中心大规模级别的GPU部署,低功耗的显卡一年电费能省很多。
2 如何选择适合自己的GPU
2.1 考虑显卡的算力
一般来说,进行深度学习要求算力在5.1以上,显卡的算力越高,计算速度越快,神经网络训练的也越快。如何富的流油,尽管作死的往贵的买,一分钱一分货。
Nvidia公司目前在售的一些常用GPU计算能力对比:


2.2 考虑显卡的显存
显卡的显存决定了一次可加载多少batch数据进显卡训练的容量,如果你的数据集输入数据是视频、图片、音频等,那么显存就必须要足够大,8G显存是目前深度学习的常用显存,不过建议最好可使用更大显存的GPU,这样每次训练的batch_size数量增加,就会减少单个epoch的训练时间,充分利用显存。
Nvidia公司目前在售的一些常用GPU显存对比:

2.3 考虑价格
没钱别买GPU,老老实实使用CPU慢慢跑。
有钱尽量买显存大、CUDA数量多的GPU。
我现在只想说一句:赶紧矿难!!!
当前分类随机文章推荐
- 姿态估计 - Halpe Full-Body136数据集骨骼关节keypoint标注对应 阅读1927次,点赞2次
- yolov5 - 原始仓库检测代码detect.py中文注释 阅读1583次,点赞1次
- Sigmoid激活函数的快速替代函数以及相应的C++实现 阅读237次,点赞0次
- Alphapose - 在Alphapose中使用yolov3-tiny检测器大幅提升检测性能 阅读1707次,点赞0次
- Mediapipe - 关于对Mediapipe C++ SDK使用不当造成的内存泄漏和内存溢出问题的记录 阅读293次,点赞2次
- TensorRT - 使用torch普通算子组合替代torch.einsum爱因斯坦求和约定算子的一般性方法 阅读1182次,点赞0次
- Pytorch – 使用torch.matmul()替换torch.einsum(‘nkctv,kvw->nctw’,(a,b))算子模式 阅读261次,点赞0次
- Mediapipe - 全身包含身体、手部、面部所有关键点标注位置对应图 阅读1861次,点赞1次
- 人工智能 - YOLO v3,YOLO v4,YOLO v5等版本演变史 阅读303次,点赞0次
- TensorRT - 解决INVALID_ARGUMENT: getPluginCreator could not find plugin ScatterND version 1,TensorRT找不到ScatterND插件的问题 阅读1465次,点赞0次
全站随机文章推荐
- 深度学习 - 数据集中训练集、验证集、测试集的划分以及各自作用 阅读384次,点赞0次
- WPF - 代码动态更换按钮的背景图片 阅读2267次,点赞0次
- 书籍翻译 – Fundamentals of Computer Graphics, Fourth Edition,第4章 Ray Tracing中文翻译 阅读719次,点赞6次
- 资源分享 - Game Programming Golden Rules 英文高清PDF下载 阅读791次,点赞0次
- 资源分享 - Ray Tracing - The Next Week英文高清PDF下载 阅读1914次,点赞0次
- WordPress - 文章自定义字段post_meta添加、更新、删除、获取操作 阅读432次,点赞0次
- WordPress - 修改WP Editor.md markdown编辑器插件从剪切板粘贴图片上传的清晰度和质量 阅读210次,点赞0次
- ThreeJS - three.moudle.js报Uncaught SyntaxError:Unexpected token ‘export‘错误 阅读1216次,点赞0次
- 资源分享 - GPU Pro 360 - Guide to 3D Engine Design 英文高清PDF下载 阅读1457次,点赞0次
- OpenCV - Mat与lplImage和CvMat的相互转换 阅读2911次,点赞0次
评论
147