TensorRT – 喜大普奔,TensorRT8.2 EA起开始支持Einsum爱因斯坦求和算子
本文作者:StubbornHuang
版权声明:本文为站长原创文章,如果转载请注明原文链接!
原文标题:TensorRT – 喜大普奔,TensorRT8.2 EA起开始支持Einsum爱因斯坦求和算子
原文链接:https://www.stubbornhuang.com/1748/
发布于:2021年10月12日 10:35:52
修改于:2021年10月12日 10:44:46

1 TensorRT 8.2 EA版本支持爱因斯坦求和算子Einsum
NVIDIA在2021年10月6日发布的TensorRT新版本 8.2 Early Access版本终于开始支持爱因斯坦求和算子Einsum,这个消息真是为模型工业化部署的同学省了不少的时间。
TensorRT中具体可支持的Onnx算子可参考:https://github.com/onnx/onnx-tensorrt/blob/master/docs/operators.md,

但是目前Einsum也是支持大部分等式,暂不支持省略号和对角线操作。
目前我已经使用TensorRT 8.2 EA版本对einsum算子转换进行了测试,真的是可以用了!
1.1 Tensor 8.2 EA支持Einsum算子的意义
在TensorRT 8.2 Early Access发布之前,如果深度学习模型中包含Einsum操作,比如pytorch中的torch.einsum或者Tensorflow中的tf.einsum的操作,那么可以成功转换成onnx模型,但是使用TensorRT的trtexec工具将onnx模型转换成TensorRT模型时,就会出现找不到Plugin:Einsum的操作,需要我们自定义插件去支持Einsum算子,
目前在Github上也有人开源自己写的Einsum插件:https://github.com/xn1997/TensorRT-EinsumPlugin/,但是这个插件目前只支持nctkv,kvw->nctw的算子操作,其他的需要自己去实现。
还有的方式是将这种Einsum算子在python层面直接改写成Pytorch或者Tensorflow的常规算子操作,具体可参考https://www.stubbornhuang.com/1741/或者 https://stubbornhuang.blog.csdn.net/article/details/120654252。
现在NVIDIA官方开始支持Einsum算子操作,为深度学习模型的工业化部署节省了太多的时间。虽然省略号和对角线操作暂不支持,但是在深度学习模型中大部分使用的是矩阵乘积或者batch乘积的功能,影响还是比较小的。
当前分类随机文章推荐
- TensorRT - 使用trtexec工具转换模型、运行模型、测试网络性能 阅读3395次,点赞1次
- TensorRT - TensorRT was linked against cuBLAS/cuBLAS LT 11.6.1 but loaded cuBLAS/cuBLAS LT 11.5.4错误提示 阅读52次,点赞0次
- TensortRT - 转换模型出现Could not locate zlibwapi.dll. Please make sure it is in your library path!错误 阅读441次,点赞0次
- TensorRT - onnx_graphsurgeon工具库的安装与API简介 阅读520次,点赞0次
- TensorRT - 解决INVALID_ARGUMENT: getPluginCreator could not find plugin ScatterND version 1,TensorRT找不到ScatterND插件的问题 阅读3266次,点赞0次
- TensorRT - 计算模型推理时间 阅读80次,点赞1次
- TensorRT - 使用C++ SDK出现无法解析的外部符号 "class sample::Logger sample::gLogger"错误 阅读217次,点赞0次
- TensorRT - Using PreviewFeaturekFASTER_DYNAMIC_SHAPES_0805 can help improve performance and resolve potential functional issues 阅读355次,点赞0次
- TensorRT - 基于TensorRT的多线程并发推理方案 阅读154次,点赞2次
- TensorRT - 自带工具trtexec的参数使用说明 阅读4144次,点赞0次
全站随机文章推荐
- C++ - 字节数组byte[]或者unsigned char[]与long的相互转换 阅读795次,点赞0次
- 资源分享 - TCP/IP网络编程(韩 尹圣雨著 金国哲译)PDF下载 阅读5802次,点赞1次
- 资源分享 - Non-Photorealistic Rendering 英文高清PDF下载 阅读1471次,点赞0次
- 资源分享 - Artificial Intelligence - A Modern Approach , Third Edition 英文高清PDF下载 阅读1763次,点赞0次
- C++ - 智能指针的正确使用方式 阅读469次,点赞0次
- Pytorch - 创建随机Tensor的常用方法 阅读141次,点赞0次
- 资源分享 - 深度学习 花书 AI圣经(Deep Learning) 中文PDF下载 阅读4782次,点赞1次
- 工具软件 - 解决从Onenote复制文字到QQ变成图片的问题,2023年最新解决方案 阅读83次,点赞0次
- FFmpge - Ubuntu编译FFmpeg出现WARNING: pkg-config not found, library detection may fail警告 阅读3603次,点赞0次
- WordPress - 限制非管理员用户进入WordPress后台页面,重定向到首页 阅读910次,点赞0次
评论
167