C++/OpenCV – 详解如何一步步将OpenCV的cv::Mat转换成深度学习模型推理所需的输入数据
在视觉任务的深度学习模型的训练过程中,一般需要对数据集中的图片进行预处理,这些操作一般都包括:
在Pytorch中一般使用torchvision.transforms
对图片进行归一化处理,比如经常会使用以下的代码
transforms.Compose([
transforms.RandomCrop((224, 224)), # 随机裁剪成224x224
transforms.RandomRotation(15), # 随机旋转15度
transforms.RandomHorizontalFlip(), # 随机水平翻转
transforms.ToTensor(), # 归一化数值,从[0-255]归一化到[0-1],并转化为Tensor
transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]) # 把图片转到[-1,1]上,方便训练
])
而当模型训练完成需要部署时,目前的部署框架为了推理速度大部分都是C++作为底层,而在C++中,经常会使用opencv作为图片数据的读取库,那么如何基于OpenCV读取的图片数据进行进一步的预处理操作呢?下文我们将由浅入深来一步一步验证各个处理步骤。
1 OpenCV的图片格式验证
从OpenCV的官方文档以及各种教程,我们知道OpenCV读取文件之后会以cv::Mat
的对象进行保存,并且其默认格式为BGR,尺寸为HWC。
我们可以通过以下方法来验证上述的结论,我们先读取一张图片,然后先使用通过cv::cvtColor
方法将输入图片转换为RGB格式并保存,然后再通过最底层遍历输入图片数值的方式修改其RGB顺序,然后将结果保存,最后比较这两张保存的图片是否一致。
测试代码如下:
#include <iostream>
#include <string>
#include <vector>
#include "opencv2/opencv.hpp"
int main()
{
std::string image_path = "C:/Users/xxxx/Desktop/lena_std.tif";
// 读取图片
cv::Mat src_mat = cv::imread(image_path);
// 使用cv::cvtColor方法BGR转RGB并保存图片
cv::Mat src_mat_rgb;
cv::cvtColor(src_mat, src_mat_rgb, CV_BGR2RGB);
cv::imwrite("C:/Users/xxxx/Desktop/lena_std_rgb.tif", src_mat_rgb);
// 获取图片宽、高、channels
int image_height = src_mat.rows;
int image_width = src_mat.cols;
int image_channels = src_mat.channels();
cv::Mat src_mat_copy;
src_mat.copyTo(src_mat_copy);
std::vector<float> input_image_array;
input_image_array.resize(image_channels * image_height * image_width);
float* input_image = input_image_array.data();
// 遍历图片进行BGR转RGB
for (int h = 0; h < image_height; ++h)
{
for (int w = 0; w < image_width; ++w)
{
for (int c = 0; c < image_channels; ++c)
{
float tmp = 0.0;
if (c == 0) // 当c等于0时,在BGR排列中对应B,所以在RGB排列中其索引应该为2
{
tmp = src_mat_copy.ptr<uchar>(h)[w * 3 + 2];
}
else if (c == 1) // 当c等于1时,在BGR排列中对应G,所以在RGB排列中其索引也为1
{
tmp = src_mat_copy.ptr<uchar>(h)[w * 3 + 1];
}
else if (c == 2) // 当c等于2时,在BGR排列中对应R,所以在RGB排列中其索引为0
{
tmp = src_mat_copy.ptr<uchar>(h)[w * 3 + 0];
}
input_image[h * image_width * image_channels + w * image_channels + c] = tmp ;
}
}
}
// 构建结果Mat并保存
cv::Mat res_mat(image_height,image_width,CV_32FC3, input_image_array.data());
cv::imwrite("C:/Users/xxxx/Desktop/b.jpg", res_mat);
return 0;
}
最后面保存的两张图片对比如下:
两张图片的结果完全一致,所以我们能使用下面这种普通的方式正确访问图片的RGB值并且可以对图片的RGB值进行操作,也就是可以进行进一步的预处理操作。
2 对cv::Mat进行深度学习模型数据预处理
(1)请购买正版资源,支持原作者和出版社;
(2)资源收集自互联网,仅供自我学习,请在下载后24小时内删除该资源,如下载者将此资源用于其他非法用途,本站不承担任何法律责任;如有侵权,请立即联系我,马上删除!
(3)此捐赠下载方式无需注册+登录账号,当然如果您喜欢本站也可注册账号;
(4)所支付的款项为捐赠本站款项,而并非付费下载所付款项,本站会在您捐赠本站后显示隐藏内容,请知悉,先非常感谢您对本站的捐赠;
(5)本站支付使用Payjs,该第三方支付方式为微信官方授权的服务商,无支付风险,详情请查看:https://payjs.cn;
(6)请尽量不要使用手机浏览器以及电脑浏览器的无痕模式进行支付操作,以免造成支付成功但未显示隐藏内容。
(7)点击立即购买按钮后弹出选择支付方式页面,选择任意支付方式点击后会跳转到新的二维码支付页面,支付成功后会弹出支付成功的提示框,点击提示框会自动刷新页面显示隐藏内容;另外请不要重复支付,避免财产损失;
(8)在2021年7月27日前,本站采用注册+登录+评论的免费下载模式,旨在节省大家寻找宝贵资源的时间,为大家带来珍贵的知识来源,但是从2021年7月27日起,因遭受注册轰炸和恶意爬虫造成网站负载过大导致宕机,被迫无奈,为减少网站运营时间成本,对部分资源进行捐赠下载,添加支付是反爬虫的最好方式,在此对未享受到免费下载福利的访客表示歉意;
(9)如遇支付页面未弹出、支付成功但未显示隐藏内容、资源链接失效或者提取码出错等情况请发送邮件到stubbornhuang@qq.com或者直接联系QQ:623256052,会尽快为您解决!加我时请备注原因,谢谢!或者点击按钮点击反馈进入反馈页面进行问题反馈
(10)由以上捐赠下载带来的不便请您谅解,如出现重复付费的情况,请联系我,我会尽快返回您的退款!
本文作者:StubbornHuang
版权声明:本文为站长原创文章,如果转载请注明原文链接!
原文标题:C++/OpenCV – 详解如何一步步将OpenCV的cv::Mat转换成深度学习模型推理所需的输入数据
原文链接:https://www.stubbornhuang.com/2574/
发布于:2023年03月28日 14:47:57
修改于:2023年03月29日 9:26:25
当前分类随机文章推荐
- C++11 - std::function简要介绍以及可包装函数的几种形式总结 阅读3465次,点赞0次
- C++ - 求解std::vector
中topk数值以及topk数值对应的索引 阅读3284次,点赞0次 - C++ - 在某一天某个时间点定时执行任务,比如2022年9月19日晚上9点准点执行发送邮件函数 阅读813次,点赞0次
- C++11 - 使用std::codecvt进行字符编码转换需要注意的时间效率问题 阅读2540次,点赞2次
- C++ - GCC版本与C++标准之间的对应关系 阅读75次,点赞0次
- C++ - 使用模板和智能指针构建一个双向链表工具类 阅读1290次,点赞0次
- C++ - single header跨平台高效开源日志库Easylogging++的配置和使用 阅读961次,点赞0次
- OpenCV - OpenCV打开摄像头显示摄像头帧率 阅读320次,点赞0次
- C++ - 对字符串和图片进行base64编解码 阅读1068次,点赞0次
- C++ - 使用Spout2将视频流发送到OBS 阅读228次,点赞0次
全站随机文章推荐
- OpenCV | C++ - convertTo函数的执行效率问题,AI模型部署数据预处理的瓶颈 阅读492次,点赞0次
- 资源分享 - Graphics Shaders - Theory and Practice (Second Edition) 英文高清PDF下载 阅读2661次,点赞0次
- 计算几何 - C++计算两个二维向量的夹角 阅读5310次,点赞3次
- 资源分享 - Physically Based Rendering From Theory To Implementation (Second Edition)英文高清PDF下载 阅读3131次,点赞2次
- Pytorch - reshape和view的用法和区别 阅读782次,点赞0次
- Pytorch - 在Pytroch中实现图片HWC与CHW相互转换、RGB与BGR相互转换 阅读530次,点赞0次
- Linux - 编译Crypto++加密库 阅读2109次,点赞1次
- 最近Chrome浏览器内置的Google翻译不可用的解决方法 阅读624次,点赞0次
- Pytorch - torch.stack参数详解与使用 阅读1176次,点赞0次
- C++11 - std::string - stod/stof/stoi/stol/stold/stoll/stoul/stoull,由std::string转换为int/long/float/double等其他类型 阅读4284次,点赞0次
评论
169