在视觉任务的深度学习模型的训练过程中,一般需要对数据集中的图片进行预处理,这些操作一般都包括:

在Pytorch中一般使用torchvision.transforms对图片进行归一化处理,比如经常会使用以下的代码

transforms.Compose([
   transforms.RandomCrop((224, 224)),  # 随机裁剪成224x224
   transforms.RandomRotation(15),  # 随机旋转15度
   transforms.RandomHorizontalFlip(),  # 随机水平翻转
   transforms.ToTensor(),  # 归一化数值,从[0-255]归一化到[0-1],并转化为Tensor
   transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])  # 把图片转到[-1,1]上,方便训练
])

而当模型训练完成需要部署时,目前的部署框架为了推理速度大部分都是C++作为底层,而在C++中,经常会使用opencv作为图片数据的读取库,那么如何基于OpenCV读取的图片数据进行进一步的预处理操作呢?下文我们将由浅入深来一步一步验证各个处理步骤。

1 OpenCV的图片格式验证

从OpenCV的官方文档以及各种教程,我们知道OpenCV读取文件之后会以cv::Mat的对象进行保存,并且其默认格式为BGR,尺寸为HWC。

我们可以通过以下方法来验证上述的结论,我们先读取一张图片,然后先使用通过cv::cvtColor方法将输入图片转换为RGB格式并保存,然后再通过最底层遍历输入图片数值的方式修改其RGB顺序,然后将结果保存,最后比较这两张保存的图片是否一致。

测试代码如下:

#include <iostream>
#include <string>
#include <vector>

#include "opencv2/opencv.hpp"

int main()
{
    std::string image_path = "C:/Users/xxxx/Desktop/lena_std.tif";

    // 读取图片
    cv::Mat src_mat = cv::imread(image_path);

    // 使用cv::cvtColor方法BGR转RGB并保存图片
    cv::Mat src_mat_rgb;
    cv::cvtColor(src_mat, src_mat_rgb, CV_BGR2RGB);
    cv::imwrite("C:/Users/xxxx/Desktop/lena_std_rgb.tif", src_mat_rgb);

    // 获取图片宽、高、channels
    int image_height = src_mat.rows;
    int image_width = src_mat.cols;
    int image_channels = src_mat.channels();

    cv::Mat src_mat_copy;
    src_mat.copyTo(src_mat_copy);

    std::vector<float> input_image_array;
    input_image_array.resize(image_channels * image_height * image_width);

    float* input_image = input_image_array.data();

    // 遍历图片进行BGR转RGB
    for (int h = 0; h < image_height; ++h)
    {
        for (int w = 0; w < image_width; ++w)
        {
            for (int c = 0; c < image_channels; ++c)
            {
                float tmp = 0.0;
                if (c == 0) // 当c等于0时,在BGR排列中对应B,所以在RGB排列中其索引应该为2
                {
                    tmp = src_mat_copy.ptr<uchar>(h)[w * 3 + 2];
                }
                else if (c == 1) // 当c等于1时,在BGR排列中对应G,所以在RGB排列中其索引也为1
                {
                    tmp = src_mat_copy.ptr<uchar>(h)[w * 3 + 1];
                }
                else if (c == 2) // 当c等于2时,在BGR排列中对应R,所以在RGB排列中其索引为0
                {
                    tmp = src_mat_copy.ptr<uchar>(h)[w * 3 + 0];
                }

                input_image[h * image_width * image_channels + w * image_channels + c] = tmp ;
            }
        }
    }

    // 构建结果Mat并保存
    cv::Mat res_mat(image_height,image_width,CV_32FC3, input_image_array.data());
    cv::imwrite("C:/Users/xxxx/Desktop/b.jpg", res_mat);

    return 0;
}

最后面保存的两张图片对比如下:

C++/OpenCV – 详解如何一步步将OpenCV的cv::Mat转换成深度学习模型推理所需的输入数据-StubbornHuang Blog

两张图片的结果完全一致,所以我们能使用下面这种普通的方式正确访问图片的RGB值并且可以对图片的RGB值进行操作,也就是可以进行进一步的预处理操作。

2 对cv::Mat进行深度学习模型数据预处理

此文章剩余75%被隐藏需要付费查看,内容查看价格1小饼子立即购买,VIP免费
支付前请仔细阅读以下说明,如支付代表您并同意了以下说明:
(1)请购买正版资源,支持原作者和出版社;
(2)资源收集自互联网,仅供自我学习,请在下载后24小时内删除该资源,如下载者将此资源用于其他非法用途,本站不承担任何法律责任;如有侵权,请立即联系我,马上删除!
(3)此捐赠下载方式无需注册+登录账号,当然如果您喜欢本站也可注册账号;
(4)所支付的款项为捐赠本站款项,而并非付费下载所付款项,本站会在您捐赠本站后显示隐藏内容,请知悉,先非常感谢您对本站的捐赠;
(5)本站支付使用Payjs,该第三方支付方式为微信官方授权的服务商,无支付风险,详情请查看:https://payjs.cn
(6)请尽量不要使用手机浏览器以及电脑浏览器的无痕模式进行支付操作,以免造成支付成功但未显示隐藏内容。
(7)点击立即购买按钮后弹出选择支付方式页面,选择任意支付方式点击后会跳转到新的二维码支付页面,支付成功后会弹出支付成功的提示框,点击提示框会自动刷新页面显示隐藏内容;另外请不要重复支付,避免财产损失;
(8)在2021年7月27日前,本站采用注册+登录+评论的免费下载模式,旨在节省大家寻找宝贵资源的时间,为大家带来珍贵的知识来源,但是从2021年7月27日起,因遭受注册轰炸和恶意爬虫造成网站负载过大导致宕机,被迫无奈,为减少网站运营时间成本,对部分资源进行捐赠下载,添加支付是反爬虫的最好方式,在此对未享受到免费下载福利的访客表示歉意;
(9)如遇支付页面未弹出、支付成功但未显示隐藏内容、资源链接失效或者提取码出错等情况请发送邮件到stubbornhuang@qq.com或者直接联系QQ:623256052,会尽快为您解决!加我时请备注原因,谢谢!或者点击按钮点击反馈进入反馈页面进行问题反馈
(10)由以上捐赠下载带来的不便请您谅解,如出现重复付费的情况,请联系我,我会尽快返回您的退款!