Pytorch - 使用opencv-python解码视频文件并将视频帧转换为Pytorch tensor作为网络模型输入数据

Pytorch – 使用opencv-python解码视频文件并将视频帧转换为Pytorch tensor作为网络模型输入数据

StubbornHuang Python 发布于2021-04-19 阅读 3,921次 0次评论 0次点赞本文共1024个字，阅读需要3分钟。

[toc]

1 视频文件作为网络模型的输入数据

越来越多的神经网络模型开始以视频作为训练数据，比如基于视频数据的行为识别等等，这就需要我们将视频转换为可适用的张量，本文将以pytorch为例，展示一下视频数据转换为pytorch tensor的过程。

2 使用OpenCV-Python 解码视频文件并将视频帧转换为Pytorch tensor

2.1 安装opencv-python

不赘述。

2.2 视频转换为tensor

<code class="language-python line-numbers">import torch
import numpy as np
import os

def get_tensor_from_video(video_path):
    """
    :param video_path: 视频文件地址
    :return: pytorch tensor
    """
    if not os.access(video_path, os.F_OK):
        print('测试文件不存在')
        return

    import cv2

    cap = cv2.VideoCapture(video_path)

    frames_list = []
    while(cap.isOpened()):
        ret,frame = cap.read()

        if not ret:
            break
        else:
            # 注意，opencv默认读取的为BGR通道组成模式，需要转换为RGB通道模式
            frame = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
            frames_list.append(frame)
    cap.release()


    # 转换成tensor
    result_frames = torch.as_tensor(np.stack(frames_list))

    # 注意：此时result_frames组成的维度为[视频帧数量，宽，高，通道数]
    return result_frames

if __name__ == '__main__':
    tensor = get_tensor_from_video(r'H:\Temp\P01_01_00_0_color(488x488).avi')
    print(tensor.shape)

</code>

详细的代码如上，请注意上述函数get_tensor_from_video返回的tensor的维度为[视频帧数量，宽，高，通道数]，而有的神经网络模型要求输入[通道数，视频帧数量，宽，高]，我们可以使用以下函数进行转换。

2.3 tensor维度交换

<code class="language-python line-numbers">#  T H W C -> C T H W
result_frames = result_frames.permute(3, 0, 1, 2)
</code>

联系我

资助我们

随机推荐

资源分享 – DirectX 12 3D 游戏开发实战中文PDF下载

资源分享 – Hands-On C++ Game Animation Programming 英文PDF下载

资源分享 – Artificial Intelligence for Games , Second Edition 英文PDF下载

FFmpeg – 将某个文件夹下的图片按标号顺序合成为指定编码格式和指定帧率的视频

WordPress – robots.txt

nginx – 封禁IP和封禁IP段

最新评论

Pytorch – 使用opencv-python解码视频文件并将视频帧转换为Pytorch tensor作为网络模型输入数据

1 视频文件作为网络模型的输入数据

2 使用OpenCV-Python 解码视频文件并将视频帧转换为Pytorch tensor

2.1 安装opencv-python

2.2 视频转换为tensor

2.3 tensor维度交换

发表评论点击这里取消回复。

联系我

资助我们

随机推荐

资源分享 – DirectX 12 3D 游戏开发实战 中文PDF下载

资源分享 – Hands-On C++ Game Animation Programming 英文PDF下载

资源分享 – Artificial Intelligence for Games , Second Edition 英文PDF下载

FFmpeg – 将某个文件夹下的图片按标号顺序合成为指定编码格式和指定帧率的视频

WordPress – robots.txt

nginx – 封禁IP和封禁IP段

最新评论

Pytorch – 使用opencv-python解码视频文件并将视频帧转换为Pytorch tensor作为网络模型输入数据

1 视频文件作为网络模型的输入数据

2 使用OpenCV-Python解码视频文件并将视频帧转换为Pytorch tensor

2.1 安装opencv-python

2.2 视频转换为tensor

2.3 tensor维度交换

发表评论 点击这里取消回复。

大家都在搜

关注我们的公众号

资源分享 – DirectX 12 3D 游戏开发实战中文PDF下载

2 使用OpenCV-Python 解码视频文件并将视频帧转换为Pytorch tensor

发表评论点击这里取消回复。