Pytorch – 使用opencv-python解码视频文件并将视频帧转换为Pytorch tensor作为网络模型输入数据
本文作者:StubbornHuang
版权声明:本文为站长原创文章,如果转载请注明原文链接!
原文标题:Pytorch – 使用opencv-python解码视频文件并将视频帧转换为Pytorch tensor作为网络模型输入数据
原文链接:https://www.stubbornhuang.com/1281/
发布于:2021年04月19日 14:42:47
修改于:2021年04月25日 16:44:00

[toc]
1 视频文件作为网络模型的输入数据
越来越多的神经网络模型开始以视频作为训练数据,比如基于视频数据的行为识别等等,这就需要我们将视频转换为可适用的张量,本文将以pytorch为例,展示一下视频数据转换为pytorch tensor的过程。
2 使用OpenCV-Python解码视频文件并将视频帧转换为Pytorch tensor
2.1 安装opencv-python
不赘述。
2.2 视频转换为tensor
import torch
import numpy as np
import os
def get_tensor_from_video(video_path):
"""
:param video_path: 视频文件地址
:return: pytorch tensor
"""
if not os.access(video_path, os.F_OK):
print('测试文件不存在')
return
import cv2
cap = cv2.VideoCapture(video_path)
frames_list = []
while(cap.isOpened()):
ret,frame = cap.read()
if not ret:
break
else:
# 注意,opencv默认读取的为BGR通道组成模式,需要转换为RGB通道模式
frame = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
frames_list.append(frame)
cap.release()
# 转换成tensor
result_frames = torch.as_tensor(np.stack(frames_list))
# 注意:此时result_frames组成的维度为[视频帧数量,宽,高,通道数]
return result_frames
if __name__ == '__main__':
tensor = get_tensor_from_video(r'H:\Temp\P01_01_00_0_color(488x488).avi')
print(tensor.shape)
详细的代码如上,请注意上述函数get_tensor_from_video返回的tensor的维度为[视频帧数量,宽,高,通道数],而有的神经网络模型要求输入[通道数,视频帧数量,宽,高],我们可以使用以下函数进行转换。
2.3 tensor维度交换
# T H W C -> C T H W
result_frames = result_frames.permute(3, 0, 1, 2)
当前分类随机文章推荐
- Python - itertools.groupby使用详解 阅读92次,点赞0次
- Python - 运行YOLOv5出现AttributeError: module 'torchvision' has no attribute 'ops' 阅读707次,点赞0次
- Python - yaml配置用法详解以及使用Pyyaml库操作yaml文件 阅读158次,点赞0次
- Python - 不定长函数参数列表 阅读1483次,点赞0次
- Python3 - 正则表达式去除字符串中的特殊符号 阅读11983次,点赞1次
- Pip - 常用命令(安装,卸载,升级第三方库) 阅读2686次,点赞1次
- Python - 类对象/列表/元祖/字典判空的方法 阅读1625次,点赞0次
- Python - 语音识别文本相似性度量库jiwer,可计算文字错误率WER、匹配错误率MER等相似性度量指标 阅读134次,点赞0次
- Python - 使用flask_sockets库构建websocket服务器 阅读1802次,点赞0次
- Python - 配置Yolov5出现ImportError: cannot import name 'PILLOW_VERSION' from 'PIL'错误 阅读559次,点赞0次
全站随机文章推荐
- 资源分享 - C++ Primer , 第5版 中文版 高清PDF下载 阅读1962次,点赞2次
- 资源分享 - Game AI Pro 3 - Collected Wisdom of Game AI Professionals 英文高清PDF下载 阅读1386次,点赞0次
- 深度学习 - 语音识别框架wenet源码wenet/utils/mask.py中的mask机制 阅读28次,点赞0次
- js判断当前元素是否含有子元素 阅读185次,点赞0次
- C++ - Windows/Linux生成uuid(通用唯一识别码) 阅读539次,点赞1次
- 解决Python爬虫在爬资源过程中使用urlretrieve函数下载文件不完全且避免下载时长过长陷入死循环,并在下载文件的过程中显示下载进度 阅读3301次,点赞0次
- WordPress - 在浏览器的console输出信息 阅读3061次,点赞0次
- C++ - queue存储动态指针时正确释放内存 阅读4174次,点赞2次
- C++ - std::string与std::wstring相互转换 阅读1063次,点赞0次
- 资源分享 - Vector Field Processing on Triangle Meshes高清PDF下载 阅读1659次,点赞0次
评论
150