深度学习归档 - 第2页共4页

词汇手语识别、连续手语识别、连续手语翻译开源数据集整理

1 Word-level Sign Language Recognition/Isolated Sign Language Recognition 手语词汇识别数据集 1.1 CSL-500 国家：中国官方网站：https://ustc-slr.github.io/datasets/2015_cs…

StubbornHuang
深度学习
2023-11-15
841
0

语音识别的RTF和RTX评价指标

语音识别除了衡量语音识别的准确度之外，另外一个重要的指标就是处理的速度和延迟。其中RTF为衡量实时语音识别处理速度的重要指标，RTX为衡量离线语音识别处理速度的重要指标。 1 RTF RTF(Real Time Factor)，为实时语音识别的处理速度评价指标，其计算公式如下 RTF=\frac{A…

StubbornHuang
深度学习
2023-10-30
556
0

yolov5 – 导出onnx模型教程

1 yolov5导出onnx模型 yolov5 Github：https://github.com/ultralytics/yolov5 yolov5 导出模型官方文档：https://docs.ultralytics.com/yolov5/tutorials/model_export/ 1.1 配…

StubbornHuang
深度学习
2023-10-25
563
0

深度学习 – 监督学习、半监督学习、无监督学习、自监督学习、强化学习等机器学习方式的概念、区别、优缺点

在机器学习中，有几种主要的学习方式：监督学习、无监督学习、半监督学习、自监督学习和强化学习等，本文将详细介绍这几种学习方式的概念和优缺点。 1 机器学习方式 1.1 监督学习监督学习(Supervised Learning)利用大量的标注数据来训练模型，通过对已有标记数据进行学习，训练模型可以对未…

StubbornHuang
深度学习
2023-06-25
486
0

深度学习 – 归纳轻量级神经网络（长期更新）

SqueezeNet 论文标题：SqueezeNet: AlexNet-level accuracy with 50x fewer parameters and< 0.5 MB model size 论文： Iandola F N, Han S, Moskewicz M W, et al. S…

StubbornHuang
深度学习
2023-03-17
784
0

深度学习 – 在大数据集下，内存容量与磁盘IO速度影响模型训练速度的问题

1 模型训练时出现的问题内存容量和磁盘IO速度影响GPU利用率，进而影响模型训练速度如果要想在模型训练时利用GPU，提高GPU的利用率，不受限于IO瓶颈，一般常用的方式是：数据预加载，将所有数据都预加载到内存中，内存的读写速度很快，从内存传递数据到GPU速度也很快数据预先离线处理，然后存储在…

StubbornHuang
深度学习
2023-03-16
801
0

深度学习 – 语音识别框架Wenet网络设计与实现

转载自Wenet网络设计与实现，这个文章是Wenet团队对Wenet比较全面的介绍，也在很多地方解答了我在看wenet源码时的疑惑，会时不时翻出来再看的文章，但是这个文章是托管在Github上的，所以为了防止某些不可控的原因导致无法阅读原文，所以在本站对原文进行完整备份，仅用于个人阅读，如果原作者认…

StubbornHuang
深度学习
2023-01-13
1,414
1

深度学习 – 语音识别框架wenet中的CTC Prefix Beam Search算法的实现

1 Wenet中的CTC Prefix Beam Search Decode的实现下面是Wenet网络的流程图上图来自于：http://placebokkk.github.io/wenet/2021/06/04/asr-wenet-nn-1.html 语音特征数据在经过Encoder后会使用CT…

StubbornHuang
深度学习
2023-01-13
1,118
0

深度学习 – 动作识别Action Recognition最重要的问题

1 动作识别Action Recognition最重要的问题引用一下Human Action Recognition and Prediction: A Survey中一段话，我觉得总结的比较到位。 The first and the foremost important problem in a…

StubbornHuang
深度学习
2022-09-05
1,001
1

深度学习 – 语音识别框架中wenet最大动态chunk大小为什么取值为25？

1 原文论文在wenet的论文Unified Streaming and Non-streaming Two-pass End-to-end Model for Speech Recognition中的3.2.2节Dynamic Chunk Training中对动态chunk size有以下描述：…

StubbornHuang
深度学习
2022-09-01
2,726
0

深度学习 – 为什么要初始化网络模型权重？

1 为什么要进行网络模型权值初始化？ Pytorch中设计好网络结构，并搭建完成之后通常一个重要的步骤就是需要对网络模型中某些层的权值进行初始化，如下代码所示，我们搭建了一个三维卷积网络C3D，并使用私有成员函数__init_weight对网络中的nn.Conv3d和nn.BatchNorm3d模块…

StubbornHuang
深度学习
2022-08-26
932
0

深度学习 – 深度学习中的术语/专有名词归纳

1 Backbone、Head、Neck 以一个图像分类的卷积神经网络为例，网络分成两部分，前部分是由卷积层、归一化层、激活层、池化层堆叠的，输入图像在经过若干层卷积、归一化层、激活层和池化层的堆叠后进入全连接层，经过几次全连接后输出每个类别的概率值。在这里，前面卷积层、归一化层、激活层和池化层的…

StubbornHuang
深度学习
2022-08-24
1,605
0

联系我

资助我们