# ShortVideo Classification **Repository Path**: ray7jq/short-video-classification ## Basic Information - **Project Name**: ShortVideo Classification - **Description**: 短视频分类 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 1 - **Created**: 2023-05-28 - **Last Updated**: 2023-11-04 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README ## 项目简介 这是一个基于三维卷积和LSTM的简单视频分类模型。基于三维卷积,但是特征提取网络比较浅。 模型容量较小,适用于短视频,不适用于长视频 ## 文件说明 dataset文件夹:数据集文件夹。文件夹格式如下 - dataset --Train ---video-0//一个视频的所有帧放在一个文件夹 ----1.jpg ----2.jpg ---video-1 ----1.jpg ----2.jpg --Test ... --val ... pth 权重文件夹 dataset.py 数据集处理文件 model.py 模型文件 predict.py 测试效果文件 test.py 临时测试文件 Tools.py 工具文件夹 train.py 训练入口文件 val.py 验证验证集文件夹 2onnx.py 将pth文件转为onnx文件 testonnx.py 测试onnx ## 参数说明 train.py: transforms.Resize((112, 112)):务必适应图片尺寸,且能被4整除,宽高必须相同。建议为(112,224,448,896) num_classes 视频类别数 input_channels 输入图片通道数,默认为3 img_height 输入帧的高 img_width 输入帧的宽 time_steps 每个视频的抽取帧数(将一个视频变为time_steps帧的图片) hidden_size = 256 LSTM的隐藏层 dataset.py self.classes = ['drink', 'listen', 'phone', 'trance', 'write'] self.class_to_idx = {'drink': 0, 'listen': 1, 'phone': 2, 'trance': 3, 'write': 4}