# 2025-djl-hw1 **Repository Path**: gpuap/2025-djl-hw1 ## Basic Information - **Project Name**: 2025-djl-hw1 - **Description**: 2025-djl-hw1 - **Primary Language**: C/C++ - **License**: Not specified - **Default Branch**: main - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 1 - **Created**: 2026-01-25 - **Last Updated**: 2026-01-25 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 2025年秋季 国科大《GPU架构与编程》——大作业一(SCNN / FashionMNIST / CUDA) 本仓库为《GPU架构与编程》大作业一实现与复现说明。代码基于给定 SCNN(Spiking CNN)推理框架,在**不修改网络结构**、**使用原始权重参数**的前提下,完成 CUDA 推理与优化实现。程序运行后输出一行结果:`:`。 - 课程:2025年秋季 国科大《GPU架构与编程》 - 姓名:董家麟 - 学院:前沿交叉科学学院 --- ## 1. 目录结构(与当前仓库一致) 请保持如下结构不变,以确保相对路径可复现: 说明: - `model/` 存放原始权重与偏置(txt)。 - `data/FashionMNIST/raw/` 存放 FashionMNIST 测试集二进制文件(t10k)。 - 推荐在仓库根目录 `HOMEWORK_1/` 下执行程序,以使用相对路径访问 `data/` 与 `model/`。 --- ## 2. 环境要求 - GPU:NVIDIA GeForce RTX 4060(Ada,SM 89) - 操作系统:Windows 10/11 x64 - 工具链:NVIDIA CUDA Toolkit(版本需支持 `sm_89`) - 编译器:MSVC(使用 `/O2 /MD /utf-8`) - 环境脚本:先执行 `dev_env_all.bat`(用于设置编译/运行相关环境变量) --- ## 3. 编译与运行 请在 **仓库根目录 `HOMEWORK_1/`** 打开命令行执行。 ```bat dev_env_all.bat ### 3.2 编译 nvcc -arch=sm_89 -O3 -std=c++17 --cudart=shared -Xcompiler "/O2 /MD /utf-8" inference_2.cu -o inference_2 ### 3.3 运行 .\inference_2 .\model ### 输出格式 :