# 感知数据分析与应用 **Repository Path**: KevinXF/algorithm ## Basic Information - **Project Name**: 感知数据分析与应用 - **Description**: 《感知数据分析与应用》具体内容主要包括:静态和动态数据分析与计算从统计的角度揭示隐藏在数据中的规律,对收集到的数据进行处理与分析,提取有价值的信息,得到特征统计结果。机器学习以数据或已有经验为基础,从大量的、不完全的、有噪声的、模糊的、随机的实际数据中,挖掘隐藏在数据中的信息。深度学习将归纳偏差建立成神经网络的层次化表示,找到高维数据(如信号和图像)的低维表示(特征)。 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 1 - **Created**: 2025-09-09 - **Last Updated**: 2025-09-09 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 感知数据分析与应用 ## 介绍 ————《感知数据分析与应用》配套相关算法———— #### 第一章 绪论 A101:传感器的静态特性指标——准静态量时传感器的输入与输出特性包括灵敏度,线性度,零点漂移,满量程输出漂移,动态范围,迟滞、重复性等。此外,程序中还包括数据文件A101_data.xlsx。 A102**:传感器的时域动态特性——传感器在时域中的动态响应就是对输入动态信号产生的输出。 A103:二阶检测系统时域动态性能指标——欠阻尼时,二阶传感器的阶跃响应指标包括:振荡周期、振荡频率、峰值时间、超调量、响应时间、上升时间、延迟时间、衰减率和对数衰减率。 A104:传感器的频率传递函数(频率特性)——幅频特性为输出信号对输入信号幅值比;相频特性为输出信号相位与输入信号相位之差。 #### 第二章 静态数据与误差分析 A201**:概率分布密度及其数字特征——常用分布密度及其期望、方差,比如正态、对数正态、指数、Weibull、Rayleigh、$\beta$、$\Gamma$和均匀等分布。 A202**:概率分布列及其数字特征——常用分布列及其期望、方差,比如一点、Bernoulli(二点)、二项、负二项、Poisson和几何等分布。 A203*:三大抽样分布——在正态总体假定下,常用统计量分布与$\chi^2$、$t$和$F$分布有关。 A204:统计估计——主要包括:点估计、区间估计、核密度估计、稳健统计法、Bayesian估计等。此外,程序中还包括数据文件A204_data.xlsx。 A205:假设检验——以小概率原理为基础,根据一定假设条件由样本推断总体,包括:参数、拟合优度、正态分布参数和大样本等检验,Bayes方法等。 A206:线性模型——最小二乘法使标准差与方差成为分散性度量的基础,包括:最小二乘法拟合、线性回归分析、相关分析和方差分析等。 A207+:常用的测量结果及测量误差评估——平均类包括均值、几何均值、调和均值,标准差、平均误差、Peter法、极限误差;排序类包括中位值、中点值、三点均值、L-G估计,最大残差法、极差法、中位绝对差、半极差、四分位离差、十六分位离差、四点L估计等;截尾类包括截尾均值、平尾均值,截尾标准差、平尾标准差;频数类包括众值,或然误差等。此外,程序中还包括数据文件A207_data.xlsx。 A208*:粗大误差判断——粗大误差是超出规定条件预期的误差,含粗大误差的测量值为异常值、差错、坏值或离群值。常用$3\sigma$准则、Grubbs准则、Dixon准则和t检验准则等判断法。此外,程序中还包括数据文件A208_data.xlsx。 A209*:系统误差分析——系统误差是在重复条件下,对同一被测量实行无限多次测量结果的平均值减去被测量值。常用残差法、组间数据检验等判断。 A210+:Monte Carlo法——Monte Carlo法是一种基于随机数的数值法,通过对各影响量进行大量离散抽样进行数值计算来解决不确定度评定的问题。 #### 第三章 动态数据与信号处理 A301:随机过程的分布函数及其数字特征——随机过程的分布函数、联合分布函数与特征函数,及其数学期望、方差、相关函数、自相关函数与协方差函数。 A302**:Markov过程——已知现在时刻事件的情况下,将来时刻事件与过去时刻事件是独立的,即Markov性(Markov property)或无后效性、无记忆性。 A303+:Markov链的Monte Carlo法——Markov链Monte Carlo(Markov chain Monte Carlo,MCMC)通过构造Markov链极限平稳分布来模拟计算积分。遍历的Markov链的极限分布是唯一的平稳分布。 A304:时间序列分析——时间序列通过观测得到的依时间次序排列而又相互关联的数据序列,主要包括均值、均方值、方差、自相关和自协方差等函数。时间序列分析利用随机数学方法研究随时间变化,且前后相互关联的动态随机数据。 A305:谱估计——谱估计根据随机过程的有限观测值确定该过程的谱,包括:经典谱估计、参数建模、最大熵谱估计等。 A306+:能量谱——基于快速傅里叶变换(FFT)对两组信号进行频域分析,比较其在频率域的幅值、功率密度与能量分布特征,揭示信号频谱的差异性与规律。 A307:短时Fourier变换——STFT用一个随时间平移的窗函数$\gamma$($\tau$-$t$)将原来的非平稳信号分为若干平稳或近似平稳段,然后逐段确定其频谱。 A308:一维信号小波分析——小波分析是一种窗口大小固定、形状可变的时频局部化信号分析方法,在低频部分具有较高的频率分辨率和较低的时间分辨率,在高频部分具有较高的时间分辨率和较低的频率分辨率。 A309:二维图像小波分析——小波分析是一种窗口大小固定、形状可变的时频局部化信号分析方法,在低频部分具有较高的频率分辨率和较低的时间分辨率,在高频部分具有较高的时间分辨率和较低的频率分辨率。 A310*:小波包——小波包分析能根据被分析信号的特征,自适应地选择相应频带,使之与信号频谱相匹配,从而提高时频分辨率。 A311**:提升小波——提升小波在时域中采用提升方法构造第二代小波。 A312+:连续小波——对信号进行连续小波变换,将信号从时域转换到时频域,计算两种信号的差异,并通过图形展示信号之间的不同,帮助分析信号的显著特征。 A313**:Wigner-Vill分布——WVD的时间-带宽乘积已达不确定原理的下界,具有最好时频聚集性;核函数$\Theta$($\tau$,$\nu$)=1。 A314*:经验模式分解——EMD将信号自适应分解成从高到低不同频率的IMF,不改变原数据的物理特性。 A315**:Hilbert谱分析——HAS对IMF计算信号能量随时间和频率分布的Hilbert谱。 #### 第四章 统计机器学习 A401:$k$近邻法——根据给定距离度量,在训练集$D$中找出与$x$最近邻的$k$个点。 A402:logistic回归——对线性可分问题,找到一个超平面,能将两个不同的类区分开。 A403:Bayes分类器——Bayes分类器通过某对象的先验概率,利用Bayes公式计算出其后验概率,即该对象属于某一类的概率,选择具有最大后验概率的类作为该对象所属的类。 A404:期望最大化算法——M算法是含隐变量的概率模型参数的MLE,或极大后验概率估计法。每次迭代由两步组成:$E$步,求期望;$M$步,求极大。 A405:支持向量机——SVM基于支持向量构造分类判别函数的学习机器,通过定义不同的内积函数,实现由样本空间到高维空间的非线性映射。 A406:聚类分析——聚类将样本集$D$划分为若干互不相交的子集(样本)。 A407**:基于密度的空间聚类——DBSCAN算法将样本观测点视为聚类变量空间中的点,以样本观测点$O$邻域内的邻居个数作为$O$所在区域的密度测度。 A408:主成分分析——PCA通过正交变换将可能存在相关性的变量转换为线性不相关的变量,找出表达性能最优的正交基。 A409:Gaussian混合模型生成——生成式方法基于生成式模型,假设所有数据(无论是否有标记)都由GMM生成,且每个类别对应一个Gaussian混合成分。 A410+:包络线——包络线是信号处理中的一种技术,用于提取信号的轮廓或边界。它通过识别信号的局部极大值和极小值,构建出信号的上包络线和下包络线,从而反映信号的整体趋势和变化范围。包络线通常用于分析周期性信号、调制信号以及特征提取等应用中,能够帮助识别信号中的重要特征和模式。 #### 第五章 深度学习 A501:神经网络——学习过程中,NN从接受的样本集提取集合蕴涵的基本信息;信息处理是神经元间相互作用的动态过程,通过学习/训练,将蕴涵在数据集中的数据联系抽象出来。 A502*:卷积神经网络——卷积神经网络利用空间相对关系减少参数数目以提高训练性能,包含特征提取层和特征映射层。 A503+:SqueezeNet——Fire Module结构包括:1$×$1卷积结构的压缩层,以及1$×$1卷积核与3$×$3卷积核组成的扩展层结构 A504*:YOLO——YOLO是一个可一次性预测多个检测框位置和类别的CNN。 A505*:长短记忆神经网络——LSTM递归网络具有内部LSTM细胞递归循环(自环)。每个单元有相同的输入和输出和参数与控制信息流动的门控。 A506:自编码器——AE包括输入层和输出层(解码层),隐藏层(编码层)承担编码器和解码器的工作。 A507+:深度Q-网络算法——DQN算法基于价值网络,agent遍历状态下的所有动作的价值,选择价值最大的动作作为输出。 A508+:深度确定性策略梯度算法——DDPG采用策略网络和价值网络,引入DQN的经验重放与目标$Q$函数机制,适用于连续状态空间和动作空间。 #### 组织形式 程序集 |__Chapter1 |__Chapter2 |__Chapter3 |__Chapter4 |__Chapter5 软件架构说明 #### 开发环境 本书所提供的示例代码是基于MATLAB开发环境构建的,未来将扩展至基于Python开发环境的示例程序。 #### 注意事项 本书所提供的样例程序已在matlab 2021a环境下进行了调试和运行,其中,32个学时的课程可参考不带“$*$”、“$**$”和“$+$”的20个程序;48个学时的课程可再参考带“$*$”的5个程序;有更多学时数或深入研究需要的读者可再参考带标注“$**$”的8个程序。带“$+$”的6个程序为与本书内容相关的扩展程序。 上机实验报告格式如下: (1)实验目的:上机实验所涉及并要求等知识点(对应教材《智能感知表达与数据计算》中的内容)。 (2)实验环境:上机实践所使用的平台和相关软件。 (3)实验内容:上机实践内容等。 (4)算法描述及实验步骤:利用流程图等形式表达算法设计思想与算法实现步骤。 (5)上机实验代码 (6)调试过程及实验结果(数据、图表、计算等):详细记录程序在调试过程中出现的问题及解决方法,记录程序执行的结果,上机实验分析。 (7)总结和体会:对上机实践结果进行分析,问题回答,上机的心得体会及改进意见。结论不是具体实验结果的再次罗列,也不是对今后研究的展望,而是针对这一实验所能验证的概念、原则或理论的简明总结,是从实验结果中归纳出的一般性、概括性的判断,要简练、准确、严谨、客观。