企业新闻NEWS

打印工况监测中的统计学较量

更新时间: 2024-11-29 15:22:53  查看次数: 52    
统计学理论可是现代学里很重要的一个分支,它的历史可悠久了。在这么多年的发展过程中,统计学分成了不同的流派。频率学出现得很早,而贝叶斯理论到 17 世纪才慢慢被人关注,在这期间它变成了“贝叶斯公式”。贝叶斯公式在经过拉普拉斯等人进一步研究解释后,才在统计学里流行起来。频率学和贝叶斯理论主要的不同在于对先验概率的统计有不一样的看法,不同的统计学家有不同的统计经验信息,都带着自己的主观想法,那这种做法对不对呢?在频率学派的学者看来,只有一种情况算合适,就是客观地选先验分布,而且要有合适的理论依据,不然统计过程就没客观性了。所以频率学派觉得在概率学统计的时候,概率分布只看数据自身结构的内在联系,模型结构就全由数据分布决定,这就导致很多学者变得懒了,不想深入分析问题。虽然频率学派不看重贝叶斯理论,但是因为它有自己的特殊之处,所以在统计学里也有位置,在实际工程应用里也很重要。贝叶斯理论能用先验分布代替估算标准,把问题框架统一起来,减少建模时间。它靠推论方案和统计决策,不用去找模型的最优化参数,工作效率就提高了。贝叶斯理论对样本量大小都能适应得很好,不管样本多还是少都能用,可频率学派就只能用于大规模样本。
嘉兴3D打印
狄里赫雷混合模型呢,是对提取的频率幅值特征量进行聚类的。上一章用 KNN 方法来给特征量分类,KNN 方法简单又容易做,可它也有缺点。KNN 每次分类或者回归的时候都得算样本点和训练数据的距离,如果数据特别多,那计算时间就很长,效率特别低。在机器学习算法里,KNN 太依赖数据了,如果训练数据里有异常点,等到要预测输出数据的时候,输出的数据可能就不准确,所以 KNN 算法对数据的容错性不好。还有,对于高维数据,KNN 算法处理起来效果也不好,因为随着维度增加,本来相似的两个样本点之间距离会越来越远,可这个算法是根据距离决定输出的,所以对高维数据分类准确性就下降了,对不均衡样本分类准确性也不好。所以就把非参数狄里赫雷混合模型用到频率幅值特征分类里了。
嘉兴3D打印
在狄里赫雷混合模型里,被聚类起来的簇都符合多变量高斯分布,要是有个待测数据进来,这个数据就会被分到概率最大的那个簇里。针对 K 近邻方法的那些缺点,这一章提出了一种基于狄里赫雷混合模型的无监督聚类方法,还把这个方法用在对不同流量比状态的识别上。通过实验能发现,狄里赫雷混合模型对不同流量比的熔融沉积成型打印工况分类准确率挺高的。这里还介绍了狄里赫雷分布、狄里赫雷过程以及模型建立的方法,把这两个方法融合在一起就有了狄里赫雷混合模型。最后用实验里采集的 11 种不同工况下的信号来检验这个混合模型有没有用,结果用狄里赫雷混合模型对提取的不同流量比工况下信号频率幅值特征量分类准确率是 86.8%。