共查询到20条相似文献,搜索用时 15 毫秒
1.
《心智与计算》2010,(3)
由于越来越多的结构化或半结构化的数据采用XML格式存储和交换,对XML数据的挖掘变得日益重要,其中对XML文档分类的研究越来越广泛。针对目前XML文档基于结构和内容的编辑距离分类算法的不足,本文在计算相似性度量时提出了一种新的改进方法CS-XMLSim方法,使得当XML文档结构相似而内容差异大时(即XML文档集由同一个DTD生成时)分类也有很高的准确率,并应用于k均值算法进行分类。CS-XMLSim方法在计算XML文档相似性时使用欧氏距离度量,其中计算内容相似性度量时运用谱聚类算法进行降维,对偏重于内容的XML文档分类时有更好的效果。实验结果表明,当XML文档结构相似内容差异大时,CS-XMLSim方法在提高分类准确率方面有了明显改善。 相似文献
2.
3.
聚类分析已成功用于认知诊断评估(CDA)中,使用广泛的聚类分析方法为K-means算法,有研究已证明K-means在CDA中具有较好的聚类效果。而谱聚类算法通常比K-means分类效果更佳,本研究将谱聚类算法引进CDA,探讨了属性层级结构、属性个数、样本量和失误率对该方法的影响。研究发现:(1)谱聚类算法要比K-means提供更好的聚类结果,尤其在实验条件较苛刻时,谱聚类算法更加稳健;(2)线型结构聚类效果最好,收敛型和发散型相近,独立型结构表现较差;(3)属性个数和失误率增加后,聚类效果会下降;(4)样本量增加后,聚类效果有所提升,但K-means方法有时会有反向结果出现。 相似文献
4.
5.
6.
本文提出了一种八椭圆人体模型,并在此基础上提出了基于变化信息的步态识别算法。对每个视频序列,采用基于贝叶斯规则的检测算法检测出目标人体区域;将目标人体区域按比例划分为八个区域并分别用椭圆拟合,建立人体椭圆模型;用人体姿势的时空变化——相邻帧间的模型参数的差值作为特征,用归一化后的Mahalanobis距离和Euclidean距离分别进行相似性度量,NN和KNN技术用于最终的分类。实验结果表明,该算法拥有较高的识别率和较低的计算代价。 相似文献
7.
分类是认知诊断评估的一个核心问题。基于观察反应模式与理想反应模式之间的距离的判别方法, 以确定性的理想反应模式为类中心, 而这没有考虑误差, 故未充分利用总体分布信息。为了更充分地利用总体分布信息、提高诊断分类效果和拓展诊断评估的适用性, 本研究提出给定知识状态条件下项目反应模式的条件期望向量为类中心的欧氏距离判别方法, 同时提出认知诊断模型下项目反应函数估计方法以获得这个条件期望向量。模拟研究表明:认知诊断模型下的项目反应函数估计方法得到的条件期望向量返真性较高, 获得的分布信息较准确; 在观察反应模式与理想反应模式差异大的情形下, 基于条件期望向量为类中心的欧氏距离判别方法优于基于理想反应模式为类中心的分类方法(广义距离方法和非参数方法)。研究可为认知诊断分类和等值方法提供一个参考。 相似文献
8.
RBF神经网络在股价预测中的应用 总被引:4,自引:0,他引:4
提出了一种基于RBF神经网络的股票价格预测模型。该模型通过对历史股价数据的分析,采用K-均值聚类算法动态确定RBF网络中心,根据梯度下降法进行自适应权值调整。并且根据股价的差异大,时变性强和高度非线性的特点,对RBF网络的学习算法进行了改进,进一步提高了RBF网络的非线性映射能力和自适应能力,最后运用该模型对股票走势进行了预测。 相似文献
9.
10.
近年来,西方心理学、教育学家在对传统感兴趣的研究课题(如性别差异研究)作深入探讨的时候,普遍采用元分析方法对原有众多的报告结果作统计整理,力求从该课题历史上做过的研究结果中得到客观如实的结论.下面,对元分析技术作一介绍.元分析(meta—analysis)这一术语是区别于初始分析(Primary analysis)和进一步分析(secondary analysis)而设置的.初始分析是指起始的研究,包括研究者对某一题目所做数据的收集、数据的加工和结果发表;而进一步分析是指在某一课题范围内不同领域的研究者对同样的数据采取不同观点和不同技法进行的整理分析. 相似文献
11.
研究通过在纵向诊断数据分析中引入计算简单、耗时少的汉明距离判别法(HDD),提出了纵向HDD (Long-HDD)。与HDD相比,Long-HDD额外使用汉明距离刻画个体在相邻时间点上对属性掌握的相依性,以利用前一时间点信息提高当前时间点的分类准确性。三个模拟研究的结果主要表明:在分析纵向诊断数据时,与参数化模型相比,Long-HDD的分类准确性几乎不受样本量影响,在样本量较小时表现更优;且其计算耗时更少,更有利于提供及时性诊断反馈。实证研究结果表明Long-HDD可用于分析实践测评数据,且其追踪诊断结果与参数化模型的存在一致性。 相似文献
12.
本文首先简要的阐述了MCMC算法的思想及在IRT参数估计中的操作过程;其次,针对该算法存在的一些问题,提出相应的改进建议;然后,分别运用传统的和改进型的MCMC算法进行模拟数据分析和比较,结果显示新的方法表现更好;最后总结新方法的优点所在,并指出下一步的研究方向。 相似文献
13.
学习判断是元认知判断的一种重要形式,是指被试对其后测成绩的预测.准确性是学习判断研究的重要问题.学习判断准确性分为绝对准确性和相对准确性.本文重点介绍相对准确性的传统研究方法和修正方法,即预测前回忆和监测法.在比较两种相对准确性的研究方法在数据的收集和分析上的差别,提出传统方法在数据收集过程中只能通过假设推断学习判断判断前的提取过程,修正方法在数据收集时,在学习判断前插入一个回忆阶段,可以监测学习判断判断前的提取过程.应用修正方法使研究者既可分解总的准确性,又可通过加权平均数的算法合成总的准确性.因此该方法有助于研究者更加深入、精确地研究学习判断以及其他元认知判断问题. 相似文献
14.
以松、太、沪地区明清园墅为研究对象,应用聚类分析方法对园墅营造的选址、规模、景象及造园观念进行相似性聚类,并对聚类结果进行了分析。结果显示,退隐官宦多选择"市隐",而文人多隐居在村庄郊野;造园规模以大中型园为主;园墅的景色以水景与山水景园为主;营造园墅的主要目的是隐逸、自娱以及社交。 相似文献
15.
16.
通过转头选中运动目标是虚拟现实(VR)中的常见操作,然而运动目标包含远离和靠近运动,确定两类操作的时间特性差异对设计高效的用户接口有重要的意义。本研究选取17名被试在VR中通过转头将球体光标快速准确地放入水平运动的球体目标内,并改变初始距离、目标容差和目标速度。总时间结果显示,远离运动的操作难度更大,初始距离和目标容差对远离和靠近运动的影响相似,目标速度对两类运动的影响相反。进一步将光标的移动过程划分为加速、减速和调整阶段,结果发现,远离运动的加速和减速时间大于靠近运动,但是两类运动的调整时间接近,并且只有目标容差对两类运动的影响一致。最后构建了总时间与三因素的函数模型,成功解释了两类运动的操作时间特性。本研究证明了远离与靠近运动具有不同的操作时间特性,为两类运动的独立交互设计提供了重要参考。 相似文献
17.
通过构造虚拟的捐献情境及贸易情境,结合博弈任务,以大学生为被试探讨了名利博弈对象的能力和社会距离对名利博弈中博弈者的博弈行为倾向的影响。结果表明,在捐献情境下,被试在高能力的名利博弈对象面前比在低能力的名利博弈对象面前更倾向于做出接近自己半数报酬的捐献行为,牺牲利益以获取好名声。在贸易情境下存在名利博弈对象的能力与社会距离的交互作用,被试仅在面对低能力的名利博弈对象时会考虑社会距离因素,在社会距离近的名利博弈对象面前比在社会距离远的名利博弈对象面前提出更低的售价,牺牲自己的利益以获得好名声。研究结果初步证实名利博弈对象能力与社会距离对名利博弈具有重要影响以及个体在名利博弈中具有策略性。 相似文献
18.
19.
在押毒品犯人格类型的聚类分析 总被引:10,自引:0,他引:10
目的 :探讨毒品犯的人格分类模型。方法 :以 378名在押毒品犯接受CPI测验数据为基础 ,在 2 0个变量组成的 2 0维空间内对毒品犯进行Q型聚类。结果 :采用分层聚类中的Q型聚类方法分析在押毒品犯的人格类型 ,得到 3种基本的人格类型 ,经F检验和LSD检验 ,表明 3种人格类型在各分量表上的得分具有十分显著的差异。结论 :怯弱 -不成熟型、独立 -不成熟型和可控制 -不成熟型 3种人格类型是一个有效的分类模型 ;这一分类模型有助于监狱开展对在押毒品犯的分类矫治工作 相似文献
20.