首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
由于越来越多的结构化或半结构化的数据采用XML格式存储和交换,对XML数据的挖掘变得日益重要,其中对XML文档分类的研究越来越广泛。针对目前XML文档基于结构和内容的编辑距离分类算法的不足,本文在计算相似性度量时提出了一种新的改进方法CS-XMLSim方法,使得当XML文档结构相似而内容差异大时(即XML文档集由同一个DTD生成时)分类也有很高的准确率,并应用于k均值算法进行分类。CS-XMLSim方法在计算XML文档相似性时使用欧氏距离度量,其中计算内容相似性度量时运用谱聚类算法进行降维,对偏重于内容的XML文档分类时有更好的效果。实验结果表明,当XML文档结构相似内容差异大时,CS-XMLSim方法在提高分类准确率方面有了明显改善。  相似文献   

2.
针对传统搜索引擎可读性差的状况,在研究搜索引擎原理和聚类算法的基础上,对聚类搜索引擎的体系结构,以及应用于网页聚类的Lingo聚类算法进行了详细探讨。实现了适用于中文的Web搜索结果自动聚类系统。在接口设计和可扩展性设计上,充分考虑到中文环境的特殊性,做了十分有意义的工作。通过试验对比表明采用描述优先的聚类算法对提高系统聚类结果的可读性和可理解性都有很大帮助。  相似文献   

3.
郭磊  杨静  宋乃庆 《心理科学》2018,(3):735-742
聚类分析已成功用于认知诊断评估(CDA)中,使用广泛的聚类分析方法为K-means算法,有研究已证明K-means在CDA中具有较好的聚类效果。而谱聚类算法通常比K-means分类效果更佳,本研究将谱聚类算法引进CDA,探讨了属性层级结构、属性个数、样本量和失误率对该方法的影响。研究发现:(1)谱聚类算法要比K-means提供更好的聚类结果,尤其在实验条件较苛刻时,谱聚类算法更加稳健;(2)线型结构聚类效果最好,收敛型和发散型相近,独立型结构表现较差;(3)属性个数和失误率增加后,聚类效果会下降;(4)样本量增加后,聚类效果有所提升,但K-means方法有时会有反向结果出现。  相似文献   

4.
初级运动区的fMRI实验研究   总被引:1,自引:0,他引:1  
本实验采用功能磁共振为实验仪器,被试进行运动准备和运动执行两种作业活动,实验设计为延时序列运动任务。在对实验数据进行预处理,反卷积、标准化处理后,采用欧式距离公式进行聚类统计,统计结果显示,M1区不仅具有运动执行和运动准备的功能,还发现其他功能区域的激活,不是单纯的运动执行功能,这一区域与三种活动有关。  相似文献   

5.
易学运算(主要是筮法)的小数据、快计算、初始化,演绎与归纳、线性与非线性、确定性与非确定性的结合所形成的简易计算式的中国传统思维模式,与西方大数据、云计算、概率化,算与证、初始与突变、因果与统计的分离所形成的复杂计算式的西方思维模式,虽然都以二进制算法为基础,但却差异巨大,并对各自的文化发展,造成了巨大影响。  相似文献   

6.
本文提出了一种八椭圆人体模型,并在此基础上提出了基于变化信息的步态识别算法。对每个视频序列,采用基于贝叶斯规则的检测算法检测出目标人体区域;将目标人体区域按比例划分为八个区域并分别用椭圆拟合,建立人体椭圆模型;用人体姿势的时空变化——相邻帧间的模型参数的差值作为特征,用归一化后的Mahalanobis距离和Euclidean距离分别进行相似性度量,NN和KNN技术用于最终的分类。实验结果表明,该算法拥有较高的识别率和较低的计算代价。  相似文献   

7.
汪文义  丁树良  宋丽红 《心理学报》2015,47(12):1499-1510
分类是认知诊断评估的一个核心问题。基于观察反应模式与理想反应模式之间的距离的判别方法, 以确定性的理想反应模式为类中心, 而这没有考虑误差, 故未充分利用总体分布信息。为了更充分地利用总体分布信息、提高诊断分类效果和拓展诊断评估的适用性, 本研究提出给定知识状态条件下项目反应模式的条件期望向量为类中心的欧氏距离判别方法, 同时提出认知诊断模型下项目反应函数估计方法以获得这个条件期望向量。模拟研究表明:认知诊断模型下的项目反应函数估计方法得到的条件期望向量返真性较高, 获得的分布信息较准确; 在观察反应模式与理想反应模式差异大的情形下, 基于条件期望向量为类中心的欧氏距离判别方法优于基于理想反应模式为类中心的分类方法(广义距离方法和非参数方法)。研究可为认知诊断分类和等值方法提供一个参考。  相似文献   

8.
RBF神经网络在股价预测中的应用   总被引:4,自引:0,他引:4  
提出了一种基于RBF神经网络的股票价格预测模型。该模型通过对历史股价数据的分析,采用K-均值聚类算法动态确定RBF网络中心,根据梯度下降法进行自适应权值调整。并且根据股价的差异大,时变性强和高度非线性的特点,对RBF网络的学习算法进行了改进,进一步提高了RBF网络的非线性映射能力和自适应能力,最后运用该模型对股票走势进行了预测。  相似文献   

9.
说话人分割与聚类主要应用于两个方面的问题,一方面可以用于自动语音识别的说话人自适应;另一方面可用于说话人检索和富文本转录。主要包括三个过程:有效语音检测、说话人分割以及说话人聚类。本文主要就这三个方面展开叙述,全面地介绍了各类算法。  相似文献   

10.
元分析方法简介   总被引:9,自引:0,他引:9       下载免费PDF全文
近年来,西方心理学、教育学家在对传统感兴趣的研究课题(如性别差异研究)作深入探讨的时候,普遍采用元分析方法对原有众多的报告结果作统计整理,力求从该课题历史上做过的研究结果中得到客观如实的结论.下面,对元分析技术作一介绍.元分析(meta—analysis)这一术语是区别于初始分析(Primary analysis)和进一步分析(secondary analysis)而设置的.初始分析是指起始的研究,包括研究者对某一题目所做数据的收集、数据的加工和结果发表;而进一步分析是指在某一课题范围内不同领域的研究者对同样的数据采取不同观点和不同技法进行的整理分析.  相似文献   

11.
研究通过在纵向诊断数据分析中引入计算简单、耗时少的汉明距离判别法(HDD),提出了纵向HDD (Long-HDD)。与HDD相比,Long-HDD额外使用汉明距离刻画个体在相邻时间点上对属性掌握的相依性,以利用前一时间点信息提高当前时间点的分类准确性。三个模拟研究的结果主要表明:在分析纵向诊断数据时,与参数化模型相比,Long-HDD的分类准确性几乎不受样本量影响,在样本量较小时表现更优;且其计算耗时更少,更有利于提供及时性诊断反馈。实证研究结果表明Long-HDD可用于分析实践测评数据,且其追踪诊断结果与参数化模型的存在一致性。  相似文献   

12.
本文首先简要的阐述了MCMC算法的思想及在IRT参数估计中的操作过程;其次,针对该算法存在的一些问题,提出相应的改进建议;然后,分别运用传统的和改进型的MCMC算法进行模拟数据分析和比较,结果显示新的方法表现更好;最后总结新方法的优点所在,并指出下一步的研究方向。  相似文献   

13.
学习判断准确性的研究方法   总被引:7,自引:0,他引:7       下载免费PDF全文
学习判断是元认知判断的一种重要形式,是指被试对其后测成绩的预测.准确性是学习判断研究的重要问题.学习判断准确性分为绝对准确性和相对准确性.本文重点介绍相对准确性的传统研究方法和修正方法,即预测前回忆和监测法.在比较两种相对准确性的研究方法在数据的收集和分析上的差别,提出传统方法在数据收集过程中只能通过假设推断学习判断判断前的提取过程,修正方法在数据收集时,在学习判断前插入一个回忆阶段,可以监测学习判断判断前的提取过程.应用修正方法使研究者既可分解总的准确性,又可通过加权平均数的算法合成总的准确性.因此该方法有助于研究者更加深入、精确地研究学习判断以及其他元认知判断问题.  相似文献   

14.
以松、太、沪地区明清园墅为研究对象,应用聚类分析方法对园墅营造的选址、规模、景象及造园观念进行相似性聚类,并对聚类结果进行了分析。结果显示,退隐官宦多选择"市隐",而文人多隐居在村庄郊野;造园规模以大中型园为主;园墅的景色以水景与山水景园为主;营造园墅的主要目的是隐逸、自娱以及社交。  相似文献   

15.
人名消歧近来成为自然语言处理中的一个热点问题。由于中文的复杂性,中文人名消歧被认为比英文人名消歧更困难。本文在使用层次凝聚聚类算法的基础上,主要探讨了中文人名的识别对中文人名消歧的影响以及中文人名消歧有效特征的自动提取。实验证明,特征融合是提高系统性能的有效方法。中国中文信息学会与SIGHAN组织的评测表明本文所提出的方法是有效的。  相似文献   

16.
通过转头选中运动目标是虚拟现实(VR)中的常见操作,然而运动目标包含远离和靠近运动,确定两类操作的时间特性差异对设计高效的用户接口有重要的意义。本研究选取17名被试在VR中通过转头将球体光标快速准确地放入水平运动的球体目标内,并改变初始距离、目标容差和目标速度。总时间结果显示,远离运动的操作难度更大,初始距离和目标容差对远离和靠近运动的影响相似,目标速度对两类运动的影响相反。进一步将光标的移动过程划分为加速、减速和调整阶段,结果发现,远离运动的加速和减速时间大于靠近运动,但是两类运动的调整时间接近,并且只有目标容差对两类运动的影响一致。最后构建了总时间与三因素的函数模型,成功解释了两类运动的操作时间特性。本研究证明了远离与靠近运动具有不同的操作时间特性,为两类运动的独立交互设计提供了重要参考。  相似文献   

17.
谈晨皓  王沛  崔诣晨 《心理学报》2017,(9):1206-1218
通过构造虚拟的捐献情境及贸易情境,结合博弈任务,以大学生为被试探讨了名利博弈对象的能力和社会距离对名利博弈中博弈者的博弈行为倾向的影响。结果表明,在捐献情境下,被试在高能力的名利博弈对象面前比在低能力的名利博弈对象面前更倾向于做出接近自己半数报酬的捐献行为,牺牲利益以获取好名声。在贸易情境下存在名利博弈对象的能力与社会距离的交互作用,被试仅在面对低能力的名利博弈对象时会考虑社会距离因素,在社会距离近的名利博弈对象面前比在社会距离远的名利博弈对象面前提出更低的售价,牺牲自己的利益以获得好名声。研究结果初步证实名利博弈对象能力与社会距离对名利博弈具有重要影响以及个体在名利博弈中具有策略性。  相似文献   

18.
临床诊断中的脑电图分析方法可归为两大类:线性分析法与非线性分析法.本文介绍了这两类方法中常用的算法如谱估计、小波分析、混沌分析方法等,分析了这两类方法的特点、优势以及存在的不足.同时讨论了在临床应用中选取这两类方法所出现的问题.提出了将人工势场法用于脑电图分析的新思路,并对研究方案进行了可行性分析.  相似文献   

19.
在押毒品犯人格类型的聚类分析   总被引:10,自引:0,他引:10  
张锋  朱海燕 《心理学报》2002,34(2):96-102
目的 :探讨毒品犯的人格分类模型。方法 :以 378名在押毒品犯接受CPI测验数据为基础 ,在 2 0个变量组成的 2 0维空间内对毒品犯进行Q型聚类。结果 :采用分层聚类中的Q型聚类方法分析在押毒品犯的人格类型 ,得到 3种基本的人格类型 ,经F检验和LSD检验 ,表明 3种人格类型在各分量表上的得分具有十分显著的差异。结论 :怯弱 -不成熟型、独立 -不成熟型和可控制 -不成熟型 3种人格类型是一个有效的分类模型 ;这一分类模型有助于监狱开展对在押毒品犯的分类矫治工作  相似文献   

20.
认知诊断测验组卷方法对提高被试属性掌握模式的判准率至关重要.Henson和Douglas的组卷方法(2005)得到的认知诊断测验判准率不高,没有考虑属性间的层级关系是重要原因.本文提出一种基于属性层级结构的认知诊断组卷方法:首先根据属性层级结构确定待选项目类集合,其次根据新建构的选题指标确定项目类,然后由属性区分被试的能力确定各项目类中题目的数量,并在测验Q阵中放入可达阵.模拟研究表明:新方法比H&D方法在判准率上有很大的提高;新的选题指标比H&D的指标大大缩短计算时间.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号