RexTk Express是一款文件管理工具,允许用户进行文件的分类和搜索.并同时可以进行硬盘空间的利用分析,通过用户自定的规则自动组织文件。除此之外.程序还能够寻找硬盘中的重复文件,收回更多的可用空间。
作者:MarkNicolett; 胡江路 期刊:《中国工业评论》 2005年第13期
Gartner认为,在评估IT安全管理和缺陷管理技术时,安全经理应当就如何集中资产分类数据,并部署所需的减灾工作流系统,给予慎重思考。
基于概化的概念构成(Generality-based Concept Formation,GCF)是一种分类数据层次聚类算法,对GCF算法提出2点改进。首先,定义了一种新的基于条件概率分布的相似度度量,并用它替代原算法中的相似度,该度量将分类数据进行数值化处理,更精确地反映了数据间的相似程度。其次,提出相似度品质概念,给出了计算公式,相似度品质可与原算法中样本变异系数配合使用,共同确定概化水平。改进算法提高了聚类准确率,同时算法的时间复杂性保持不...
作者:Church; J.M.; 陈云茹 期刊:《世界核心医学期刊文摘·妇产科学分册》 2005年第11期
作者:王占全; 王申康; 华成 期刊:《计算机辅助设计与图形学学报》 2005年第10期
针对空间分类数据的特性,提出一种空间分类数据同位规则挖掘算法.利用空间关系定义数据挖掘中事务的概念,采用多层参与索引搜索空间同位规则,从而实现了对空间分类数据的有效处理.采用文中算法对杭州地区119火灾数据进行实验,并验证了该算法的适用范围和性能.实验表明,该算法可以有效地处理经过离散化后的连续数据.
作者:李阿竹 期刊:《测绘与空间地理信息》 2017年第01期
论述了在朝阳地区地理国情普查任务中,地表覆盖分类数据生产内业的主要流程及技术方法。结合实际作业对地表覆盖分类数据的相关精度要求、采集原则和标准以及编辑的技术手段做出了较为详细的说明,提出了采编过程中影响成果精度的关键问题处理办法,为地理国情普查工作的顺利进行起到了指导作用。
作者:丁祥武; 谭佳; 王梅 期刊:《计算机应用与软件》 2017年第07期
针对大规模、高维、稀疏的分类数据聚类,CLOPE算法相比于传统的聚类算法在聚类质量及运行速度上都有很大的提升。然而CLOPE算法存在聚类的质量不稳定、没有区分每维属性对聚类的贡献度、需要预先指定排斥因子r等问题。为此,提出基于随机顺序迭代和属性加权的分类数据聚类算法(RW-CLOPE)。该算法利用“洗牌”模型对原始数据进行随机排序以排除数据输入顺序对聚类质量的影响。同时,根据信息熵计算各个属性的权重,以区别每维属性对...
介绍客车分类数据配置关系中两种程序设置方法,论述多种特性之间相互约束时分类数据和配置之间的相关性关系,提供分类数据中多种特性之间程序约束的表现方式。
作者:周治平; 朱书伟; 张道文 期刊:《计算机研究与发展》 2016年第11期
针对传统面向分类属性数据的聚类算法大多是对单一指标优化而存在的局限性,将类内和类间信息同时引入到优化过程中,结合多目标优化算法与模糊中心点聚类,提出一种新颖的多目标模糊聚类算法.与传统的基于遗传算法的混合聚类方法不同的是,采用模糊隶属度对染色体进行编码,同时优化2个相对的聚类目标函数获得一组最优解集,并且采用了一种提前终止准则判断算法是否达到稳定状态并停止操作,以减少不必要的计算开销.为了进一步提高算法的...
作者:鞠福琴; 孔为民 期刊:《图书馆学研究》 2007年第07期
本文指出了OPAC分类数据中存在的问题,并对存在问题的原因进行了剖析,提出了改进建议。
SAS是世界上最权威的数据管理与统计分析软件,近年来在健康教育领域应用越来越广泛。在健康教育研究和实践中,经常会就某地区或社区某种疾病的患病率(发病率)进行调查和分析,所得数据常常整理成类似表1的数据形态(sex表示性别,age表示年龄组,pop表示按性别和年龄段分层的总人数,diab表示糖尿病患病人数,hyper表示高血压患病人数),即只知道调查对象按某种特征或特征组合分层的总人数和患病(发病)人数,不能获取每个个...
国内首份《中国城市品牌价值报告》,通过宜居、宜业、宜学、宜商、宜游5项指标15项分类数据,对全国287个地级以上城市的品牌价值进行了分析,排出2007年中国城市品牌价值排行榜。参加论坛的有关专家认为,“五宜指数”应该成为中国城市发展的风向标。
作者:张泽洪; 张伟 期刊:《计算机工程》 2007年第01期
针对许多算法不适合对分类数据进行聚类的特点,提出了一种基于最长频繁闭项集(LFCI)的聚类算法。使用改造后的频繁模式树,得到每个事务的LFCI,由于LFCI的两个重要属性,因此可以将LFCI作为该事务的描述,从而直接得到聚类结果。实验证明了该算法的有效性。
作者:武森; 姜丹丹; 王蔷 期刊:《北京科技大学学报·社会科学版》 2016年第07期
CABOSFVC是一种针对分类属性高维数据的高效聚类算法,该算法采用集合稀疏差异度进行距离计算,并采用稀疏特征向量实现数据压缩.该算法的聚类效果受集合稀疏差异度上限参数的影响,而该参数的选取没有明确的指导.针对该问题提出基于集合稀疏差异度的启发式分类属性数据层次聚类算法(heuristic hierarchical clustering algorithm of categorical data based on sparse feature dissimilarity,HABOS),该方法从聚结型层次聚类思想的...
作者:武森; 王蔷; 姜敏; 魏青 期刊:《工程科学学报》 2013年第08期
针对部分聚类算法对数据输入顺序敏感的问题,定义了不干涉序列指数,提出了应用不干涉序列指数对分类数据进行加权排序的方法,并基于该方法对受数据输入顺序影响的CABOSFV C分类数据高效聚类算法进行改进,提出了考虑加权排序的聚类算法(CABOSFV CSW),消除了算法对数据输入顺序的敏感性.采用UCI基准数据集进行实验,发现应用加权升序排序的CABOSFV CSW算法在处理分类数据时,聚类质量较原始CABOSFV C算法和其他受数据输入顺序影响的...
作者:丁祥武; 郭涛; 王梅; 金冉 期刊:《计算机研究与发展》 2016年第05期
CLOPE 算法在大规模、稀疏、高维的分类数据集的聚类上取得了很好的聚类效果.然而该算法受输入数据的顺序影响,难以获得稳定且全局最优的聚类结果.因此提出一种基于等分划分再排列思想的 p-CLOPE 算法对这一缺陷进行改进.在 p-CLOPE 算法的每一轮迭代过程中,对输入数据集等分为p 部分再排列生成不同顺序的 p !份数据集,对这些数据集分别聚类并选取最优的聚类结果作为下一轮迭代的输入.为了降低上述过程的时间复杂度,提出...
作者:何桢 赵燕 邹峰 期刊:《工业工程》 2008年第01期
系统介绍了当测量数据为属性值数据的情况下,利用一致性比率和Cohen的Kappa统计量对属性值测量系统的重复性和再现性进行分析的过程,并将此方法应用于热敏电热器的玻璃封装过程。通过对其结果进行分析,指出Cohen的Kappa统计量所适用的范围,并就实际中的应用方法与对实际中出现的理解误区进行了系统的解释。
如何解释隐现于列联表中的辛普森悖论,是社会统计分析中一个重要的应用性问题。本文从全概公式出发,演绎了辛普森悖论的消解过程。认为辛普森悖论与其说是“悖论”,不如说是反映了分类数据的非线性特征,是“不可压缩”而压缩的结果。它反映了列联表从高维压缩至低维时的统计信息差异,实质上是欧氏空间的降维问题。
作者:贾俊芳 李德玉 期刊:《微电子学与计算机》 2011年第06期
随着数据规模的不断增大,提高K-modes聚类算法或模糊K-modes聚类算法的运行效率成为了一个重要问题.为了提高其算法执行效率,提出了一种基于分治法的高维分类数据聚类方法.该方法并不是一次性对所有的数据进行聚类,而是将分类数据集分成若干个子集,对每个子集同时进行聚类,最后对聚类结果进行融合以形成最终的聚类结果.实验结果表明大多数情况下较传统的方法在聚类的速度上有显著的提高.
作者:韩凯 王凯波 期刊:《运筹与管理》 2010年第06期
分类数据在企业当中常见、易获取。如何利用分类数据进行过程控制、提升质量水平是当前值得关注的课题。本文基于半导体制造背景,建立了硅片研磨过程模型,在前馈控制系统中引入分类数据,提出了一种基于分类数据的前馈控制算法,并以均方误作为指标,通过理论推导及仿真来研究其性能。结果表明,无论在理想状况下还是分类错误存在的情形下,这种控制算法都能够显著地降低参数波动,大幅提升硅片质量。