杂志简介:《数据分析与知识发现》杂志经新闻出版总署批准,自1980年创刊,国内刊号为10-1478/G2,是一本综合性较强的计算机期刊。该刊是一份月刊,致力于发表计算机领域的高质量原创研究成果、综述及快报。主要栏目:数学图书馆 、知识组织与知识管理、情报分析与研究 、应用实践 、动态、特邀专栏、金融证券管理、企业信息管理技术
作者:秦怡; 马自卫 刊期:2008年第12期
主要研究和实现CAS模式下的统一认证和门户管理方式,详细阐述统一认证和门户管理的实现机理和工作流程。门户管理包括用户管理、资源管理、系统管理三个:疗面,其中重点介绍用户管理中的角色、权限控制和资源管理中的各种类型资源的管理方法。
刊期:2008年第12期
作者:孟晓川; 马自卫 刊期:2008年第12期
提出数字图书馆门户系统的一种新模式。在研究开源项目Liferay后,提出以Liferay作为多维化门户系统技术平台的实现方案。最后介绍开发的门户系统中所集成的服务。
作者:孟喆; 马自卫 刊期:2008年第12期
介绍0AI协议和开源软件ARC、OAICat,在对OAI—PMH互操作协议和ARC、OAICat的深刻研究的基础上,设计实现开源环境下的数字仓储和服务系统,主要分析研究系统的系统框架和主要功能结构。该系统集成OAI—PMH协议定义的两个角色即数据提供方和服务提供方,并成功集成到数字图书馆集成系统中。
刊期:2008年第12期
作者:李春旺; 肖伟 刊期:2008年第12期
在介绍Web集成融汇概念、技术发展过程的基础上,重点讨论集成融汇模式、组织机制以及当前应用状况,并分析集成融汇所面临的挑战与未来发展趋势。
作者:刘炜; 张春景 刊期:2008年第12期
通过分析传统的规范控制,介绍传统规范控制的功能需求和规范控制的新框架(FRBR),引申出网络资源规范控制的必要性和可行性,最后总结出网络资源规范控制的功能需求和系统架构。
作者:朱亚玲; 贾晓凤 刊期:2008年第12期
针对网格资源动态性、异构性的特点,提出基于双向拍卖进行网格资源管理的方法,构建基于双向拍卖的网格资源分配模型,描述模型中资源用户、用户、网格资源提供者及本地拍卖市场等组件的功能。根据买、卖双方的资源需求,提出双向拍卖算法及资源调度方案,利用资源价格的博弈机制,使交易双方能在不完全的信息环境下,获得各自最大的资源效用。...
作者:史新; 乔晓东; 张志平; 朱礼军 刊期:2008年第12期
对国内外词汇知识的Web服务研究现状进行调研分析,比较OCLC术语服务、英国高级叙词表、FAO多语种农业叙词表、STAR、中文叙词表本体网络术语学服务等国内外主要研究项目。介绍汉语科技词系统的基本架构、数据模型、功能模块和基于Web服务的汉语科技词系统应用模型、接口封装、部署、以及性能测试情况。最后对下一步研究工作进行展望。
作者:陆国丽; 王小华; 王荣波 刊期:2008年第12期
提出一种基于最大词重的文本特征提取与降维算法。其基本思想是利用词在文档库的重要性,通过搜索算法将最大重要性的词从高维文档库中提取出来构成低维文档库,达到特征提取与降维的目的。在此基础上,提出利用模拟退火算法改进的K—means聚类算法对降维得到的文本进行聚类分析,实验结果表明该方法可以有效地提高聚类精度。
刊期:2008年第12期
2008年11月20—21日,由首都医科大学承办的北京高校图书馆“信息服务与技术的新进展、新应用”学术研讨会在京郊召开。本次会议旨在展示北京地区各高校在数字图书馆建设中所取得的成绩,交流各馆的建设经验,为今后数字图书馆的发展提供参考。
作者:吕聚旺; 都云程; 王弘蔚; 施水才 刊期:2008年第12期
针对网页主题信息抽取不够精确的问题,提出一种新型的定义和量化主题信息的方法,即把主题信息分为三种信息形式并对不同形式的信息采用不同的方法进行量化计算。基于上述思想,结合DOM规范和分块思想,在DOM树的基础上提出IB—DOM树,并采用分治思想,先定位到包含主题信息的区域,后过滤噪音信息。实验证明本文提出的方法能够较好地解决主题...
作者:岑咏华; 韩哲; 季培培 刊期:2008年第12期
基于对中文文本信息语法构成尤其是词性搭配的概率特征的分析,提出一种基于双层隐马尔科夫模型的中文泛术语识别和提取的思路和系统框架,并实现相关系统,基于训练语料对多个领域的文本信息进行术语提取测试。实验结果表明,所提出的基于隐马尔科夫模型的中文泛术语识别和提取思想具有较好的实践参考意义。
作者:王曰芬; 徐丹丹; 李飞 刊期:2008年第12期
随着专利数据量的激增和新技术领域的交错重叠,迫切需要在专利信息分析中深化到内容层次,内容挖掘是其中的重要途径和必要手段。借鉴文本内容挖掘的思想和技术,提出基于内容挖掘的专利信息分析的方法体系,分别阐述方法体系中包含的专利文本信息预处理、专利信息内容分析和专利信息知识处理过程的主要步骤及其涉及到的各种技术和算法。最后,...
作者:颜端武; 张秀梅; 邬尚君 刊期:2008年第12期
按照项目研发的规划,在线专利分析软件分成三个子系统开发。前期基于特征项和指标项的子系统的研发初步完成,为了检验软件应用效果并为后续研究提供依据,选择以中兴通讯的专利分析为例,利用自主研发的软件,从自身实力、行业环境、竞争对手三个方面进行专利信息研究,并通过在线专利分析软件的应用达到考察企业技术创新性和竞争性的目的。