数据分析与知识发现

数据分析与知识发现杂志 CSSCI南大期刊 CSCD期刊 统计源期刊

Data Analysis and Knowledge Discovery

杂志简介:《数据分析与知识发现》杂志经新闻出版总署批准,自1980年创刊,国内刊号为10-1478/G2,是一本综合性较强的计算机期刊。该刊是一份月刊,致力于发表计算机领域的高质量原创研究成果、综述及快报。主要栏目:数学图书馆 、知识组织与知识管理、情报分析与研究 、应用实践 、动态、特邀专栏、金融证券管理、企业信息管理技术

主管单位:中国科学院
主办单位:中国科学院文献情报中心
国际刊号:2096-3467
国内刊号:10-1478/G2
全年订价:¥ 1180.00
创刊时间:1980
所属类别:计算机类
发行周期:月刊
发行地区:北京
出版语言:中文
预计审稿时间:1-3个月
综合影响因子:2.25
复合影响因子:1.2
总发文量:1915
总被引量:19495
H指数:18
引用半衰期:4.5254
立即指数:0.1317
期刊他引率:0.9104
平均引文率:21.7126
  • 基于多兴趣特征分析的图书馆个性化图书推荐方法

    作者:马健; 杜泽宇; 李树青 刊期:2012年第06期

    应用渐进遗忘策略和滑动窗口相结合的更新算法等,建立读者的兴趣词库和索引库,进而建立读者的多兴趣特征库。分别计算读者兴趣特征的特征词库以及索引库与书籍的相似度,将这两种方法计算出的相似度进行线性叠加,建立具有可操作性和扩展性的混合推荐算法,从而实现图书馆书籍的个性化推荐方法。该方法综合利用《中图法》中书籍所属的索引类别...

  • 一种基于统计特征面向“类型”主题抓取的网页相关性判断策略研究

    作者:乔建忠 刊期:2012年第06期

    为满足主题爬行器在线分类的轻量化设计要求,提出一种基于多项表示网络文档类型的统计特征实现网页按类型进行主题相关性判断的策略;借助WEKA提供的API,为该主题相关性判断策略设计相应的训练算法和分类算法。通过分类准确率、效率和特征选择实验,证明该主题相关性判断策略的有效性以及5项对类型识别起关键作用的统计特征。

  • 中文生物医学文献主题标引中副主题词自动组配机制探讨

    作者:李军莲; 李丹亚; 孙海霞; 冀玉静; 李芳 刊期:2012年第06期

    简要介绍当前国内外副主题词自动组配的研究现状,提出适用于中文生物医学文献处理的基于拼图一统计学习相结合的副主题词自动组配实现方法,详细阐述分析该混合策略方法的实现机制及实现效果,并指出后续的改进建议。

  • 基于概念格的Folksonomy知识组织研究——关联标签的结构特征分析

    作者:滕广青; 毕强; 高娅 刊期:2012年第06期

    以BibSonomy.org真实数据为研究对象,通过网站“Related Tag”栏分别获取两个梯次的关联标签集合。采用形式概念分析的方法构建关联标签概念格,并基于概念格对关联标签进行聚类分析和关联规则挖掘,以此揭示出关联标签间隐含的概念问关系和潜在的语义关联。对关联标签这一新兴的导航方式中隐含的结构特征进行分析和研究,提出关联标签问存在...

  • 基于菱形思维的概念检索关键词扩展方法研究

    作者:俞小怡; 刘旭; 裘江南; 董锦霞 刊期:2012年第06期

    采用菱形思维方法解决问题的方式,构建基于本体的概念检索模型,给出关键词的物元发散式扩展和扩展词的量化收敛的算法,并设计相关的检验实验,证明该模型能够提高概念检索的查全率和查准率,解决术语中存在的“一义多词”和“一词多义”的问题,同时实现基于本体的检索推荐功能。

  • OverDrive在伦敦书展上报告其图书馆电子书数据

    刊期:2012年第06期

    OverDrive在2012年4月16—18日的伦敦书展上进行了其“大数据”系列报告中的首次报告,该报告分析了几十亿电子书和其他从1万8千家公共和学术图书馆网站收集的数据。OverDrive全球图书馆网络的数据将会提供给成员图书馆以及出版商,这些数据包括有关电子书和数字有声书的标题、流通情况、需求情况、馆藏情况,以及网站流量和一般人口统计特征等...

  • 一种提高中英文混编文本标引准确性的方法

    作者:赵衍; 陈恒 刊期:2012年第06期

    分析生命科学领域中英文混编文本的内在特点,基于控制论原理,提出一种旨在提高中英文混编文本的信息自动标引准确性的整合新方法。该方法包含三个相对独立而又相互联系的部分,即前馈控制、中期控制和反馈控制。实验表明,该新方法可以被成功应用在乙肝专题文献知识数据库的标引中,并能大幅度提高信息标引的准确性。

  • P2P环境下信任社区的形成模型研究

    作者:邢艳艳; 苏静 刊期:2012年第06期

    P2P社区是具有相似兴趣节点的集合,相似兴趣节点聚簇有助于提高资源共享和发现的效率。针对P2P网络中节点特性的差异,社区不一定都能够提供高资源共享率的问题,提出一种基于信任的自组织社区形成模型,从节点间信任的建立、信任值的存储、信任值的计算三个方面具体研究。随着节点问信息共享的频繁程度变化和节点间信任值的动态更新,P2P网络...

  • 无词典中文高频词快速抽取算法

    作者:江华; 苏晓光 刊期:2012年第06期

    在PAT数组的基础上,引入LCP数组记录文本后缀串的相同前缀长度,通过扫描LCP数组快速抽取文本高频词。该算法不依赖于分词词典,通过探测重复出现串来提取高频词,并能够抽取任意重复字符串,对新词、组合词抽取特别有效。实验结果表明,该算法抽取的高频词可以达到较高的可接受率,在与ICTCLAS系统关键词抽取的比较中也有较高的相同率,且在发...

  • 融合社会网络的协同过滤推荐算法研究

    作者:俞琰; 邱广华 刊期:2012年第06期

    针对传统协同过滤推荐算法的数据稀疏性及恶意行为等问题,提出一种新的基于社会网络的协同过滤推荐算法。该算法借助社会网络信息,结合用户信任和用户兴趣,寻找目标用户最近邻居,并以此作为权重,形成项目推荐,以提高推荐的准确度。实验表明,相对于传统的协同过滤算法,该算法可有效缓解稀疏性及恶意行为带来的问题,显著提高推荐系统的推...

  • 微博用户的影响力指数模型

    作者:原福永; 冯静; 符茜茜 刊期:2012年第06期

    以新浪微博为研究对象,提出微博用户的用户影响力指数模型。首先将得到的用户被关注度取代当前存在虚假的用户粉丝数,通过较为合理的用户被关注度计算得到微博用户的用户活跃度与微博影响力,最后将用户活跃度与微博影响力作为用户影响力的影响因子合成微博用户的用户影响力。模型考察用户与用户微博两个角度的多个活动因子。实验结果表明,用...

  • 社会性书签网站的使用者与标签特征初探

    作者:高斌 刊期:2012年第06期

    以Web2.0时代的社会性书签网站的使用者为对象,采用内容分析、Q方法及访谈法,分析其书签及标签使用特征,并依据其标签选择行为,进一步归纳使用者类型及其标签选择特征。根据影响因素的多元性与使用者选择标签取向,初步分析出4种社会性使用者类型,并探讨其社会性特征及在相关系统的应用。

  • 面向云计算平台的在线存储系统研究与实现

    作者:耿胜男; 刘川意; 吴旭 刊期:2012年第06期

    研究基础设施云中的重要组成部分——云存储系统中在线存储系统的设计与实现。本系统的设计遵循REST架构模式,使用cURL、HSQLDB等开源组件实现目录与文件的创建、上传、下载、删除等功能。

  • NISO发表有关未来电子资源管理系统标准的白皮书

    刊期:2012年第06期

    美国国家信息标准组织(National Information Standards Organization,NISO)宣布发表《兑现电子资源管理的承诺:标准和最佳实践讨论文件》,此出版物是NISO电子资源管理数据标准和最佳实践项目的研究成果之一,该项目是数字图书馆联盟电子资源管理倡议(Electronic Resources Management Initiative,ERMI)的后续。项目的主要目标是对标准...

  • 应用Google云消息框架C2DM实现商务信息推送服务

    作者:沈洪洲; 宗乾进; 袁勤俭 刊期:2012年第06期

    针对移动电子商务中商务信息推送存在的信息读取不便和推送成本高等问题,基于Google的云消息框架C2DM,设计并实现一种新的商务信息推送服务。从需求分析与技术思路、手机客户端实现、服务器端实现和服务运行效果等方面进行详细阐述。新的服务可以帮助电子商务企业准确且低成本地向客户推送商务信息,也可以帮助客户利用智能手机方便地接收和查...