数据分析与知识发现

数据分析与知识发现杂志 CSSCI南大期刊 CSCD期刊 统计源期刊

Data Analysis and Knowledge Discovery

杂志简介:《数据分析与知识发现》杂志经新闻出版总署批准,自1980年创刊,国内刊号为10-1478/G2,是一本综合性较强的计算机期刊。该刊是一份月刊,致力于发表计算机领域的高质量原创研究成果、综述及快报。主要栏目:数学图书馆 、知识组织与知识管理、情报分析与研究 、应用实践 、动态、特邀专栏、金融证券管理、企业信息管理技术

主管单位:中国科学院
主办单位:中国科学院文献情报中心
国际刊号:2096-3467
国内刊号:10-1478/G2
全年订价:¥ 1180.00
创刊时间:1980
所属类别:计算机类
发行周期:月刊
发行地区:北京
出版语言:中文
预计审稿时间:1-3个月
综合影响因子:2.25
复合影响因子:1.2
总发文量:1915
总被引量:19495
H指数:18
引用半衰期:4.5254
立即指数:0.1317
期刊他引率:0.9104
平均引文率:21.7126
  • 公开研究数据,保障学术研究的可检验性和可重复性

    作者:张晓林; 彭希珺 刊期:2015年第11期

    学术研究成果必须通过可靠的证据来证明其科学性、可靠性,来支持研究结果的重复验证。但是,许多研究依赖大量、复杂的数据收集、处理、分析、表达,同行评议专家和读者需要了解支撑研究结论的关键数据及其收集、处理、分析和表达过程,否则无法对研究结论的科学性和可靠性做出判断,无法可靠进行重复验证。所以,英国皇家学会明确提出,要保证...

  • 国外通用型数据知识库的政策调研与分析

    作者:刘晶晶; 顾立平; 范少萍 刊期:2015年第11期

    【目的】为机构知识库与数据知识库建立政策规范进行政策调研,为图书馆员推荐数据知识库进行权益分析。【方法】以文献综述方法,进行政策调研与分析,梳理政策要素及其内容。【结果】研究得到管理者的权益与义务(建立审核机制、制定数据识别标准、颁布传播使用规定);提交者的权益(免费存储、更新元数据、设置时滞期)与义务(保证数据来源...

  • 基于用户兴趣模糊聚类的协同过滤算法

    作者:刘占兵; 肖诗斌 刊期:2015年第11期

    【目的】解决传统协同过滤推荐算法存在的数据稀疏性、用户不同时间的兴趣被等同考虑的问题。【方法】提出一种基于用户兴趣模糊聚类的协同过滤算法。将用户兴趣模型分为稳定兴趣和当前兴趣,利用用户稳定兴趣对用户进行模糊聚类,确定用户最近邻,形成初始推荐集;计算推荐列表中各个项目和用户当前兴趣的相似度,然后按照相似度大小排序,生成...

  • 一种基于维基百科的多策略词义消歧方法

    作者:任海英; 于立婷 刊期:2015年第11期

    【目的】提出一种基于维基百科的多策略词义消歧方法,充分利用维基百科中的潜在知识进行消歧。【方法】设计类别一致性、内容相关性以及词义重要程度三个指标,并通过动态熵权线性融合各指标值以及二次消歧的方法来确定歧义词在特定语境的最佳词义。【结果】通过实验,该方法取得了74.82%的准确率,可以验证其有效性。【局限】候选词义粒度较...

  • 谷歌学术可索引开放获取图书

    刊期:2015年第11期

    图书的篇幅较长、计算处理程度相对低下的问题是信息检索的一大挑战。一般来说图书描述的是一项成熟的、完整的科研工作,这不同于期刊论文,期刊论文通常描述的是前期科研工作或是部分的科研工作。用户点击图书时,通常希望快速找出问题的答案。因此,在无法访问整本书的情况下,很难为用户提供一个完美的检索体验。

  • 结合复杂网络的特征权重改进算法研究

    作者:杜坤; 刘怀亮; 郭路杰 刊期:2015年第11期

    【目的】为了更准确计算特征权重,以提高文本相似度计算的准确性。【方法】考虑特征项间的语义关联构造文本复杂网络并进行特征选择,定义类别相关系数并结合特征选择结果,提出一种改进的特征权重计算方法,并进行中文文本分类实验。【结果】对比实验结果表明,本文提出的特征权重改进算法较之TFIDF算法能够取得较好的分类效果。【局限】特征...

  • 基于EM—LDA综合模型的电商微博热点话题发现

    作者:伍万坤; 吴清烈; 顾锦江 刊期:2015年第11期

    【目的】在社交营销环境下,准确且有效地挖掘电商微博中的热点话题。【方法】提出一种综合模型EM-LDA对电商微博文本数据进行主题挖掘。EM-LDA综合模型包含两个子模型:ET-LDA模型和IT-LDA模型,前者对含有哈希标签的微博进行主题挖掘,后者对不含有哈希标签的微博进行主题挖掘。【结果】在确定合适的主题个数之后,标准LDA模型和EM—LDA综合模...

  • 基于模板用户信息搜索行为和统计分析的共谋销量欺诈识别

    作者:王忠群; 乐元; 修宇; 皇苏斌; 汪千松 刊期:2015年第11期

    【目的】针对电子商务推广中出现的共谋虚增销量的欺诈问题,提出一种基于模板用户信息搜索行为和统计分析的共谋销量识别方法。【方法】为了刻画用户在C2C网站购物时的信息搜索行为,提出一种带关键字的用户信息搜索行为模型以及信息搜索行为的相似度计算方法;依据共谋用户信息搜索行为的相似性,提出一种基于层次聚类的欺诈嫌疑挖掘算法;给...

  • 多媒体微博评论信息的主题发现算法研究

    作者:叶川; 马静 刊期:2015年第11期

    【目的】发现微博中图片或视频等多媒体内容的主题特征。【应用背景】多媒体微博的文本内容普遍简短且主题通常蕴含在图片或视频等多媒体内容中,传统的文本挖掘方法不适用于这种多媒体类微博。【方法】通过热点评论扩充该多媒体微博的文本空间,并使用LDA主题模型进行分类推断与主题特征挖掘,使用“主题标签一特征词”的形式表达微博多媒体内...

  • ProQuest将收购Ex Libris

    刊期:2015年第11期

    近日,信息解决方案供应商ProQuest签署了一项协议,将收购全球领先的图书馆自动化解决方案供应商ExLibris集团。强强联合之后,ProQuest公司的专长优势将覆盖印刷、电子和数字内容,图书馆管理、发现和研究工作流解决方案,公司将增强已有的产品,加速新业务的创新,快速解决图书馆界面临的紧迫挑战:印刷、电子和数字内容相分离的工作流,掌控...

  • 媒体干预下带有讨论机制的网络舆情传播模型研究

    作者:张立凡; 赵凯 刊期:2015年第11期

    【目的】通过构建带有讨论机制的舆情传播模型,研究媒体作用下网络舆情演变的内在规律。【方法】把媒体对舆情传播的干预作用抽象为强化度及分歧度,构建新的SIaIbR模型。根据舆情传播动力学方程,求解系统传播阈值,证明传播平衡点的稳定性。【结果】仿真结果显示,分歧度对于传播的影响要远大于强化度,当分歧度低于0.5时候,政府介入有助于...

  • 地域性差异视角下的网站分类用户心智模型空间性研究

    作者:强韶华; 吴鹏 刊期:2015年第11期

    【目的】根据地域差异,发现和验证网站分类目录的组织结构与用户主观认知的相似性特征,支持网站个性化设置。【方法】结合心智模型理论和E1志挖掘方法,利用网站日志数据获取用户认知,利用多维尺度法分析不同地域用户期望的网站分类目录心智模型差异。【结果】结合案例网站提供的数据进行实证研究,验证结果显示不同地域用户的心智模型存在差...

  • 用户在社会化引文软件中的阅读数据积累程度与有效性分析——以Altmetrics指标为例

    作者:金玮; 赵蓉英; 殷鸽 刊期:2015年第11期

    【目的】研究目前Mendeley中文献用户阅读数据是否得到充分积累,及其能否揭示优质文献,对Altmetrics中用户阅读数据指标在科学评估中的价值进行评价。【方法】选定文献集合,对WebofScience、GoogleScholar上被引数目与Mendeley上用户阅读数目进行统计和相关性分析。【结果】在研究集合中,用户阅读数据相比原先得到良好的积累,且和文献被引...

  • 情感分析及可视化方法在网络视频弹幕数据分析中的应用

    作者:郑飓飓; 徐健; 肖卓 刊期:2015年第11期

    【目的】利用情感分析技术提取弹幕评论中包含的情感数据并对其进行可视化,获取网络视频的情感特征及走势。【应用背景】网络视频弹幕中的评论信息经情感分析及可视化处理后可作为视频的情感标签,在此基础上建立基于评论情感的视频检索模式。【方法】利用句子级别的情感分析方法,建立基于情感词典的弹幕情感分析模型,对评论文本进行情感词抽...

  • 第28届全国计算机信息管理学术研讨会在湖北武汉召开

    刊期:2015年第11期

    中国科学技术情报学会信息技术专业委员会于2015年11月4日至6日在湖北省武汉市召开了“第28届全国计算机信息管理学术研讨会”,此次会议由湖北省信息学会承办,来自全国的科研院所和高校共70余名代表参加了会议。