数据分析与知识发现

数据分析与知识发现杂志 CSSCI南大期刊 CSCD期刊 统计源期刊

Data Analysis and Knowledge Discovery

杂志简介:《数据分析与知识发现》杂志经新闻出版总署批准,自1980年创刊,国内刊号为10-1478/G2,是一本综合性较强的计算机期刊。该刊是一份月刊,致力于发表计算机领域的高质量原创研究成果、综述及快报。主要栏目:数学图书馆 、知识组织与知识管理、情报分析与研究 、应用实践 、动态、特邀专栏、金融证券管理、企业信息管理技术

主管单位:中国科学院
主办单位:中国科学院文献情报中心
国际刊号:2096-3467
国内刊号:10-1478/G2
全年订价:¥ 1180.00
创刊时间:1980
所属类别:计算机类
发行周期:月刊
发行地区:北京
出版语言:中文
预计审稿时间:1-3个月
综合影响因子:2.25
复合影响因子:1.2
总发文量:1915
总被引量:19495
H指数:18
引用半衰期:4.5254
立即指数:0.1317
期刊他引率:0.9104
平均引文率:21.7126
  • 多语言高质量社会化标签生成与聚类

    作者:章成志 刊期:2015年第10期

    随着Web2.0网站的不断兴起,不同语种的社会化标签日益增多。社会化标签是互联网用户对网络上的Web资源进行协同标注的结果,是广大用户从自身角度对文本信息内容的揭示,融入了互联网用户的集体智慧。同时,不同语种用户对Web资源进行标注,促使互联网上的多语言社会化标签资源不断丰富。然而,社会化标签质量参差不齐,存在标签噪声问题,对...

  • 社会化标签质量自动评估研究

    作者:章成志; 李蕾 刊期:2015年第10期

    【目的】对用户标注的大量标签实现自动评估,自动选择或推荐高质量的标签,提高社会化标签应用效果。【方法】现有的标签质量评估研究割裂了标签的内容属性与社会化属性,没有结合标签多方面属性进行综合评估。因此本文以博文标签作为研究对象,融合社会化标签内容属性与社会化属性,利用统计机器模型对社会化标签质量进行自动评估研究。【结果...

  • 科研用户博文关键词标注行为差异研究——以科学网博客为例

    作者:张颖怡; 章成志; 池雪花; 李蕾 刊期:2015年第10期

    【目的】为优化标注系统提供依据,同时丰富网络环境下用户标注行为的研究。【应用背景】不同人群的关键词标注行为差异研究是用户信息行为研究中的一个重要方面。【方法】从标注系统使用方式、关键词结构以及标注动机三个角度选取关键词标注比率、用户标注关键词比率、用户标注关键词平均个数、用户标注关键词平均长度以及用户标注关键词重用率...

  • 区分标签质量的机器生成标签聚类研究

    作者:章成志; 顾晓雪 刊期:2015年第10期

    【目的】常规的标签或词语聚类没有考虑聚类对象的质量差异对聚类效果的影响,本文旨在分析不同质量的机器生成标签的聚类效果差异,并提出融合标签质量的标签聚类算法优化建议。【方法】首先,抓取Engadet中英文博客数据,对其进行数据预处理得到候选标签,抽取标签社会化特征与内容特征并进行权重计算,采用两种标签质量区分策略,得到不同质...

  • 标注内容与用户属性结合的标签聚类研究

    作者:顾晓雪; 章成志 刊期:2015年第10期

    【目的】研究标签聚类中标注内容与用户属性及其结合对聚类效果的影响。【方法】采用科学网博客数据,对其进行特征抽取、模型构建和相似度计算,利用线性函数和Sigmod函数进行相似度加权,并使用AP聚类算法进行标签聚类。【结果】在学科分类体系下,用户属性与标注内容的结合均对标签聚类的结果有所提升,Sigmod加权表现最优;在系统分类体系下...

  • 奥地利学者可以在1600多种Springer期刊上发表开放获取论文

    刊期:2015年第10期

    Springer和奥地利高校图书馆联盟(AALC/KooperationE—MedienOsterreich/KEMO)达成了一个新的范围更广的协定,这一Springer协定(SpringerCompact)将从2016年一直持续到2018年。Springer协定将阅读和开放获取出版进行绑定,以年费的形式支付。联盟的成员可以访问2000多种Springer期刊,并且可以在1600多种Springer期刊上发表开放获取论文...

  • Hashtag研究综述

    作者:邵健; 章成志; 李蕾 刊期:2015年第10期

    【目的】分析当前Hashtag研究思路和技术,归纳和总结当前Hashtag研究中所存在的问题。并提炼Hashtag研究的理论意义与实际意义,为更深入的Hashtag研究提供参考。【文献范围】以2007年至2015年的国际会议和国内外期刊的60篇文献作为主要研究对象。【方法】调研Hashtag研究及其应用的相关文献,对Hashtag研究中各环节涉及的方法进行分析和总结。...

  • 考虑信任与权威影响的社会网络-舆论协同演化的研究

    作者:朱侯 刊期:2015年第10期

    【目的】分析在信任和权威两种心理机制作用下,舆论与社会网络结构的协同演化规律。【方法】采用相对协议模型表达舆论交互机制,并设计信任和权威的心理计算模型,通过计算机模拟信任和权威影响下舆论和网络结构的协同演化过程。【结果】动态网络的情景下,舆论的一致性不如静态网络,个体之间更容易因观点偏好的差异形成非正式的局部团体;个...

  • 负面事件中的品牌网络口碑溢出效应研究——以“圆通夺命快递”事件为例

    作者:何跃; 宋灵犀; 齐丽云 刊期:2015年第10期

    【目的】研究网络口碑对企业品牌的溢出效应,为企业及时调整公关策略应对风险提供依据。【方法】利用信息熵建立负面事件中网络口碑溢出效应评价指标体系,以“圆通夺命快递”事件为例,对网络口碑溢出效应方向与强度进行对比分析。【结果】实证结果表明,用户在整个事件发展过程中具有强烈的负面情感倾向;事件对竞争品牌的溢出效应强度和方向...

  • 一种基于主成分分析和随机森林的刷客识别方法

    作者:张李义; 张皎 刊期:2015年第10期

    【目的】针对刷客识别的指标维数较高,识别的准确率和效率较低的问题,提出新的识别模型,提高刷客的识别准确率和效率。【方法】采用主成分分析法对用户指标进行降维,并运用随机森林算法识别刷客。为了反映该模型在刷客识别方面的优越性,分别建立基于K近邻判断分析、支持向量机理论的识别模型,用相同的数据针对不同模型进行训练,比较不同...

  • 社会网络三元结构中关注影响力研究——以学生关系网络为例

    作者:吴江; 张劲帆 刊期:2015年第10期

    【目的】研究线下关系网络中不同三元结构对关系形成中关注影响力的作用。【方法】通过对221名学生在不同时间的问卷调查,得到一个学生关系网络的动态演化过程,进而统计分析不同三元结构对关系形成的关注影响力的作用程度。【结果】使用线下数据得到的分析结果与之前线上数据研究结果一致,即三元结构中存在互惠性、传递性以及反关系,更容易...

  • 自动标注中文专利的引文信息

    作者:姜春涛 刊期:2015年第10期

    【目的】自动标注嵌入中文专利文本中的专利、标准、学术论文、其他专著4类引用信息。【方法】对于专利、标准和其他专著的引用,应用模式匹配的方法标注;对于学术论文的引用,应用由两阶段构成的机器学习方法标注,自动检测含有引用的句子,并从中自动提取6类文献特征信息。【结果】10层交叉验证的结果表明:专利引用标注的精确度和查全度均为...

  • 康奈尔大学图书馆与ProQuest合作改善图书采购效率

    刊期:2015年第10期

    ProQuest正与康奈尔大学图书馆展开合作,试图开发动态的图书选择系统,将来自多源头的图书元数据聚集到一个单一的简化界面,从而提高图书采购工作效率。简化界面是康奈尔大学图书馆新协议的一部分,这一新协议规定康奈尔大学图书馆将使用ProQuest作为其英语语种的印刷图书的主要来源,这是康奈尔大学图书馆与Coutts信息服务商长期以来的需求驱...

  • 新能源汽车领域中文术语抽取方法

    作者:何宇; 吕学强; 徐丽萍 刊期:2015年第10期

    【目的】为提高新能源汽车领域中文术语抽取结果的准确率和召回率,提出一种适合该领域的术语抽取方法。【方法】在总结前人工作基础上,提出利用条件随机场模型作为抽取模型,选取词、词长、词性、依存关系、词典位置、停用词等特征作为特征模板。【结果】实验结果正确率为93.12%,召回率为90.47%。正确率比Baseline方法提高7.73%。【局...

  • 科技知识组织体系开放引擎系统的设计与实现

    作者:王颖; 张智雄; 李传席; 刘毅; 汤怡洁; 周子健; 钱力; 付鸿鹄 刊期:2015年第10期

    【目的】为实现科技知识组织体系(STKOS)的共享和利用。【应用背景】构建知识组织体系有机存储与访问的引擎系统是实现知识组织体系有效利用的前提条件。【方法】构建支持STKOS各类元素检索、浏览、关联、导航的语义存储与索引体系、语义查询与推理内核以及STKOSAPI,并对外提供开放查询与推理接口。【结果】该引擎系统支持STKOS服务平台建设...