数据分析与知识发现

数据分析与知识发现杂志 CSSCI南大期刊 CSCD期刊 统计源期刊

Data Analysis and Knowledge Discovery

杂志简介:《数据分析与知识发现》杂志经新闻出版总署批准,自1980年创刊,国内刊号为10-1478/G2,是一本综合性较强的计算机期刊。该刊是一份月刊,致力于发表计算机领域的高质量原创研究成果、综述及快报。主要栏目:数学图书馆 、知识组织与知识管理、情报分析与研究 、应用实践 、动态、特邀专栏、金融证券管理、企业信息管理技术

主管单位:中国科学院
主办单位:中国科学院文献情报中心
国际刊号:2096-3467
国内刊号:10-1478/G2
全年订价:¥ 1180.00
创刊时间:1980
所属类别:计算机类
发行周期:月刊
发行地区:北京
出版语言:中文
预计审稿时间:1-3个月
综合影响因子:2.25
复合影响因子:1.2
总发文量:1915
总被引量:19495
H指数:18
引用半衰期:4.5254
立即指数:0.1317
期刊他引率:0.9104
平均引文率:21.7126
  • “情报学方法体系构建中的关键技术研究”专题序

    作者:章成志 刊期:2019年第10期

    研究方法是促进学科发展与深入研究的重要推动力,在科学研究过程中扮演着举足轻重的作用。对于情报学这一相对较新的领域,研究方法的重要性不言而喻。国内外的情报事业经过多年的发展,为情报学研究提供非常丰富的实践资源。情报学在研究实践中,已初步形成众多的学术流派、学科基础理论和研究方法。当前,情报学与情报工作中,亟需对情报学的相关方...

  • 基于“过程–问题”视角的情报学方法技术研究——以社会情报学

    作者:朱惠; 王昊; 章成志 刊期:2019年第10期

    【目的】基于大规模情报学文献了解中国情报学方法技术并探讨如何从“过程–问题”这一新视角组织这些方法技术。【方法】构建“过程–问题”视角下的情报学方法技术术语获取和组织模型:解析情报过程及其包含的情报问题;标注文献所属的情报问题;分别采用基于词典和基于模板的抽取方法获得方法技术术语并将结果融合;最终按过程、问题组织这些方法...

  • 学习技术的发展是改善人工智能的关键

    作者:本刊讯 刊期:2019年第10期

    密歇根州立大学研究团队表示:真正达到人类水平的智能技术还有很长的路要走。近期,该团队发表在The American Naturalist上的最新研究探讨了计算机如何能够像自然有机体一样开始学习,这将对许多领域产生影响,包括人工智能领域。“我们知道所有生物都有能力进行某种形式的学习,只是不确定这些能力最开始是如何进化得来的。在虚拟世界中,我们可以...

  • 基于学术论文全文的创新研究评价句抽取研究

    作者:章成志; 李铮 刊期:2019年第10期

    【目的】依据学术论文全文抽取创新研究评价句,分析创新研究评价句的特征与规律。【方法】以图书情报档案学科为例,将学术期刊论文全文作为实验数据,通过选取标志词、制定抽取规则抽取创新研究评价句。分别从标志词、类型、位置等方面分析创新研究评价句的分布情况。【结果】抽取的创新研究评价句主要可分为6个类型,大多出现在论文前24.8%的位置...

  • 基于深度学习的情报分析方法识别研究——以安全情报领域为例

    作者:肖连杰; 孟涛; 王伟; 吴志祥 刊期:2019年第10期

    【目的】对安全情报领域情报分析方法进行识别、归纳与总结,为构建安全情报领域情报分析方法体系提供参考。【方法】以安全情报领域文献为数据来源,对文献全文本进行汉字级的语料标注,构建安全情报领域情报分析方法语料库,在此基础上利用深度学习模型对情报分析方法实体进行识别。【结果】在安全情报领域情报分析方法语料库上进行实体识别对比实...

  • 欢迎订阅2020年《数据分析与知识发现》(月刊)

    刊期:2019年第10期

    《数据分析与知识发现》杂志是由中国科学院主管、中国科学院文献情报中心主办的学术性专业期刊。刊物原名《现代图书情报技术》,2017年正式更名为《数据分析与知识发现》,致力于为计算机科学、情报科学、管理学领域的研究者提供一个重要的学术交流平台。

  • 面向学术文献全文本的方法论知识抽取系统分析与设计

    作者:徐浩; 朱学芳; 章成志; 江川 刊期:2019年第10期

    【目的】面向学术文献全文本抽取方法论实体,识别其在全文本中的标引特征及使用环境。【方法】基于字典、规则及人工标注的方式抽取包含方法论知识的特征句及方法论实体,借助Visual Studio 2012及SQL Server 2012实现方法论实体抽取核心功能模块。【结果】方法论特征句抽取的准确率为76%,召回率大于42%;每个特征句中约包含1.42个方法论实体,方法...

  • 一种适合多元异构图数据管理系统的交互分析框架

    作者:赵子豪; 沈志宏 刊期:2019年第10期

    【目的】提出一套交互分析框架,以屏蔽多元图数据模型、管理系统、查询接口协议的差异性,提供面向图数据的在线交互分析服务。【方法】对图数据管理系统的服务接口和前端分析需求进行抽象,设计形成开放可扩展的交互协议和总体框架,并实现数据适配、交互分析应用等软件模块。【结果】该框架有效屏蔽了Neo4j、Jena等系统的异构性,并满足图数据浏览...

  • 基于深度迁移网络的Twitter谣言检测研究

    作者:刘勘; 杜好宸 刊期:2019年第10期

    【目的】解决网络谣言分领域检测时某些领域标注数据不足的问题,帮助在无标注数据的领域构建谣言检测模型。【方法】提出一种深度迁移网络,以Multi-BiLSTM网络为基础,加入MMD统计量计算的领域分布差异,训练过程中同时学习源领域的标签损失与领域间的分布差异,完成标签信息在领域间的有效迁移。【结果】相较于未分领域的谣言检测方法和分领域但不...

  • 基于潜在语义索引的Wikidata机构实体聚类研究

    作者:贾君枝; 叶壮壮 刊期:2019年第10期

    【目的】Wikidata机构类目范畴树中,存在实例数目过多而使类目的外延过大、不能明确指示及类分资源的问题。为系统化机构名称层级体系,需将这些实例进行划分,使其均衡分布在机构范畴树的各层。【方法】将无监督的层次聚类算法用于解决无类别标签的机构实例的自动聚簇问题。为消除机构实体名称中特征词共现对聚类算法的影响,引入Wikidata中机构实...

  • Facebook深度学习框架PyTorch 1.3

    作者:本刊讯 刊期:2019年第10期

    在近期举办的PyTorch开发者大会上,Facebook了深度学习框架PyTorch 1.3版本,新版PyTorch增加了重要功能,包括支持移动端部署、8位整数的快速模式量化以及命名张量功能。新版PyTorch不仅受到科研人员的青睐,同时也引起了业界的广泛关注,这主要得益于新版功能对业界支持度的大幅提升。PyTorch 1.3不仅支持安卓、iOS等移动端部署及谷歌云TPU和阿里...

  • 基于用户聚类与动态交互信任关系的好友推荐方法研究

    作者:高慧颖; 魏甜; 刘嘉唯 刊期:2019年第10期

    【目的】利用用户信息和社交网络拓扑信息,提出基于用户聚类与动态交互信任关系进行精准好友推荐的方法。【方法】基于用户信息进行特征向量建模,改进K-Prototypes算法分类型变量的距离计算公式,并使用改进的K-Prototypes算法将最有可能成为好友的用户预先聚为k个簇类,然后在每一簇中基于拓扑社交网络信任关系对目标用户进行好友推荐。从全局信...

  • 基于LDA2Vec和残差网络的跨媒体融合方法研究

    作者:钟庆虹; 乔晓东; 张运良; 翁梦娟 刊期:2019年第10期

    【目的】在跨媒体融合机制的理论基础上,优化特征提取以解决异构数据间的语义鸿沟问题。【方法】基于LDA2Vec和ResNet V2模型分别对文本和图片两种媒体形式进行特征提取,通过语义关联匹配将异构的文本图片特征信息映射到一致性表达空间中,完成检索。【结果】相比使用LDA和SIFT算法进行特征提取的跨媒体融合实验,本文方法将文本、图片相互检索的M...

  • 谷歌含7种语言的全新数据集PAWS和PAWS-X

    作者:本刊讯 刊期:2019年第10期

    近日,谷歌了包含7种语言释义对的全新数据集PAWS与PAWS-X。BERT通过该数据集的训练,在释义对问题上的精度实现了约3倍的提升,其他先进的模型也能够利用该数据集将精度提高到85%-90%。识别一对句子是否为释义对的任务则被称为释义识别,这一任务对于许多实际应用中的自然语言理解而言是非常重要的,例如:常见的问答任务等。但是,目前即使是最先进的...

  • 基于KACC模型的文本分类研究

    作者:李钰曼; 陈志泊; 许福 刊期:2019年第10期

    【目的】通过提高文本内容表示的数据质量,关联文本内容和文本标签向量,从而提高文本分类的效果。【方法】改进关键词的抽取方法,并使用关键词向量表示文本,提出类别标签表示算法对文本类别进行向量化表示,提出基于注意力机制的胶囊网络作为分类器,构建KACC模型,并进行文本分类的对比实验。【结果】KACC模型有效提高了数据质量;实验结果表明,KAC...