数据分析与知识发现

数据分析与知识发现杂志 CSSCI南大期刊 CSCD期刊 统计源期刊

Data Analysis and Knowledge Discovery

杂志简介:《数据分析与知识发现》杂志经新闻出版总署批准,自1980年创刊,国内刊号为10-1478/G2,是一本综合性较强的计算机期刊。该刊是一份月刊,致力于发表计算机领域的高质量原创研究成果、综述及快报。主要栏目:数学图书馆 、知识组织与知识管理、情报分析与研究 、应用实践 、动态、特邀专栏、金融证券管理、企业信息管理技术

主管单位:中国科学院
主办单位:中国科学院文献情报中心
国际刊号:2096-3467
国内刊号:10-1478/G2
全年订价:¥ 1180.00
创刊时间:1980
所属类别:计算机类
发行周期:月刊
发行地区:北京
出版语言:中文
预计审稿时间:1-3个月
综合影响因子:2.25
复合影响因子:1.2
总发文量:1915
总被引量:19495
H指数:18
引用半衰期:4.5254
立即指数:0.1317
期刊他引率:0.9104
平均引文率:21.7126
  • 学科交叉与科学家学术影响力之间的关系研究

    作者:李东; 童寿传; 李江 刊期:2018年第12期

    【目的】从跨学科合作与跨学科引用两个角度,研究学科交叉与科学家学术影响力之间的关系。【方法】以200位国家自然科学基金杰出青年基金入选者收录在Web of Science数据库中的论文为例,视不同学科作者的合著关系为跨学科合作,视不同学科的引用关系为跨学科引用,采用布里渊指数测度跨学科程度,采用H指数、H5指数测度科学家学术影响力,用相关分析...

  • 腾讯AI Lab开源“Tencent ML-Images”项目

    刊期:2018年第12期

    “Tencent ML-Images”项目由多标签图像数据集ML-Images,以及业内目前同类深度学习模型中精度很高的深度残差网络ResNe-101构成。

  • 开放式创新社区用户信息有用性识别研究

    作者:李贺; 祝琳琳; 闫敏; 刘金承; 洪闯 刊期:2018年第12期

    【目的】探究如何从信息数量庞杂冗余、内容质量参差不齐的开放式创新社区中识别出高度有用的用户反馈信息。【方法】以信息采纳模型为理论基础,抓取小米MIUI社区官方论坛23 137条Bug反馈信息作为研究对象,利用二元逻辑回归,从信息质量和信息源可信性两个维度探讨影响开放式创新社区信息有用性的因素。【结果】在信息质量方面,信息及时性对信息...

  • 基于层级交互网络的文本阅读理解与问答方法研究

    作者:程勇; 徐德宽; 吕学强 刊期:2018年第12期

    【目的】实现基于文本阅读理解的精确问答。【方法】提出一种基于层级交互机制的神经网络模型。该模型借鉴人类在阅读理解过程中的思维习惯,将分层处理机制、内容过滤机制、多维注意力机制等人类在阅读时的特性融合到神经网络构建中,提升机器对文本信息的分析和理解能力。【结果】在中文阅读理解评测CMRC 2017的数据上验证本文模型,测试集上的准...

  • 基于文本价格融合模型的股票趋势预测

    作者:余传明; 龚雨田; 王峰; 安璐 刊期:2018年第12期

    【目的】在传统股票预测模型的基础上,提高股票价格预测准确率,降低股票交易风险,研究大数据环境下的股票价格变化趋势。【方法】提出一种新的文本价格融合模型。该模型对股票论坛上的评论文本预处理后,通过深度表示学习生成评论文本的特征矩阵,使用K均值聚类方法生成文本类别;结合开盘价、收盘价等15个原始价格指标,使用多层感知机算法预测股票...

  • 面向学术搜索的交互式知识地图建构研究

    作者:刘萍; 李亚楠; 郁聪 刊期:2018年第12期

    【目的】针对传统学术搜索中分类浏览和关键词搜索分离的局限性,提出一种融合浏览和搜索的交互式知识地图建构方法。【方法】对学术资源进行数学建模,挖掘出文献集合隐含的知识节点及复杂关联关系。在此基础上构建基于用户查询的交互式知识地图,展示核心关联词汇并以概念格的形式展现检索结果。【结果】以2006年–2016年国际SIGIR会议收录的学术...

  • 基于CART决策树的网络问答社区新兴话题识别研究

    作者:程秀峰; 张心怡; 王宁 刊期:2018年第12期

    【目的】协助相关决策部门监督和管理网络舆情,探测可能成为舆情关注焦点的新兴话题。【方法】提出网络问答社区中新兴话题的识别标准和依据,并基于知乎问答社区,利用CART决策树对识别过程进行实证研究。【结果】对于网络问答社区, CART决策树在新兴话题的识别与预测方面具有较好的准确性和适用性。【局限】实验数据只占知乎所有话题板块的一小...

  • 融合社会网络分析与影响力扩散模型的微博意见领袖发现研究

    作者:陈芬; 付希; 何源; 薛春香 刊期:2018年第12期

    【目的】融合社会网络分析与影响力扩散模型,提出一种识别网络意见领袖的改进方法,以更好地引导网络舆情发展。【方法】从社会网络分析出发,在分析网络意见领袖重要指标的基础上,引入用户影响力扩散模型,从意见领袖影响范围和影响深度两方面提出优化的意见领袖发现模型。【结果】与单一的中心性分析模型和语义相似度模型对比,融合两种方法的综合...

  • 基于CapsNet的中文文本分类研究

    作者:冯国明; 张晓冬; 刘素辉 刊期:2018年第12期

    【目的】解决长文本的表示问题并将CapsNet应用于中文文本分类任务中,提高分类精度。【方法】针对长文本提出LDA矩阵和词向量体表示法,并结合CapsNet提出基于CapsNet的中文文本分类模型。以搜狗新闻语料与复旦大学文本分类语料作为实验数据,将TextCNN、DNN等模型作为对比对象进行文本分类实验与分析。【结果】CapsNet模型在中文文本分类的各评价...

  • fast.ai整理出人工智能研究领域数据集列表

    刊期:2018年第12期

    数据集对于深度学习模型的重要性不言而喻。然而根据性质、类型、领域的不同,数据集往往散落在不同的资源平台里。fast.ai通过与亚马逊AWS合作,将最重要的数据集集中整理在一处.

  • 改进的DBSCAN聚类算法在社会化标注中的应用

    作者:熊回香; 叶佳鑫; 蒋武轩 刊期:2018年第12期

    【目的】改进DBSCAN算法并验证其在社会化标注中的可行性及有效性。【方法】结合社会化标注的特点,分析标签被用来标注资源的频次及标签的总出现次数,挖掘标签与资源间的联系来改进DBSCAN聚类算法,以改进的算法为基础,实现标签聚类、用户聚类以及用户标签的拓展。【结果】采用豆瓣电影上的数据进行对比实验,改进的DBSCAN算法在应用于社会化标注...

  • Facebook宣布正式推出PyTorch1.0稳定版

    作者:本刊讯 刊期:2018年第12期

    2018年12月初,Facebook正式宣布推出PyTorch1.0稳定版。随着PyTorch生态系统和社群的不断发展,供开发者使用的有趣的新项目和教育资源越来越多。研究人员和工程师可以轻松地充分利用开源深度学习框架的新功能,包括混合前端、改进的分布式训练、用于高性能研究的纯C++前端以及与云平台的深度集成。PyTorch1.0加快了人工智能从研究原型开发到生产...

  • 基于R2RML的STKOS超级科技词表RDF转换实现

    作者:王颖; 吴思竹 刊期:2018年第12期

    【目的】实现STKOS超级科技词表从关系数据库到RDF数据的自动转换。【方法】构建STKOS超级科技词表语义描述模型,针对STKOS超级科技词表的数据存储情况和数据特点,分别建立将科技术语、规范概念、范畴类、来源概念和术语等从关系数据库存储字段转换到RDF数据集的R2RML映射文档,并利用R2RML Parser工具执行自动批量转换。【结果】完成STKOS超级科...

  • 基于网络属性的抗肿瘤药物靶点预测方法及其应用

    作者:范馨月; 崔雷 刊期:2018年第12期

    【目的】旨在发现潜在的抗肿瘤药物作用靶点,为日后临床工作及实验验证提供参考。【方法】从DrugBank数据库获取抗肿瘤药物靶点,结合HPRD数据库中蛋白质相互作用信息,使用Cytoscape建立药物靶点PPI网络并计算网络节点的拓扑属性,使用SPSS单因素分析和Weka信息增益原理筛选拓扑属性变量,采用SMOTE算法处理不平衡数据集问题,利用决策树方法构建抗...

  • 更智能的AI:没有负面数据的机器学习

    作者:本刊讯 刊期:2018年第12期

    来自RIKEN高级智能项目中心的研究团队成功开发了一种新的机器学习方法,允许AI在没有所谓“负面数据”的情况下进行分类,这一发现可能导致各种更广泛的分类任务应用的产生。