数据分析与知识发现

数据分析与知识发现杂志 CSSCI南大期刊 CSCD期刊 统计源期刊

Data Analysis and Knowledge Discovery

杂志简介:《数据分析与知识发现》杂志经新闻出版总署批准,自1980年创刊,国内刊号为10-1478/G2,是一本综合性较强的计算机期刊。该刊是一份月刊,致力于发表计算机领域的高质量原创研究成果、综述及快报。主要栏目:数学图书馆 、知识组织与知识管理、情报分析与研究 、应用实践 、动态、特邀专栏、金融证券管理、企业信息管理技术

主管单位:中国科学院
主办单位:中国科学院文献情报中心
国际刊号:2096-3467
国内刊号:10-1478/G2
全年订价:¥ 1180.00
创刊时间:1980
所属类别:计算机类
发行周期:月刊
发行地区:北京
出版语言:中文
预计审稿时间:1-3个月
综合影响因子:2.25
复合影响因子:1.2
总发文量:1915
总被引量:19495
H指数:18
引用半衰期:4.5254
立即指数:0.1317
期刊他引率:0.9104
平均引文率:21.7126
  • 国内外健康问答社区用户信息需求对比研究--基于主题和时间视角的实证分析

    作者:石静; 厉臣璐; 钱宇星; 周利琴; 张斌 刊期:2019年第05期

    【目的】识别并对比分析国内外健康问答社区用户信息需求,总结演变规律和探究演变原因。【方法】选取"慢友帮"和"Daily Strength"糖尿病群组用户问答数据,基于主题和时间视角,利用主题编码、社会网络和内容分析方法,对比分析主题分布、演化及共现规律。【结果】国内外社区用户核心需求都是"疾病如何治疗";且对于慢性病社区而言,"饮食"主题与其共...

  • 引入新闻短文本的个股走势预测模型

    作者:张梦吉; 杜婉钰; 郑楠 刊期:2019年第05期

    【目的】结合深度学习,分析股市数值数据和财经新闻,提高股票涨跌预测准确率。【方法】建立基于事件的新闻分类模型,使用多输入的循环神经网络建立基于新闻事件、资金流向和公司财务的个股走势预测模型,提升股票预测准确率。【结果】引入新闻文本后模型预测准确率进一步提升,其中,采矿业准确率达到76.22%,医药制造业准确率达到77.36%。【局限】...

  • 基于数据挖掘方法的HEDONIC房屋价格评估模型--以美国城市西雅图为例

    作者:陈万成; 戴浩然; 金映含 刊期:2019年第05期

    【目的】依据HEDONIC理论,利用不同类型特征构建商品房价格评估模型,为房屋价格评估工作提供一个效率更高、成本更低、准确性更高的解决方案。【方法】利用空间分析方法,对预处理后的数据构造并选取重要特征,基于随机森林、神经网络以及KNN建立融合模型。【结果】分析西雅图2014年至2015年商品房价格评估结果可以得出:该模型明显优于线性HEDONIC...

  • 关于实体解析基本方法的研究和述评

    作者:高广尚 刊期:2019年第05期

    【目的】探讨实体解析理论中经典的实体解析方法及逻辑思路。【文献范围】在GoogleScholar和CNKI中分别以检索词"Entity Resolution"、"Collective Analysis"、"Crowdsourced"、"Active Learning"、"Privacy-Preserving"和"实体解析"进行文献检索,再结合主题筛选,精读并使用追溯法获得实体解析研究的代表性文献共86篇。【方法】针对每种实体解析...

  • 用于科技评价的挪威模型方法与应用综述

    作者:刘强; 陈云伟; 张志强 刊期:2019年第05期

    【目的】对挪威模型进行系统而全面的介绍,为中国相关评价工作的开展提供参考。【方法】通过案例研究,介绍挪威模型的实施方式、除挪威以外其他国家使用该模型的效果和经验、挪威模型在多层面多学科领域的应用效果、挪威模型与其他两种文献计量指标的比较。【结果】挪威模型作为一个与其他国家不同的基于绩效的资助系统,在包括挪威在内的6个欧洲...

  • 篇章级并列关系文本块识别方法研究

    作者:裴晶晶; 乐小虬 刊期:2019年第05期

    【目的】识别出科技论文中分布在不同段落、在语义及版面视觉上具有并列关系的文本块,捕捉并列关系文本特征,为并列关系知识对象识别提供预训练模型。【方法】以段落为处理单元,在字符向量和词向量的基础上附加版面视觉特征,对不同层级具有并列关系的文本进行多维特征表征,利用卷积神经网络(Convolutional Neural Networks, CNN)模型对标注数据...

  • 基于多维政策实体及其关系的科技政策演化路径揭示方法研究

    作者:刘建华; 张智雄; 张琴 刊期:2019年第05期

    【目的】利用科技政策推进中产生的各类文件中的知识内容来揭示政策的演化关系。【方法】基于政策文本中多维政策实体及实体之间的多种关系,构建从直接语义关系、直接共现关系、间接共现关系、关联路径衰减指数4个维度综合计算科技政策实体关联的多指标模型,结合实体时间属性,揭示科技政策演化路径。【结果】揭示了实验议题相关的科技政策举措多...

  • 融合表示学习与机器学习的专利科学引文标题自动抽取研究

    作者:张金柱; 胡一鸣 刊期:2019年第05期

    【目的】针对专利引文类别繁多的问题,研究自动识别其中专利科学引文这一特定类别的方法,进而准确抽取专利科学引文的标题特征项,支撑后续专利科学引文深度分析与挖掘。【方法】引入表示学习方法 Doc2Vec实现专利科学引文整体的语义向量表示,结合机器学习分类方法实现专利科学引文这一特定类别的识别;在此基础上,利用表示学习方法实现专利科学引...

  • 借助深度神经网络框架,人工智能实现终身学习

    作者:本刊 刊期:2019年第05期

    美国陆军某项目的科学家们开发出一种新的深度神经网络框架,实现人工智能系统既能更好地学习新任务,同时降低在先前任务中已学知识的遗忘率。由美国陆军资助的北卡罗来纳州立大学的研究人员证明,使用该框架学习新任务可以使人工智能更好地执行以前的任务,这种现象称为后向传递。研究小组提出“学习成长”新框架用于持续学习,该框架将网络结构学...

  • 基于nBD-SVM模型的投诉短文本分类

    作者:余本功; 陈杨楠; 杨颖 刊期:2019年第05期

    【目的】对投诉短文本进行有效分类以提高问题处理效率。【方法】针对投诉文本所呈现出的弱结构化、长度较短等特征,提出一种结合主题模型和词向量方法构建SVM输入空间向量,并融入集成学习方法的nBD-SVM文本分类模型。【结果】采用企业投诉文本进行实证分析,对比相关分类方法,nBD-SVM准确率可达81.13%,说明其能够有效提升投诉文本分类的准确性和...

  • 基于注意力机制的农业金融文本关系抽取研究

    作者:吴粤敏; 丁港归; 胡滨 刊期:2019年第05期

    【目的】研究中文文本中关系自动抽取的方法。【方法】以224家农业上市公司2015年–2017年的678份年报为数据来源,采用基于双重注意力机制的门控循环单元算法,进行中文文本关系自动抽取研究。【结果】最终模型在农业金融文本数据集上的平均准确率达78%,相较循环神经网络算法,该算法平均准确率提高约12%。【局限】仅针对224家农业上市公司的数据...

  • 隐私忧虑背景下的移动医疗APP使用意愿研究--基于三方博弈的视角

    作者:朱光; 刘虎; 杜欣蒙 刊期:2019年第05期

    【目的】从隐私泄露和隐私保护角度,研究隐私忧虑背景下的移动医疗APP使用意愿问题,分析不同主体行为间的相互影响,提升移动医疗APP的隐私保护水平和患者使用意愿。【方法】运用演化博弈理论,设计由患者、移动医疗APP服务商和政府组成的博弈主体,讨论其在移动医疗APP使用过程中的博弈行为。根据不同行为策略的收益、成本和损失,计算博弈三方的支...

  • 学科交叉研究的演化阶段特征分析--以医学信息学为例

    作者:操玉杰; 毛进; 潘荣清; 巴志超; 李纲 刊期:2019年第05期

    【目的】探究学科交叉研究的演化阶段特征。【方法】以医学信息学为示例学科交叉领域进行演化阶段划分,进而从知识引入和知识产出两方面分析学科交叉度特征,研究知识产出的共词网络结构变化,深度揭示该学科交叉领域的不同演化阶段特征。【结果】医学信息学的萌芽期、发展期和稳定期表现出不同的学科交叉度和共词网络结构特征。在稳定期,知识生长...

  • 专利价值评估与分类研究--基于自组织映射支持向量机

    作者:周成; 魏红芹 刊期:2019年第05期

    【目的】充分利用专利数据,研究专利价值评估和分类问题。【方法】根据专利的价值指标,设计基于自组织映射(SOM)–支持向量机(SVM)的专利价值评估及分类模型,使用自组织映射方法确定专利的价值类别,采用随机森林(RF)对价值指标进行重要性排序,并结合包裹式特征选择方法对价值指标进行约简,以提高SVM的分类性能。【结果】通过SOM确定的价值标签能...

  • 用户隐式行为挖掘在抗信誉共谋中的应用研究

    作者:梁家铭; 赵洁; Jianlong; Zhou; 董振宁 刊期:2019年第05期

    【目的】探究和验证用户隐式行为数据的挖掘方法及结果对信誉共谋攻击识别模型精度提升的效果。【方法】提出用户融合隐式行为分析的总体框架,提取隐式行为特征;设计两阶段综合特征选择方法,选择多个高辨别力的特征。【结果】利用电子商务中的大量数据实验验证了用户隐式行为挖掘在抗信誉共谋中的有效性,对共谋者的识别能力优于显式特征。【局限...