数据分析与知识发现

数据分析与知识发现杂志 CSSCI南大期刊 CSCD期刊 统计源期刊

Data Analysis and Knowledge Discovery

杂志简介:《数据分析与知识发现》杂志经新闻出版总署批准,自1980年创刊,国内刊号为10-1478/G2,是一本综合性较强的计算机期刊。该刊是一份月刊,致力于发表计算机领域的高质量原创研究成果、综述及快报。主要栏目:数学图书馆 、知识组织与知识管理、情报分析与研究 、应用实践 、动态、特邀专栏、金融证券管理、企业信息管理技术

主管单位:中国科学院
主办单位:中国科学院文献情报中心
国际刊号:2096-3467
国内刊号:10-1478/G2
全年订价:¥ 1180.00
创刊时间:1980
所属类别:计算机类
发行周期:月刊
发行地区:北京
出版语言:中文
预计审稿时间:1-3个月
综合影响因子:2.25
复合影响因子:1.2
总发文量:1915
总被引量:19495
H指数:18
引用半衰期:4.5254
立即指数:0.1317
期刊他引率:0.9104
平均引文率:21.7126
  • 基于用户生成内容的潜在客户识别方法

    作者:蒋翠清; 宋凯伦; 丁勇; 刘尧 刊期:2018年第03期

    【目的】从产品论坛中识别潜在客户,对产品论坛中的用户生成内容特征进行分析,识别有购买意愿的产品潜在客户。【方法】将不均衡数据集转换为n个均衡数据集,结合Stacking分类算法识别潜在客户,分别使用基分类器算法和本文提出的针对不均衡数据集的Stacking分类算法对样本数据进行测试,并通过对比F值验证本文算法的有效性。【结果】本文提出的算...

  • 基于ESSVM的分类推荐

    作者:侯君; 刘魁; 李千目 刊期:2018年第03期

    【目的】解决传统的兴趣点推荐基于简单上下文,推荐同一类别中最流行的、最便宜或者最接近的对象,导致推荐准确度低的问题。【方法】将兴趣点推荐作为一个排序问题,设计基于内嵌空间排序支持向量机模型(Embedded Space Ranking SVM,ESSVM),根据不同特征进行兴趣点分类,利用签到数据捕获用户的喜好,并使用机器学习模型调整不同属性在排序中的重...

  • 学术成果主题新颖性测度方法研究——基于Doc2Vec和HMM算法

    作者:逯万辉; 谭宗颖 刊期:2018年第03期

    【目的】进一步研究和构建学术成果主题新颖性测度指标,量化地测度学术成果的主题新颖性。【方法】构建基于Doc2Vec和HMM的文本内容特征因子计算模型,通过该内容特征因子构造文档的主题新颖性测度指标函数。基于《情报学报》、《情报科学》和《情报杂志》三本期刊2014年度所刊载的学术论文进行实证研究,测度论文的主题新颖性。【结果】将该方法...

  • 研究表明:人们愿意为管理自己的在线社交形象而付费

    刊期:2018年第03期

    社交媒体为人们提供了一个全新的环境,在这个环境下,人们可以自由地编辑出自己想呈现给世人的模样。瑞典隆德大学的一项研究表明,人们为了管理自己的在线社交形象,愿意为过滤掉其中的不利信息而付费。研究人员调查了人们如何使用博弈论来管理自己的在线社交形象。此前,已有类似的研究,例如:匿名如何影响人们的亲社会行为意愿,并因此影响人们对...

  • 基于论文自动分类的社科类学科跨学科性研究

    作者:刘浏; 王东波 刊期:2018年第03期

    【目的】使用机器学习自动分类的方法,量化社科类论文的跨学科性。【方法】根据论文的题录信息,使用KNN算法对社科类论文进行自动分类,根据分类结果提出定量研究跨学科性的指标——跨学科度,并提出其计算方法。【结果】自动分类结果在各学科间呈现出较大的差异,各学科的跨学科性对分类结果产生了较大的影响,自动分类结果与跨学科度之间存在直接...

  • 一种截断距离和聚类中心自适应的聚类算法

    作者:杨震; 王红军; 周宇 刊期:2018年第03期

    【目的】研究一种新的聚类算法,以改进密度峰值聚类算法无法自动计算截断距离以及需要人工参与选择聚类中心的不足。【方法】首先提出一种基于信息熵的截断距离自适应算法,实现了DPC算法截断距离的自适应;然后根据排序图中权值的斜率变化趋势确定拐点,自动划分出聚类中心与非聚类中心的界限,实现聚类中心的自动选择。【结果】通过在UCI数据集与...

  • 基于图像特征匹配的推荐模型研究

    作者:刘东苏; 霍辰辉 刊期:2018年第03期

    【目的】基于LSH算法将图像匹配应用到图像推荐模型中,与传统推荐模型结合,提高推荐结果准确度。【方法】提取图像SIFT特征作为图像匹配标准,改进基于p-Stable Distribution的LSH算法,实现高维度下大量图片的搜索匹配,最后融合现有协同过滤算法提出ICF-LSH推荐算法构建融合推荐模型,并采用Python语言予以实现。【结果】使用不同的数据集对本文提...

  • 研究人员试图教会计算机向人类一样学习

    刊期:2018年第03期

    近日,美国德州大学开放云研究所的一项新研究,描述了一种新的基于云的人工智能学习平台,能教导机器像人类一样学习。认知学习指的是教会电脑如何进行学习,该研究展示了一个全新的机器学习平台,能教导计算机学会人类的学习方式。

  • 基于速度优化和社区偏向的标签传播算法

    作者:张素琪; 高星; 霍士杰; 郭京津; 顾军华 刊期:2018年第03期

    【目的】减少标签传播算法的无效更新、解决算法准确率低的问题。【方法】引入节点信息列表以指导更新过程,避免不必要的更新,从而加快执行速度;采取基于节点对社区偏向程度的更新规则,提高社区划分的准确率。【结果】实验结果表明,相比标签传播算法和两种较好的改进算法,本文提出的基于速度优化和社区偏向的标签传播算法在较大规模网络上的迭代...

  • 基于情感分类的竞争企业新闻文本主题挖掘

    作者:王树义; 廖桦涛; 吴查科 刊期:2018年第03期

    【目的】在竞争情报分析中,改进新闻报道信息主题识别效率,降低情报搜集成本,提升分析的即时性。【应用背景】适用于企业竞争情报人员通过新闻媒体对企业自身和竞争对手的报道抓取和主题识别,及时感知重要动态。【方法】使用情感分析API对爬取的新闻报道数据做出分类,利用LDA识别主题,并进行可视化分析。采用Python完成数据采集、清洗、分析与可...

  • 基于文本挖掘的药物副作用知识发现研究

    作者:范馨月; 崔雷 刊期:2018年第03期

    【目的】利用文本挖掘方法发现潜在的药物–副作用关系,为完善现有药物–副作用数据库及药物副作用早期预测提供有效途径。【方法】从PubMed数据库获取2011年–2016年间与人类药物治疗和副作用相关文献共100 873篇,对文献集进行Perl语言切分处理、基于词典的命名实体识别、R语言生成药物–副作用共现矩阵、gCLUTO双聚类分析等一系列研究。【结果...

  • 最新研究:通过动态微笑辨识性别

    刊期:2018年第03期

    一项最新的研究表明,男性和女性动态微笑的差异是可衡量的,从而使得人工智能仅仅通过微笑便能辨识性别。虽然已有一些自动性别识别的工具存在,但现有方法都是使用静态图像与固定面部特征进行比较从而得出性别。近日,英国布拉德福德大学的一项研究使用动态的微笑来自动识别性别。

  • 基于DTM模型和文本特征分析的基金项目新兴趋势探测研究——以NSF石墨烯领域为例

    作者:徐路路; 王效岳; 白如江; 周彦廷 刊期:2018年第03期

    【目的】为提升科技文献文本内容语义理解,对基金项目文本中的新兴趋势进行探测。【方法】提出一种基于DTM模型和文本特征分析的基金项目新兴趋势探测方法,利用文本挖掘技术深入文本内容并分析基金摘要特征要素,识别主题概率分布并构造基于文本特征要素的新兴主题探测公式,对NSF数据库石墨烯领域中的新兴趋势进行探测与分析。【结果】通过文献调...

  • 基于LDA主题模型的文献关联分析及可视化研究

    作者:王丽; 邹丽雪; 刘细文 刊期:2018年第03期

    【目的】基于机器学习进行有效的科研主题发现与分析建模研究。【方法】以LDA主题模型为基础进行科研主题发现,通过Python语言实现分析建模,关联分析科研主题的年代、机构、基础研究与应用研发等信息,对比披露了各年代、机构的研发重点及基础研究和应用研究的差异,并对结果进行可视化。【结果】基于101 813条石墨烯领域的论文和专利数据进行实证...

  • 机器学习服务比较:谷歌、微软、亚马逊

    刊期:2018年第03期

    服务型导向的机器学习(Machine Learning as a Service,MLaaS)是自动化和半自动化云平台的一个概括性定义,这个云平台范围很广,包含数据预处理、模型训练、模型评估、以及预测。而且预测结果可以通过REST API与其他IT系统进行交互。