数据分析与知识发现

数据分析与知识发现杂志 CSSCI南大期刊 CSCD期刊 统计源期刊

Data Analysis and Knowledge Discovery

杂志简介:《数据分析与知识发现》杂志经新闻出版总署批准,自1980年创刊,国内刊号为10-1478/G2,是一本综合性较强的计算机期刊。该刊是一份月刊,致力于发表计算机领域的高质量原创研究成果、综述及快报。主要栏目:数学图书馆 、知识组织与知识管理、情报分析与研究 、应用实践 、动态、特邀专栏、金融证券管理、企业信息管理技术

主管单位:中国科学院
主办单位:中国科学院文献情报中心
国际刊号:2096-3467
国内刊号:10-1478/G2
全年订价:¥ 1180.00
创刊时间:1980
所属类别:计算机类
发行周期:月刊
发行地区:北京
出版语言:中文
预计审稿时间:1-3个月
综合影响因子:2.25
复合影响因子:1.2
总发文量:1915
总被引量:19495
H指数:18
引用半衰期:4.5254
立即指数:0.1317
期刊他引率:0.9104
平均引文率:21.7126
  • “电子商务与大数据”专题序

    作者:赵杨; 张李义 刊期:2018年第11期

    互联网和电子商务的快速发展在改变人们消费习惯的同时,也在不断地向上下游产业延伸,从而促进数字经济的发展。新技术、新模式、新业态在中国的不断创新使得我国互联网和电子商务的发展位居世界前列,特别是电子商务产生海量的实际数据,为商业数据分析、人工智能和机器学习提供了真实的试验场景,吸引了许多国内外学者关注相关的学术问题,将中国互...

  • 基于机器学习混合算法的APP广告转化率预测研究

    作者:赵杨; 袁析妮; 陈亚文; 武立强 刊期:2018年第11期

    【目的】利用机器学习算法对APP广告转化率进行有效预测,提高广告投放效果,更好地开展营销活动。【方法】针对APP广告特性,综合应用梯度提升决策树、随机森林、LightGBM、XGBoost、场感知因子分解机模型、Vowpal Wabbit等机器学习算法构建APP广告转化率预测模型--RF+LXFV使用腾讯APP广告数据对模型的有效性与精确性进行检验。【结果】通过对比预...

  • 新消费者重复购买意向预测研究

    作者:张李义; 李一然; 文璇 刊期:2018年第11期

    【目的】比较不同算法的预测准确率和效率,以准确预测有重复购买意向的新消费者,为客户分类提供理论依据。【方法】基于淘宝网某店铺2015年5月-2018年5月的后台数据,结合订单与消费者信息,采用不同的机器学习算法分别进行训练。【结果】融合SMOTE算法与随机森林算法的预测准确率最高,达到96%。【局限】数据量较小,属性类别不够全面。【结论】基...

  • Google开源BERT模型源代码

    作者:本刊讯 刊期:2018年第11期

    近日,Google了包括“BERT模型资料库”。BERT是一种对语言表征进行预训练的方法,即是经过大型文本语料库(如维基百科)训练后获得的通用“语言理解”模型,该模型可用于自然语言处理下游任务(如自动问答)。BERT之所以表现得比过往的方法要好,是因为它是首个用于自然语言处理预训练的无监督、深度双向系统。

  • 基于在线评论情感分析的海淘APP用户满意度研究

    作者:赵杨; 李齐齐; 陈雨涵; 曹文航 刊期:2018年第11期

    【目的】对用户在线评论文本进行情感分析,评价用户满意度,为海淘APP运营商提供对策建议。【方法】基于APP Store上的海淘APP用户在线评论数据,采用Canopy+K-means方法对海淘APP属性特征进行聚类,确定用户满意度评价维度,进而应用CNN-SVM情感分析模型得到各维度的用户满意度评分。【结果】研究结果表明:影响海淘APP用户满意度最重要的因素是商品...

  • 基于TF-IDF的情境后过滤推荐算法研究——以餐饮业O2O为例

    作者:殷聪; 张李义 刊期:2018年第11期

    【目的】深入研究融合情境信息的个性化推荐,缓解信息过载问题。【方法】本文提出基于TF-IDF的情境后过滤推荐算法,在改进现有算法的基础上,结合情境关联概率和情境普遍重要性构建情境偏好预测模型,对结合项目类别偏好的传统推荐初始评分进行调整生成最终推荐。【结果】以餐饮业为例的实证分析表明:相比改进前的算法,本文算法推荐效果更佳。[局...

  • 大数据背景下基于LMBP算法的供应链绩效评价与优化

    作者:孟虎; 梁晓蓓; 杨以雄; 李敏 刊期:2018年第11期

    [目的】利用反馈神经网络LMBP算法进行供应链绩效评价和优化,为企业提供决策参考。【方法】构建供应链评价模型,利用模型原理和算例J企业的数据,对21项评价指标进行梳理,利用MATLAB编程,验证该算法的有效性并提出相应优化方向。【结果】在供应链管理中应用本文方法能帮助企业及时获取绩效分析结果,提高采购、库存、销售等环节的管理效率,降低企...

  • 区块链可能是大数据安全解决之道

    作者:本刊讯 刊期:2018年第11期

    在2018年10月底举办的中国计算机大会(CNCC 2018)上,Google中日韩文搜索算法的主要设计者吴军带来了题为《超级智能时代》的报告。吴军认为人工智能的发展趋势是“超级人工智能”,未来的世界应该是强连接的,这种强连接在带来大量好处的同时,也会带来隐私隐患、风险和危害,例如,IT巨头掌握并控制大量的数据信息,一旦泄露就会导致巨大的隐私风险;...

  • 共享短租平台商家属性对消费者网络口碑的影响研究

    作者:梁晓蓓; 徐真; 李晶晶 刊期:2018年第11期

    【目的】深人探讨共享短租平台的线上商家属性对网络口碑(eWOM)的影响机制。【方法】以信号理论为基础,基于共享短租平台Airbnb的Python爬虫数据信息,建立泊松回归模型,研究与电子服务质量相关的线上商家属性对消费者eWOM行为的影响。【结果】研究结果表明,商家的特色介绍、售后互动、即时预订、日历更新、回复时间、优质商家、身份认证显著正向...

  • 基于成员合作共现的微信群内部关系研究

    作者:李纲; 王晓; 郭洋 刊期:2018年第11期

    【目的】分析与测算微信群成员之间的隐性关系及其强度,并与显性关系相结合得到全关系以完善微信群内部社会网络刻画。【方法】以微信趣缘群为例,研究群成员之间基于话题的合作共现并将其作为隐性关系的测量指标,借鉴Salton指数计算关系强度。分析成员的话题讨论参与情况和隐性关系分布,对比显性关系网络和全关系网络。【结果】话题讨论情况可以...

  • 基于CSToT模型的科技文献主题发现与演化研究

    作者:何伟林; 奉国和; 谢红玲 刊期:2018年第11期

    【目的】分析某研究领域科技文献在一段时间内的主题结构并追踪其变化。【方法】基于改进的主题模型CSToT(Content Similarity-Topics over Time),以国内情报学领域9种期刊作为数据来源,分析国内情报学领域2012年-2016年的研究主题结构以及其演化过程。【结果】CSToT模型能清晰揭示科技文献主题结构,并获得主题演化关系。对案例数据分析后发现,...

  • 同济大学开源FaceX数据集,包含500余万张卡通人脸表情简笔画

    作者:本刊讯 刊期:2018年第11期

    近日,同济大学“智能大数据可视化实验室”(iDVX Lab)开源了一个包含500余万张卡通人脸表情的高质量简笔画数据集——Facex。该数据集由专业设计师绘制生成,不同于以往的图像数据集(如ImageNet),此次公开的数据全部为SVG格式,完整记录了设计师绘制过程中的笔画,旨在帮助人工智能领域的研究人员训练高质量的绘图机器人。

  • 新能源领域专利转让加权网络中主体间技术交易机会预测

    作者:武玉英; 孙平; 何喜军; 蒋国瑞 刊期:2018年第11期

    【目的】通过挖掘专利转让加权网络主体信息及结构特征对交易机会进行预测,促进技术供需有效对接。【方法】采集新能源领域2012年-2016年数据构建专利转让加权网络,通过熵权法融合网络结构与内容指标,结合网络真实权重与结构权重,利用BP神经网络预测技术交易机会及其权重。【结果】融合结构指标RA与内容指标Cosine的预测精度达到94.28%,在所有指...

  • 基于社会网络分析的网络问答社区知识传播研究

    作者:王忠义; 张鹤铭; 黄京; 李春雅 刊期:2018年第11期

    【目的】通过分析网络问答社区的社会网络结构和知识传播机制,研究节点在网络问答社区的知识传播与学习的效用,从而指导用户在网络问答社区中更高效地学习。【方法】结合社会网络分析方法和熵权法描绘意见领袖的知识能力和传播影响力,而后针对网络问答社区社会网络的小世界特征,在借鉴Cowan模型的基础上建立一个知识传播模型,并通过系统模拟仿真...

  • 基于辅助集的专利主题分析领域停用词选取

    作者:俞琰; 赵乃瑄 刊期:2018年第11期

    【目的】提出一种领域停用词自动选取方法,以提高专利主题分析的区分度和质量。【方法】针对要进行专利主题分析的目标集,引人专利辅助集,提出基于辅助集文档频率和类别熵两个指标,衡量词语在辅助集中分布情况,自动识别领域停用词。【结果】实验结果表明,基于辅助集的领域停用词选取方法能够提高专利主题分析的区分度和质量。【局限】辅助集的选...