数据分析与知识发现

数据分析与知识发现杂志 CSSCI南大期刊 CSCD期刊 统计源期刊

Data Analysis and Knowledge Discovery

杂志简介:《数据分析与知识发现》杂志经新闻出版总署批准,自1980年创刊,国内刊号为10-1478/G2,是一本综合性较强的计算机期刊。该刊是一份月刊,致力于发表计算机领域的高质量原创研究成果、综述及快报。主要栏目:数学图书馆 、知识组织与知识管理、情报分析与研究 、应用实践 、动态、特邀专栏、金融证券管理、企业信息管理技术

主管单位:中国科学院
主办单位:中国科学院文献情报中心
国际刊号:2096-3467
国内刊号:10-1478/G2
全年订价:¥ 1180.00
创刊时间:1980
所属类别:计算机类
发行周期:月刊
发行地区:北京
出版语言:中文
预计审稿时间:1-3个月
综合影响因子:2.25
复合影响因子:1.2
总发文量:1915
总被引量:19495
H指数:18
引用半衰期:4.5254
立即指数:0.1317
期刊他引率:0.9104
平均引文率:21.7126
  • 音乐平台中音乐分类体系的用户心智模型研究——以高校学生群体为例

    作者:薛翔; 赵宇翔 刊期:2019年第02期

    【目的】从用户体验角度探索音乐平台中的音乐分类体系,为音乐平台中音乐分类体系的优化和相应检索模式的设计提出建议。【方法】借鉴心理学领域的心智模型理论,以网易云音乐为实验平台对高校学生群体开展两轮实验,探究用户在实际音乐信息交互行为中关于音乐分类体系的心智模型静态结构。【结果】对实验结果进行聚类分析后,得到多层次型、单层次...

  • 基于计划行为理论的微博用户转发行为影响因素研究

    作者:席林娜; 窦永香 刊期:2019年第02期

    【目的】探究微博用户转发行为的影响因素。【方法】基于计划行为理论,考虑微博所传达情感及微博平台的时间线机制对于用户转发行为的影响,提出研究假设并对其进行验证。【结果】用户情感与微博情感相似度、粉丝量均对微博用户转发行为具有显著影响,微博时间线机制对于用户转发行为几乎没有影响。【局限】对于用户的登录时间采用统一时间节点。...

  • 基于标签的跨领域资源个性化推荐研究

    作者:叶佳鑫; 熊回香 刊期:2019年第02期

    【目的】利用标签间的关系实现跨领域资源推荐。【方法】构建跨领域资源推荐模型,分析标签特性并选择可用于跨领域推荐的标签。以DBSCAN算法结合标签向量实现初步的基于资源类型的跨领域资源推荐,将TF-IDF算法与个性化标签相结合改进初步结果,实现个性化更强的二次推荐。【结果】基于资源推荐的召回率、准确率、F值分别为0.82、0.75、0.78,基于...

  • 微信群会话话题强度计算及演化分析

    作者:汪鸿沁泠; 巴志超; 李纲 刊期:2019年第02期

    【目的】通过探究实际微信群内部的话题结构及演化特征,对微信用户交互行为特点及信息传播规律进行探讨。【方法】以三个典型性微信群对话样本作为研究对象,引入语言学中的会话分析理论,分析微信群会话语言现象及特点,设计基于成员活跃度、交流强度及话轮密度的话题强度计算模型,并进一步探究不同类型的微信群中会话的话题结构特征及演化规律。...

  • 基于微博情感分析的股市加权预测方法研究

    作者:赵明清; 武圣强 刊期:2019年第02期

    【目的】构建基于微博情感分析的股市加权预测模型。【方法】结合百度指数,利用时差相关系数和随机森林选取微博搜索初始关键词,通过爬虫技术获取微博文本,利用文本挖掘技术对微博文本作分词处理,判断分词后的微博情感倾向,分析影响微博影响力的相关因素,以信息增益确定微博权重。【结果】微博情感综合倾向与股票价格变化情形几乎一致且预测准确...

  • 国家图书馆建馆110周年国际学术研讨会征文通知

    作者:国家图书馆 刊期:2019年第02期

    2019年是中华人民共和国成立70周年,也是国家图书馆建馆110周年。为了进一步推动国内外学术交流与合作,深入探讨新时代图书馆事业发展前景,国家图书馆拟于2019年9月9-10日举办建馆110周年国际学术研讨会。会议将以“图书馆·与时代同行”为主题,围绕有关热点问题、研究成果、先进理念、前沿技术等进行深入、广泛的学术交流,并特邀国内外知名专家...

  • 基于主题模型的微藻生物燃料产业链专利技术分析

    作者:张杰; 赵君博; 翟东升; 孙宁宁 刊期:2019年第02期

    【目的】基于主题模型挖掘微藻生物燃料产业链技术及技术继承关系。【方法】构建产业链模型,基于改进的LDA方法实现产业链环节–技术主题–专利映射;统计研发主体,分析技术发展趋势;构建基于语义相似度的专利加权引文网络,绘制产业链专利发展地图。【结果】在算法方面,基于短语抽取规则的LDA方法能够实现更精确的技术主题识别;在分析结果方面,得...

  • 媒体协同对网络舆情扩散的作用机制研究

    作者:梅妍霜; 朱恒民; 魏静 刊期:2019年第02期

    【目的】研究媒体协同在话题传播中的作用机制,及其在引导和控制舆情话题传播方面的应用。【方法】采用模拟仿真方法,构建媒体协同作用下的舆情话题传播模型,分析发挥协同作用的媒体,及其作用时间点和作用时长对舆情话题传播的影响机制。【结果】仿真结果表明,相对于单个媒体,多个媒体构建的协作网络对话题传播有更强的促进作用,并且受媒体介入...

  • 一种基于χ^2统计的特征分类选择方法研究

    作者:谭章禄; 王兆刚; 胡翰 刊期:2019年第02期

    【目的】针对传统χ~2统计无法保证各类别之间信息的均衡性从而影响分类效果的问题,改进χ^2统计以提高其应用效果。【方法】通过分析传统χ^2统计的特征选择过程及其局限,提出一种基于χ^2统计的特征分类选择方法,根据特征词与每一类的关联度分类别选取特征词。【结果】以SVM为分类模型,通过实验对比改进前后的方法对文本分类效果的影响,结果表明基...

  • 查询歧义性程度自动标注指标的替代性验证研究

    作者:桂思思; 张晓娟; 王鑫 刊期:2019年第02期

    【目的】针对查询歧义性程度的标注问题,通过分析自动标注指标间的相关性及自动标注指标与人工标注指标的一致性,以期获得在一定程度上能替代其他自动标注指标和人工标注的自动标注指标。【方法】分别选取基于文档、用户以及查询词项特征的自动标注指标,依据查询词项对应类目的频率改进一种基于查询词项特征的自动标注指标;利用皮尔逊相关系数与...

  • 基于Bi-LSTM和CRF的药品不良反应抽取模型构建

    作者:朱笑笑; 杨尊琦; 刘婧 刊期:2019年第02期

    【目的】提出处理社会媒体上不规范文本的方法,以提高社会媒体中药品不良反应抽取效果。【方法】基于TensorFlow深度学习框架,将LSTM和CRF结合,借助LSTM能利用上下文信息的特性,通过CRF层考虑输出标记的依赖关系,构建基于Bi-LSTM和CRF的药品不良反应抽取模型。【结果】在Twitter数据集上开展系列实验,结果表明与传统CRF、前向LSTM、后向LSTM和Bi...

  • 基于中文社交媒体文本的领域情感词典构建方法研究

    作者:蒋翠清; 郭轶博; 刘尧 刊期:2019年第02期

    【目的】从社交媒体用户生成内容中发现未知情感词,构造领域情感词典,应用于汽车评论的情感分析。【方法】选取HowNet情感词典作为种子,以实际汽车评论作为语料,分别利用PMI和Word2Vec算法识别新词情感极性,根据集成规则对二者识别结果综合判定,通过情感分类实验对比显示本文算法的有效性。【结果】按照该方法构造的情感词典准确率比How Net情感...

  • 基于加权知识网络的在线健康社区用户知识发现

    作者:吴菊华; 王煜; 黎明; 蔡少云 刊期:2019年第02期

    【目的】通过信息抽取和热点主题分析,整合在线健康社区用户交流的碎片化潜在知识,分析用户核心需求。【方法】基于具有词频和关注度两类节点属性的加权知识网络模型,利用八爪鱼采集器获取"39健康网"乙肝论坛的帖子数据,采用ICTCLAS 2013、BibExcel和Ucinet三款软件进行分词、词频统计、筛选、绘图和分析。【结果】构建用户知识网络以及用户知识...

  • 基于用户感知价值的医疗信息服务评价体系构建

    作者:李健; 王明月; 许路明; 田英春 刊期:2019年第02期

    【目的】以用户感知价值视角,构建一套集"用户、信息技术、医院服务人员"于一体的交互影响式医疗信息服务评价体系。【方法】提出基于主成分分析法统计指标成分占比和实现指标筛选,灰色聚类方法确定指标关联矩阵和临界值且实现指标优化,组合方法的搭建可测评医疗信息服务评价体系质量。【结果】评价指标体系共有9类58项指标为,且服务价值维度权...