数据分析与知识发现

数据分析与知识发现杂志 CSSCI南大期刊 CSCD期刊 统计源期刊

Data Analysis and Knowledge Discovery

杂志简介:《数据分析与知识发现》杂志经新闻出版总署批准,自1980年创刊,国内刊号为10-1478/G2,是一本综合性较强的计算机期刊。该刊是一份月刊,致力于发表计算机领域的高质量原创研究成果、综述及快报。主要栏目:数学图书馆 、知识组织与知识管理、情报分析与研究 、应用实践 、动态、特邀专栏、金融证券管理、企业信息管理技术

主管单位:中国科学院
主办单位:中国科学院文献情报中心
国际刊号:2096-3467
国内刊号:10-1478/G2
全年订价:¥ 1180.00
创刊时间:1980
所属类别:计算机类
发行周期:月刊
发行地区:北京
出版语言:中文
预计审稿时间:1-3个月
综合影响因子:2.25
复合影响因子:1.2
总发文量:1915
总被引量:19495
H指数:18
引用半衰期:4.5254
立即指数:0.1317
期刊他引率:0.9104
平均引文率:21.7126
  • 时空数据建模方法研究综述

    作者:李旭晖; 刘洋 刊期:2019年第03期

    【目的】总结时空数据建模方法,以期为时空知识的组织和管理研究提供理论基础。【文献范围】在百度学术、谷歌学术、EI、CNKI中分别以检索式'时空数据模型'、'spatio-temporal data model'在限定时间范围、期刊类型内进行文献检索,获得部分相关文献,根据研究主题相关程度筛选最终获得64篇相关文献。【方法】根据建模对象的抽象层次对时空数据模...

  • 科技文献内容知识点抽取研究综述

    作者:徐红霞; 李春旺 刊期:2019年第03期

    【目的】总结述评国内外科技文献内容知识点抽取研究。【文献范围】以CNKI和Google Scholar为平台,检索得到知识点抽取相关论文,共选择68篇代表性文献进行述评。【方法】采用文献调研方法,对当前图书情报和计算机领域的知识点抽取研究进展进行评析,对关键的抽取技术进行分类总结。【结果】在总结知识点抽取研究现状和技术体系的基础上,指出科技...

  • 斯坦福大学自然语言处理工具包StanfordNLP,支持中文等53种语言

    作者:本刊讯 刊期:2019年第03期

    近日,斯坦福大学了一款用于自然语言处理的Python官方库,该库可以适用于多种语言,访问地址:https://stanfordnlp.github.io/stanfordnlp/。StanfordNLP是一个软件包组合,包括斯坦福团队在CoNLL2018的通用依存解析(Universal Dependency Parsing)共享任务上使用的软件包,以及斯坦福CoreNLP软件的官方Python接口。

  • 用户画像构建方法研究综述

    作者:高广尚 刊期:2019年第03期

    【目的】从设计与思维和数据类型两个角度分别探讨用户画像构建过程的机制。【文献范围】在Google Scholar和CNKI中分别以关键词'User Personas'、'User Profiles'和'用户画像'进行文献检索,再结合主题筛选,精读并使用追溯法获得用户画像研究的代表性文献共90篇。【方法】从设计思维角度研究画像的构建过程,具体结合目标导向、角色导向、参与导...

  • 面向用户评论的关键词抽取研究——以美团为例

    作者:张震; 曾金 刊期:2019年第03期

    【目的】通过自动从海量用户评论中抽取有效关键词,帮助用户和商家快速有效地发现有价值的信息,从而更好地为用户购买行为提供决策支持,为商家改善服务质量提供信息反馈。【方法】界定面向用户评论的关键词抽取的问题定义,从商家和用户两个角度提出面向用户评论的关键词抽取的评价准则;提出一种基于语言模型的用户评论关键词抽取方法(LMKE),采集...

  • 基于电商数据的产品知识图谱构建研究

    作者:丁晟春; 侯琳琳; 王颖 刊期:2019年第03期

    【目的】引入产品画像概念,解决现有电商平台上对产品静态信息和动态评论关联上的不足。【方法】将知识图谱作为挖掘、组织、存储、展示产品信息的方法,引入到产品画像的构建研究中,提出基于知识图谱的产品画像构建方法。【结果】通过设计三项实验生成手机知识图谱数据层,其中命名实体抽取实验的F值达到77.52%,评价对象–评价词抽取实验的F值达...

  • 不同词性标记集在典籍实体抽取上的差异性探究

    作者:袁悦; 王东波; 黄水清; 李斌 刊期:2019年第03期

    【目的】在数字人文这一背景下,为更加深入和精准地从古代典籍中挖掘相应的知识,通过实验对比分析,探究不同词性标记集在典籍实体抽取上的差异性。【方法】基于已完成人工校验和机器自动标注的《左传》与《国语》构成的训练和测试语料,以南京师范大学先秦词性标记集为主、以北京大学、中国科学院计算技术研究所和教育部词性标记集为辅,共形成三...

  • 基于查询表达式特征的时态意图识别研究

    作者:桂思思; 陆伟; 张晓娟 刊期:2019年第03期

    【目的】针对时态意图识别问题,探讨可抽取查询表达式特征的有效性及采用不同类别分类算法的识别准确度,为后续相关研究提供一定的借鉴。【方法】按查询表达式特征与时间的关联性,将其归类为时间无关特征、潜在时间特征、显式时间特征。在此基础上,分别采用有监督分类算法及半监督分类算法,探讨采用不同特征组合的有效性及不同分类算法的识别准...

  • 面向科技文献神经机器翻译词汇表优化研究

    作者:刘清民; 姚长青; 石崇德; 温晓洁; 孙玥莹 刊期:2019年第03期

    【目的】针对面向科技文献的神经机器翻译中存在的词汇表受限问题,提出优化方法,进而提升翻译质量。【方法】根据科技词汇构词规律,结合点互信息,在保留词汇义素完整的同时,对神经机器翻译词汇表进行优化,达到减少未登录词的目的。【结果】选择NTCIR-2010专利语料和自动化计算机领域期刊论文摘要语料进行实验,将实验结果与普通分词和子词分词对...

  • 在线品牌社群环境下企业与用户的信息互动研究——以虚拟现实产业为例

    作者:王晰巍; 王铎; 郑晴晓; 韦雅楠 刊期:2019年第03期

    【目的】通过对社交媒体中信息互动内容进行文本分析,以VR产业为切入点,探究在线品牌社群中企业与用户信息互动的特点以及企业如何通过信息互动来提升竞争力。【方法】使用文本挖掘方法对国内外4家VR企业的社交媒体主页信息进行采集,并使用NVivo11等文本分析工具对获取到的信息进行文本分析和数据统计。【结果】数据分析结果表明,国内外在线品牌...

  • 基于词向量和BTM的短文本话题演化分析

    作者:张佩瑶; 刘东苏 刊期:2019年第03期

    【目的】构建一种微博话题演化方法,正确把握话题发展趋势,提高网络舆情预警能力。【方法】使用Skip-gram模型在文本集上训练得到词向量模型,将每一时间片的微博文本输入BTM得到候选主题,在主题维上构造候选主题词向量;利用K-means算法对主题词向量聚类,得到融合后的主题,进而建立文本集在时间片上的话题演化路径。【结果】实验结果表明,本文方...

  • 商品在线评价对消费趋同影响研究

    作者:李想; 钱晓东 刊期:2019年第03期

    【目的】探究电子商务中消费趋同的影响因素。【方法】在BBV模型的基础上,针对商品–消费者二分网络的特点进行两方面模型优化:采用部分优选、部分随机的节点选择模式;分别定义网络中两类节点在演化过程中的权重分配方法。通过比较不同参数下模型的演化过程及结果,探究点强度、随机影响因子、两类节点增加比例对消费趋同的影响。【结果】演化结...

  • CSpace知识分析与可视化功能扩展研究与实践

    作者:吴志强; 祝忠明; 刘巍; 王思丽 刊期:2019年第03期

    【目的】对CSpace知识分析与可视化功能进行扩展,实现将知识分析与可视化服务全面嵌入到用户的知识利用和知识创新过程中。【应用背景】知识分析与可视化是机构知识库研究和建设的重要发展方向,对其功能进行扩展,在知识传播和利用过程中,可为用户提供更为优质的知识服务。【方法】重构知识分析与可视化功能框架;升级Solr索引,基于其支持SubDocum...

  • 亚马逊开源迁移学习数据库Xfer

    作者:本刊讯 刊期:2019年第03期

    近日,亚马逊开源了迁移学习数据库Xfer,可以轻松应用并打造迁移学习原型。所谓'迁移学习',是指重新利用已训练的机器学习模型来应对新任务的技术。它给深度学习领域带来了许多好处,最明显的一点是:无需从头开始训练模型,可以节省大量的计算、数据以及专业知识等资源。

  • 基于改进的隐马尔科夫模型的网页新闻关键信息抽取

    作者:刘志强; 都云程; 施水才 刊期:2019年第03期

    【目的】通过隐马尔科夫模型解决新闻网页中标题、日期、来源、正文等关键信息抽取问题,并根据应用场景对算法做出改进以提高抽取效果。【方法】将网页文档转为DOM树并进行预处理,映射待抽取信息项为状态,映射待抽取观测项为词汇,研究隐马尔科夫模型在网页新闻关键信息抽取中的应用并对算法提出改进。【结果】使用隐马尔科夫模型的改进算法,在已...