《数据分析与知识发现》杂志2019年第07期期刊目录-发表之家

基于LDA主题模型的用户兴趣层级演化研究

作者：夏立新; 曾杰妍; 毕崇武; 叶光辉刊期：2019年第07期

【目的】探究用户兴趣层级结构,揭示用户兴趣层级演化规律,以提高个性化信息服务的质量,满足用户信息需求。【方法】利用LDA主题模型获取用户标签主题;通过定义标签兴趣度计算公式,并结合提取的用户标签主题,动态感知用户兴趣;依据构建的兴趣网络划分用户兴趣核心-边缘结构,进而分析用户兴趣层级结构的演化规律。【结果】用户兴趣的核心-边缘结...
欢迎订阅2019年《数据分析与知识发现》(月刊)

刊期：2019年第07期

《数据分析与知识发现》杂志是由中国科学院主管、中国科学院文献情报中心主办的学术性专业期刊。刊物原名《现代图书情报技术》,2017年正式更名为《数据分析与知识发现》,致力于为计算机科学、情报科学、管理学领域的研究者提供一个重要的学术交流平台。刊物将秉承“反映前沿动态、推动学科发展、引领学术创新”的办刊理念,广泛吸纳计算机科学...
基于多维小波聚类的空间文本数据情感分布分析

作者：李柯; 佐々木勇和刊期：2019年第07期

【目的】构建基于多维小波聚类的空间文本数据情感分析模型,实现文本情感和空间位置的综合分析。【方法】将Yelp数据集进行整合以构建空间文本数据库,使用基于词典的情感分析方法构建特征向量。提出使用多维小波聚类的混合算法和文本–空间算法两种模型并进行分析。【结果】实验结果验证了使用db2和bior2.2小波基函数的多维小波聚类算法比DBSCAN...
调查显示:中国网民每天在娱乐应用上花费近5个小时

作者：本刊讯刊期：2019年第07期

中国网民对智能手机的依赖程度越来越高——智能手机可以执行各种各样的任务,从与同事聊天、购买日常用品,到通过玩游戏获得兴奋感等。根据市场研究公司QuestMobile收集的最新数据,中国网民每天在手机上的娱乐时间平均为4.7小时,这一数字高于一年前的4.1小时。
中文分词器对图书评论和情感词典匹配程度的影响

作者：尤众喜; 华薇娜; 潘雪莲刊期：2019年第07期

【目的】比较由不同中文分词器带来的语料和情感极性词典匹配程度的差异。【方法】采用6款分词器对自主构建的图书评论语料库进行分词,结合常见情感词典编写程序对输入的语料进行处理,统计语料对情感词典、否定词表和程度词表的覆盖率与匹配次数,计算低频词的比率和中性语料的比率。【结果】针对不同的情感词典,分词器在语料–词典匹配度、词典...
基于XGBoost模型的电商商品品名识别算法研究

作者：李晓峰; 马静; 李驰; 朱恒民刊期：2019年第07期

【目的】针对淘宝商品上架自动类目识别需求,在电子商务领域中提出商品品名识别问题。【方法】通过合作方获取的大量商品交易数据,构建电商商品描述数据集,并对数据集人工标注;使用基于XGBoost模型的有监督机器学习算法,对电商商品描述短文本进行品名识别研究。【结果】实验结果表明,该算法对最终20059条数据集上的816种商品的识别准确率为85%,...
基于用户评论的商品特征提取及特征价格研究

作者：文秀贤; 徐健刊期：2019年第07期

【目的】针对特征价格研究缺乏特征选取标准的现状,基于大规模用户评论,提出一种商品特征的挖掘与选取方法,对特征价格研究进行改进和延伸。【方法】提取用户评论的关键词,通过关键词聚类获取消费者显著偏好的商品特征,在此基础上建立特征价格模型反映特征价格。为验证模型的科学性和有效性,以广州在售新楼盘为例进行实证研究。【结果】基于用户...
融合主题词嵌入和网络结构分析的主题关键词提取方法

作者：曾庆田; 胡晓慧; 李超刊期：2019年第07期

【目的】构建一种更加准确的主题关键字提取模型,从词向量与主题模型相结合的角度出发解决词频较小主题相关度较高词语发现的问题。【方法】提出一种融合主题词嵌入和网络结构分析的主题关键词提取方法,利用LDA主题模型进行主题关键词的初步提取,利用Word2Vec训练词向量,利用词向量相似度传播构建关键词网络,利用网络结构分析方法对主题词进行二...
基于LDA的主题语义演化分析方法研究——以锂离子电池领域为例

作者：关鹏; 王曰芬; 傅柱刊期：2019年第07期

【目的】揭示学科领域不同发展阶段中主题语义内容层面的演化规律。【方法】结合LDA和生命周期理论,提出主题语义演化分析方法,重点解决主题过滤、主题语义相似度计算和主题语义演化模式判别等技术问题。【结果】研究发现锂离子电池领域主题之间的语义演化模式:主题继承贯穿领域发展全过程;主题分裂始于成长期,在快速发展期分裂次数(6次)最多;主...
面向智能应用的领域本体构建研究——以反电话诈骗领域为例

作者：邓诗琦; 洪亮刊期：2019年第07期

【目的】发挥智能应用对本体构建的驱动作用,增强本体对领域知识的表示能力以及对智能应用的支撑能力。【方法】提出一种面向智能应用的领域本体构建方法,即应用驱动循环法,以智能应用需求为核心进行跨领域知识的融合建模,采用"需求+构建+评估"循环式结构,使得智能应用需求在本体构建的全过程中可发挥引领性作用。以反电话诈骗领域为例,在智能反...
中国图书馆学会专业图书馆分会2019年学术年会会议通知

刊期：2019年第07期

开放科学正在迅速发展成为科技与社会创新的基础模式之一,也成为当前学术研究的重大趋势。在开放科学环境下,专业图书馆的角色与职责不再只是信息资源的采购者和访问渠道的提供者,而是开放环境的营造者、研究过程的参与者、开放出版与获取的推广者、开放科学可持续发展的维护者。同时,面对信息开放获取、信息数据化、创新多元化、智能技术应用闩...
基于频次有效长度的加权关联规则挖掘算法研究

作者：张勇; 李树青; 程永上刊期：2019年第07期

【目的】通过对数据库中项在重要程度上存在的差异性进行分析,解决传统关联规则挖掘算法挖掘大量冗余无价值规则的问题。【方法】在具有时态约束的序列上,结合频次有效长度方法挖掘非加权关联规则,引入加权方法,利用滑动窗口技术在时序序列上挖掘稀有加权关联规则。【结果】根据频次有效长度的加权关联规则挖掘算法所挖掘出的加权时序关联规则能...
第二届“数据分析与知识发现”学术研讨会成功召开

作者：本刊讯刊期：2019年第07期

2019年7月10-11日,第二届“数据分析与知识发现”学术研讨会(DAKD2019)在兰州成功召开。本次会议由中国科学院文献情报中心主办,中国科学院兰州文献情报中心和《数据分析与知识发现》编辑部联合承办。中国科学院文献情报中心刘会洲主任出席会议并作开幕致辞。来自75家高校及科研院所,跨计算机科学、情报科学、管理科学、经济学、行为科学、心理...
基于重叠社区的影响力最大化算法

作者：仇丽青; 贾玮; 范鑫刊期：2019年第07期

【目的】针对影响力最大化问题中贪心算法时间效率低的局限,提出基于重叠社区的影响力最大化算法。【方法】基于重叠社区,综合传播度最大的节点和重叠节点选出候选种子集,并采用CELF算法确定最优种子集,从而提高影响范围。【结果】实验数据表明,在亚马逊数据集上IM-BOC算法运行时间最大幅度能够提高约89%。【局限】仅凭社区节点的数量分配候选种...
基于多元特征的文本阅读难度自动分级研究

作者：程勇; 徐德宽; 吕学强刊期：2019年第07期

【目的】实现文本阅读难度自动分级。【方法】采用基于多元特征的机器学习方法实现对文本难度的分析和判别,包括词频特征、结构特征、主题特征、深度特征等。这些特征从不同角度对文本的内容进行描述。在此基础上,对这些多元特征进行融合,并在多种分类器上进行文本阅读难度自动分级实验。【结果】利用本文提出的方法在面向中学英语考试的阅读理...

数据专员工作总结数据专员述职报告数据交换技术论文数据保密解决方案数据信息论文数据分析分析技术数据分析实训总结数据分析师统计学基础数据分析方法数据分析毕业论文数据分析的前景数据分析的方法

数据分析与知识发现杂志 CSSCI南大期刊 CSCD期刊 统计源期刊

Data Analysis and Knowledge Discovery

基于LDA主题模型的用户兴趣层级演化研究

欢迎订阅2019年《数据分析与知识发现》(月刊)

基于多维小波聚类的空间文本数据情感分布分析

调查显示:中国网民每天在娱乐应用上花费近5个小时

中文分词器对图书评论和情感词典匹配程度的影响

基于XGBoost模型的电商商品品名识别算法研究

基于用户评论的商品特征提取及特征价格研究

融合主题词嵌入和网络结构分析的主题关键词提取方法

基于LDA的主题语义演化分析方法研究——以锂离子电池领域为例

面向智能应用的领域本体构建研究——以反电话诈骗领域为例

中国图书馆学会专业图书馆分会2019年学术年会会议通知

基于频次有效长度的加权关联规则挖掘算法研究

第二届“数据分析与知识发现”学术研讨会成功召开

基于重叠社区的影响力最大化算法

基于多元特征的文本阅读难度自动分级研究

数据分析与知识发现杂志 CSSCI南大期刊 CSCD期刊 统计源期刊

Data Analysis and Knowledge Discovery

基于LDA主题模型的用户兴趣层级演化研究

欢迎订阅2019年《数据分析与知识发现》(月刊)

基于多维小波聚类的空间文本数据情感分布分析

调查显示:中国网民每天在娱乐应用上花费近5个小时

中文分词器对图书评论和情感词典匹配程度的影响

基于XGBoost模型的电商商品品名识别算法研究

基于用户评论的商品特征提取及特征价格研究

融合主题词嵌入和网络结构分析的主题关键词提取方法

基于LDA的主题语义演化分析方法研究——以锂离子电池领域为例

面向智能应用的领域本体构建研究——以反电话诈骗领域为例

中国图书馆学会专业图书馆分会2019年学术年会会议通知

基于频次有效长度的加权关联规则挖掘算法研究

第二届“数据分析与知识发现”学术研讨会成功召开

基于重叠社区的影响力最大化算法

基于多元特征的文本阅读难度自动分级研究

数据分析与知识发现杂志 CSSCI南大期刊 CSCD期刊统计源期刊