《数据分析与知识发现》杂志2018年第04期期刊目录-发表之家

移动购物用户信息浏览特征及对购买的影响研究——基于移动电商APP点击流日志的分析

作者：周翔; 张鹏翼; 王军刊期：2018年第04期

【目的】针对移动购物用户在进行商品信息浏览时的特征对购买的影响进行研究。【方法】采用日志分析方法,对某移动电商APP的2 752名用户在2015年3月的44 932 715条日志进行分析。【结果】会话内浏览复杂度越高、浏览广度越广、浏览深度越深,会话内用户越有可能产生购买行为;单会话购物过程中浏览复杂度高于多会话购物过程;多任务购物过程中浏览...
基于排名聚合的古村落网络信息资源评价研究

作者：郭崇慧; 李敏谦刊期：2018年第04期

【目的】探究如何利用排名聚合方法科学评价古村落网络信息资源。【方法】提出评价流程框架和评价方法：选取6个考察维度,构建古村落网络信息资源评价指标体系;结合指标的主观权重和客观权重,采用一种排名聚合方法 BILPS将多种单一评价方法进行聚合,对古村落网络信息资源进行综合评价。【结果】对广东省64个古村落的网络信息资源进行评价,分析发...
媒介信息与投资者过度交易——基于微博舆论、行业新闻与公司公告的实证

作者：岑咏华; 张灿; 吴承尧刊期：2018年第04期

【目的】考察在不同类型媒介信息影响下股票投资者过度交易现象是否更加显著。【方法】采用事件分析法考察微博舆论、行业新闻、公司公告信息涉及的公司股票在信息前后各时间窗口内异常换手率的差异,检验媒介信息类型的影响差异和信息传播效应。【结果】媒介信息披露后,股票过度交易现象显著;媒介信息传播过程中存在显著内幕效应、信息披露效应...
社会化商务持续意愿影响因素的实证研究：技术性因素与感知价值的影响

作者：甘春梅; 黄凯; 许嘉仪; 林恬恬刊期：2018年第04期

【目的】本研究旨在深入揭示社会化商务持续意愿的影响因素。【方法】基于S-O-R模型,结合技术性因素与感知价值,构建社会化商务持续意愿理论模型。通过在线问卷搜集数据,获得330份有效样本;进一步运用PLS进行数据分析。【结果】结果显示,交互性显著影响感知享乐性价值,个性化显著影响感知功利性价值,社交性显著影响感知价值,而推荐性显著影响感...
基于情感分析的开放式创新平台创意采纳研究：以Salesforce为例

作者：王婷婷; 王凯平; 戚桂杰刊期：2018年第04期

【目的】实证检验创意及用户评论的情感特征对开放式创新平台创意采纳是否具有显著影响以及如何影响。【方法】选择典型开放式创新平台为研究对象,基于社会影响理论将平台信息分为规范型和信息型两类,通过文本分析获得创意标题、文本以及评论的情感变量,研究情感对创意采纳是否具有影响。【结果】研究结果表明,创意标题以及文本长度、创意标题情...
社会化问答社区用户行为统计特性及其动力学分析：以知乎网为例

作者：郭博; 赵隽瑞; 孙宇刊期：2018年第04期

【目的】通过对社会化问答社区海量的用户信息和动态进行综合分析,探索社会化问答社区用户关系网络和用户访问行为的规律。【方法】以知乎网为例,抓取知乎用户和问答情况的公开信息,基于复杂网络和人类行为动力学,对社交网络本身的结构特性、用户群体特性及用户行为的时间统计特征进行分析。【结果】研究结果表明：在个体和群体层面,知乎用户行...
微软宣布机器翻译技术取得突破,中译英可媲美人类

刊期：2018年第04期

近日,微软的一组研究团队宣称其研发出了首个能够以媲美人类翻译准确度进行新闻报道中译英的机器翻译系统。该公司表示,他们使用2017年于WMT17研究大会上名为newstest2017的样本集（其中包含来自多家在线新闻媒体的2 000条语句）反复测试了这套系统,并将结果与人工翻译结果进行比较,还聘请了双语顾问进一步验证机器翻译的准确性。
基于引证行为与学术相似度的学者影响力领域排名方法研究

作者：刘俊婉; 杨波; 王菲菲刊期：2018年第04期

【目的】针对多样化评价指标导致评价体系庞大、计算繁琐、结论模糊等问题,研究一套公正、有效、快速的学术影响力排名机制。【方法】结合Word2Vec算法、TF-IDF算法和PageRank算法,提出一种基于引证行为与学术相似度的学者影响力领域排名方法。【结果】改进后的排序算法综合了学者学术关系层面与学者学术产出层面的学术影响力,在有效性维度表现...
基于主成分分析和随机森林的恶意网站评估与识别

作者：陈远; 王超群; 胡忠义; 吴江刊期：2018年第04期

【目的】充分利用网站多源评测指标,研究恶意网站的评估和识别问题。【方法】在广泛收集网站多源评测指标的基础上,采用主成分分析法对恶意网站进行多维度评估,并在此基础上利用随机森林分类算法构建恶意网站识别模型。【结果】所构建方法可以有效提取权威、引用、访问量、排名、链接5个评估维度;同时,基于主成分分析法和随机森林的恶意网站识别...
谷歌“与书对话”检索引擎,实现句子层级的图书检索

刊期：2018年第04期

人们检索书籍时,通常会从书名、作者、主题等表面标签入手。近日,谷歌＂与书对话＂检索引擎（Talk to Books）,可以为用户提供一种检索书籍的全新方法。用户只需要做一段相关描述,或是提一个相关的问题,那么＂与书对话＂检索引擎可以在不依赖关键词匹配的情况下,从10多万本书籍中检索所有句子,并根据句子的语义,找到能匹配用户陈述或问题的句子...
加权专利文本主题模型研究

作者：俞琰; 赵乃瑄刊期：2018年第04期

【目的】解决专利文本分析中主题模型向高频词倾斜、区分度低的问题。【方法】提出基于词权重方法,形成加权专利文本主题模型,给不同的词分配不同的权重,改变生成模型生成词的概率。【结果】相较于传统的专利文本主题模型,本文提出的加权专利主题模型能够增加主题间的区分度。【局限】加权算法需要更多数据集验证,并不断优化。【结论】通过专利...
基于NodeRank算法的产品特征提取研究

作者：周立欣; 林杰刊期：2018年第04期

【目的】基于自然语言处理技术和复杂网络相关理论,提出新的产品特征识别方法,提高产品特征的抽取效果。【方法】构建产品特征–情感词对的二分加权网络,从网络视角更加清晰、直观地描述产品特征词和情感词之间的关系。然后提出NodeRank算法对产品特征词进行重要性排序,提高特征词提取的准确率。【结果】通过对京东商城中真实评论数据的仿真实验...
最新研究：识别虚假用户的算法

刊期：2018年第04期

社交网络分析和挖掘领域的一项最新研究显示,研究人员已经开发出一种新的、通用的方法来检测社交网络上的虚假账户,适用于Facebook和Twitter等大多数社交网路。这一新方法是基于这样的假设：虚假账户不太可能与网络中的其他用户建立链接。＂最近出现了一些令人不安的消息,社交网络未能有效保护用户隐私,俄罗斯有针对性地使用社交媒体来影响选举...
移动社交网络微信用户信息行为统计特征分析

作者：王飞飞; 张生太刊期：2018年第04期

【目的】探究移动社交网络微信用户信息行为统计特征。【方法】以＂微信＂为研究对象,通过爬取微信用户5年内的朋友圈信息,从微信用户特征、微信信息内容、微信信息时间、微信点赞数与评论数对用户信息行为统计特征进行分析。【结果】用户信息内容受用户特征的影响;不同内容下的信息点赞与评论数也会有显著差异;同时,微信用户的信息时间间隔分布...

数据专员工作总结数据专员述职报告数据交换技术论文数据保密解决方案数据信息论文数据分析分析技术数据分析实训总结数据分析师统计学基础数据分析方法数据分析毕业论文数据分析的前景数据分析的方法

数据分析与知识发现杂志 CSSCI南大期刊 CSCD期刊 统计源期刊

Data Analysis and Knowledge Discovery

移动购物用户信息浏览特征及对购买的影响研究——基于移动电商APP点击流日志的分析

基于排名聚合的古村落网络信息资源评价研究

媒介信息与投资者过度交易——基于微博舆论、行业新闻与公司公告的实证

社会化商务持续意愿影响因素的实证研究：技术性因素与感知价值的影响

基于情感分析的开放式创新平台创意采纳研究：以Salesforce为例

社会化问答社区用户行为统计特性及其动力学分析：以知乎网为例

微软宣布机器翻译技术取得突破,中译英可媲美人类

基于引证行为与学术相似度的学者影响力领域排名方法研究

基于主成分分析和随机森林的恶意网站评估与识别

谷歌“与书对话”检索引擎,实现句子层级的图书检索

加权专利文本主题模型研究

基于NodeRank算法的产品特征提取研究

最新研究：识别虚假用户的算法

移动社交网络微信用户信息行为统计特征分析

数据分析与知识发现杂志 CSSCI南大期刊 CSCD期刊 统计源期刊

Data Analysis and Knowledge Discovery

移动购物用户信息浏览特征及对购买的影响研究——基于移动电商APP点击流日志的分析

基于排名聚合的古村落网络信息资源评价研究

媒介信息与投资者过度交易——基于微博舆论、行业新闻与公司公告的实证

社会化商务持续意愿影响因素的实证研究：技术性因素与感知价值的影响

基于情感分析的开放式创新平台创意采纳研究：以Salesforce为例

社会化问答社区用户行为统计特性及其动力学分析：以知乎网为例

微软宣布机器翻译技术取得突破,中译英可媲美人类

基于引证行为与学术相似度的学者影响力领域排名方法研究

基于主成分分析和随机森林的恶意网站评估与识别

谷歌“与书对话”检索引擎,实现句子层级的图书检索

加权专利文本主题模型研究

基于NodeRank算法的产品特征提取研究

最新研究：识别虚假用户的算法

移动社交网络微信用户信息行为统计特征分析

数据分析与知识发现杂志 CSSCI南大期刊 CSCD期刊统计源期刊