《数据分析与知识发现》杂志2018年第07期期刊目录-发表之家

社会化问答研究综述

作者：李蕾; 何大庆; 章成志刊期：2018年第07期

【目的】了解社会化问答的发展态势和研究内容。【文献范围】在Google Scholar和CNKI中分别以检索词＂Social Q＆A＂和＂社会化问答＂进行文献检索,再结合主题筛选,精读并使用追溯法获得社会化问答研究的代表性文献共77篇。【方法】对社会化问答的发展历程和早期研究内容进行介绍,对社会化问答近期的主要研究内容进行归类总结。【结果】目前社会...
基于Web的众筹研究回顾：融资模式、影响因素和行为模式

作者：王伟; 郭丽环; 王洪伟; Kevin; Zhu; 何翎刊期：2018年第07期

【目的】基于Web的众筹模式成为新的融资渠道,倍受政府和投资者的关注,但是众筹研究并不广泛。本文针对众筹模式的现状,探讨众筹模式结构性、趋势性的研究进展。【文献范围】从Web of Science、CNKI等数据库中分别以＂众筹（Crowdfunding,Crowdfinancing,Crowdinvesting）＂、＂P2P借贷（P2P Lending）＂等检索词检索获得中英文相关文献101篇。...
社交媒体环境下用户信任度评估与传播影响力研究

作者：景东; 张大勇刊期：2018年第07期

【目的】通过研究社交媒体用户信任度评估和传播影响力,发现推动或制约信息传播的关键因素,为促进社交媒体健康有序发展提供服务。【方法】根据网络信任特点,提出一种基于直接信任和间接信任的综合评估指标,该指标综合考虑个体的局部影响力和全局调控能力。【结果】SIR模型评估实验结果表明,综合评估指标值最大的个体发起的传播能在较短的传播时...
基于主题时间模型的农村电商扶贫政策演化及地区差异分析

作者：余传明; 郭亚静; 龚雨田; 黄漫宇; 彭虎锋刊期：2018年第07期

【目的】揭示农村电商扶贫政策从2008年到2017年的演化规律以及区域差异。【方法】运用主题时间模型,提取10年间农村电商扶贫政策的时间–主题概率分布以及主题–词汇概率分布,通过计算不同年份下主题的平均强度并提取每个主题下概率高的前n个词汇,分析政策内容的演化情况;将各省数据按照东、中、西部进行划分,得到各个地域的主题–词汇概率分布...
基于随机森林属性约简的众包竞赛参与者识别体系研究

作者：周成; 魏红芹刊期：2018年第07期

【目的】解决众包竞赛中参与者识别体系规模较大、识别方法比较单一的问题。【方法】在广泛收集众包竞赛参与者众包能力指标的基础上,提出递归启发式属性约简方法,构建新的众包参与者识别体系,并在此基础上利用随机森林算法构建众包参与者识别模型。【结果】实验结果表明：所提出的属性约简方法能有效地降低数据维度,由初始的17个属性降低到8个...
最新研究：排名算法SpringRank

刊期：2018年第07期

近日,Santa Fe研究所在Science Advances,提出一种名为Spring Rank的新算法,该算法利用输赢快速找到潜伏在大型网络中的排名。当在各种合成和真实世界数据集上进行测试时,从NCAA大学篮球锦标赛的团队到动物的社会行为,Spring Rank在预测结果和效率方面优于其他排名算法。
高校网络舆情安全中主题分类方法研究——以新浪微博数据为例

作者：贾隆嘉; 张邦佐刊期：2018年第07期

【目的】通过一种特征加权方法解决高校新浪微博主题分类研究所面临的高维性和稀疏性问题。【方法】计算特征属于类别的概率,进一步预测文档属于类别的概率,使得特征由基于词的表示转换为基于类别的表示,最终采用支持向量机对转换后的特征矩阵进行分类。【结果】传统tf,tf？idf以及tf？rf三种方法在结合本文提出的方法后,在微平均F1/宏平均F1方...
基于不确定近邻的旅游产品协同过滤推荐算法研究

作者：赵雅楠; 王育清刊期：2018年第07期

【目的】解决传统协同推荐技术在智慧旅游产业运用中的数据稀疏性、冷启动等问题。【方法】结合基于用户和基于内容的协同推荐技术,对用户进行K-means聚类后动态分类筛选,为推荐类型分配权重,提出基于不确定近邻的旅游产品协同过滤推荐算法IUNCF。【结果】基于不同相似性阈值和推荐数目对真实旅游数据进行算法检验,实验结果表明,IUNCF算法的MAE...
ImageAI：十行代码解决目标检测

刊期：2018年第07期

在应用内或者系统中使用最新的目标检测算法很困难,同样基于这些算法构建新的应用也并非易事。早期的目标检测使用的是传统算法,但在不同场景下表现较不稳定。2012年,随着深度学习的突破和快速普及,为我们带来了全新的、高精确的目标检测算法和方法。使用这些基于深度学习的算法和方法,需要一定的数学及深度学习框架的基础。
考虑时间动态性和序列模式的个性化推荐算法

作者：李杰; 杨芳; 徐晨曦刊期：2018年第07期

【目的】在电子商务个性化推荐中考虑商品销售的时间动态性和序列模式问题,提高推荐效果。【方法】提出一种改进的个性化推荐算法：引入时间系数和热门系数,改进评分相似性函数,提出新的用户兴趣相似度计算方法;加入商品序列模式,给出二项序列模式挖掘算法,用序列模式对推荐结果进行筛选排序。【结果】利用2004年–2005年亚马逊图书评论数据进行...
机器学习项目中使用统计学方法的十个例子

刊期：2018年第07期

统计学和机器学习是两个联系紧密的领域。事实上,两者的界限有时非常模糊。有一些明显属于统计学领域的方法也可用于机器学习项目,并且极具价值。（1）问题架构。统计方法在问题的架构阶段有助于探索数据,包括：探索性的数据分析;数据挖掘。（2）数据理解。用于理解数据的统计学模型的两类主流分支：汇总统计;数据可视化。（3）数据清洗。统计方...
一种基于Huffman树的FCM聚类算法

作者：肖满生; 周丽娟; 文志诚刊期：2018年第07期

【目的】解决传统的FCM算法随机选取初始聚类中心、对噪声敏感、只适合均衡分布的样本聚类问题。【方法】提出一种基于Huffman树的FCM新算法,该算法设计一种高密度样本的相异度矩阵构建Huffman树并获取初始聚类中心,进而给出非归一化约束的样本隶属度函数。【结果】通过人造样本及图像数据集、UCI数据集的实验对比结果表明,算法在聚类精度、运算...
基于汉字标注的中文历史事件名抽取研究

作者：唐慧慧; 王昊; 张紫玄; 王雪颖刊期：2018年第07期

【目的】探讨中文历史事件名识别和抽取的最优模型,用于历史文本的知识重组和中国历史事件本体的构建。【方法】以魏晋南北朝史书文本为原始语料,进行自动标引,运用条件随机场（CRFs）模型,以单个汉字为标注对象,探讨不同汉字角色集合、不同特征对历史事件名识别的影响,寻找最佳模型。【结果】经过实验论证,得到字素的词性倾向和姓氏特征相累加...
移动图书馆信息接受熵及其仿真研究

作者：毕达天; 王福刊期：2018年第07期

【目的】移动图书馆如何快速响应用户所处场景的切换,并基于用户信息接受期望为其适配情境是移动图书馆服务创新和空间再造亟需解决的问题。【方法】借鉴信息熵、情境熵等理论提出信息接受熵的概念,并基于熵的能量分布思想,构建移动图书馆场景化信息接受熵的广义组分分布概率模型。在辽宁、吉林和河南三个地区的高校利用云舟知识服务空间对用户...

数据专员工作总结数据专员述职报告数据交换技术论文数据保密解决方案数据信息论文数据分析分析技术数据分析实训总结数据分析师统计学基础数据分析方法数据分析毕业论文数据分析的前景数据分析的方法

数据分析与知识发现杂志 CSSCI南大期刊 CSCD期刊 统计源期刊

Data Analysis and Knowledge Discovery

社会化问答研究综述

基于Web的众筹研究回顾：融资模式、影响因素和行为模式

社交媒体环境下用户信任度评估与传播影响力研究

基于主题时间模型的农村电商扶贫政策演化及地区差异分析

基于随机森林属性约简的众包竞赛参与者识别体系研究

最新研究：排名算法SpringRank

高校网络舆情安全中主题分类方法研究——以新浪微博数据为例

基于不确定近邻的旅游产品协同过滤推荐算法研究

ImageAI：十行代码解决目标检测

考虑时间动态性和序列模式的个性化推荐算法

机器学习项目中使用统计学方法的十个例子

一种基于Huffman树的FCM聚类算法

基于汉字标注的中文历史事件名抽取研究

移动图书馆信息接受熵及其仿真研究

数据分析与知识发现杂志 CSSCI南大期刊 CSCD期刊 统计源期刊

Data Analysis and Knowledge Discovery

社会化问答研究综述

基于Web的众筹研究回顾：融资模式、影响因素和行为模式

社交媒体环境下用户信任度评估与传播影响力研究

基于主题时间模型的农村电商扶贫政策演化及地区差异分析

基于随机森林属性约简的众包竞赛参与者识别体系研究

最新研究：排名算法SpringRank

高校网络舆情安全中主题分类方法研究——以新浪微博数据为例

基于不确定近邻的旅游产品协同过滤推荐算法研究

ImageAI：十行代码解决目标检测

考虑时间动态性和序列模式的个性化推荐算法

机器学习项目中使用统计学方法的十个例子

一种基于Huffman树的FCM聚类算法

基于汉字标注的中文历史事件名抽取研究

移动图书馆信息接受熵及其仿真研究

数据分析与知识发现杂志 CSSCI南大期刊 CSCD期刊统计源期刊