《数据分析与知识发现》杂志2014年第07期期刊目录-发表之家

中国科研人员对arXiv认知和使用的现状调查与分析

作者：张智雄; 张闪闪; 顾立平; 李麟刊期：2014年第07期

【目的】了解中国用户对arXiv预印本平台的认知、使用情况以及对arXiv发展的意见建议。【方法】基于国内9家高校及科研机构的教师、研究人员和研究生群体的问卷调查，获得510份调查数据，并运用SPSS等分析工具对调查数据进行分析。【结果】结果表明，中国科研人员对arXiv的认知程度还不是很高，但熟悉arXiv的中国科研人员已认识到在arXiv上论文...
科技知识组织体系共享服务平台服务接口建设研究

作者：刘毅; 汤怡洁; 周子健; 杨锐; 李传席; 张显峰; 刘春江刊期：2014年第07期

【目的】通过科技知识组织体系共享服务平台的服务接口建设，有效帮助我国科技信息服务行业实现标引的语义化规范化流程、语义检索与浏览、知识关联与推理发现等服务。【应用背景】采用标准的接口规范构建开放接口是实现科技知识组织体系STKOS对外服务的重要途径之一。【方法】基于科技知识组织体系STKOS引擎API，提出开放查询和推理接口模块化...
中图法与DDC类目自动映射研究

作者：张爱民; 贾君枝; 郝倩倩刊期：2014年第07期

【目的】研究中图法与DDC类目自动映射的问题，通过实现两者的互操作以达到集成检索、浏览和下载跨语言、跨地区的信息资源的目的。【方法】基于人工匹配映射的数据，研究基于特征集、类目匹配规则、类目关系、书目记录的语义匹配算法。【结果】实验证明，将近80％的类目与人工映射结果的数据相同，一定程度上提高了自动映射的准确性。【局限】...
针对训练集分布偏斜问题的数字资源文本分类方法

作者：李湘东; 何海红; 曹环; 黄莉刊期：2014年第07期

【目的】调整训练集分布的不均衡性，以提高科学分类体系下数字资源文本的分类性能。【方法】提出基于粒划分和LDA相结合的新方法B-LDA，首先根据划分准则对训练集进行分割，实现粒度空间的转换，然后采用概率主题模型（LDA）对文本建模，利用类全局语义信息生成新文本，从而使训练集达到分布均衡。【结果】仿真实验结果表明：随着特征项数的变...
利用小样本量机器学习实现学术文摘结构的自动识别

作者：白光祖; 何远标; 马建霞; 刘建华; 邹益民刊期：2014年第07期

【目的】通过在小样本量下基于机器学习算法实现文摘语句的自动分类，以此实现学术文摘结构的自动识别。【方法】设计多种学术文摘的文本表示特征，利用自然语言处理技术实现特征的自动提取，以此指导朴素贝叶斯、支持向量机模型进行训练，并利用训练模型自动识别文摘结构。【结果】实验证明该方法较之于同类方法能够在较少训练语料下实现较好的...
融合LDA与TextRank的关键词抽取研究

作者：顾益军; 夏天刊期：2014年第07期

【目的】通过将单一文档内部的结构信息和文档整体的主题信息融合到一起进行关键词抽取。【方法】利用LDA对文档集进行主题建模和候选关键词的主题影响力计算，进而对TextRank算法进行改进，将候选关键词的重要性按照主题影响力和邻接关系进行非均匀传递，并构建新的概率转移矩阵用于词图迭代计算和关键词抽取。【结果】实现LDA与TextRank的有效...
EBSCO为其开放元数据共享和技术协作政策增加50个数据库

刊期：2014年第07期

EBSCO信息服务（EBSCO）为其元数据共享和与发现服务提供商技术合作政策增加了数据库的数量。目前，EBSCO的所有元数据（如果协议允许，还包括全文）可用于179个EBSCO全文数据库，也可用于所有74个EBSCO数字历史档案（含全文）和全部55万多本电子书。
利用主题标引进行查询重排序

作者：毛进; 李纲; 操玉杰刊期：2014年第07期

【目的】在伪相关反馈过程中，利用主题标引对查询结果进行重排序。【方法】借助语言模型方法，挖掘主题词与用户查询关系，将用户查询表达为主题词的概率分布，并建立主题词语言模型，进而判断主题词在文档中的权重。在此基础上，重新计算初次查询结果文档分值，进行查询重排序。【结果】本文方法能够较好地为主题词建立语言模型表示，挖掘得到...
PlumX增加EBSCO数据库中用户使用情况数据

刊期：2014年第07期

PlumAnalytics的计量指标将包含EBSCO信息服务（EBSCO）数据库以及EBSCO发现服务（EDS）中文章和图书的使用统计数据。这些数据库中的篇章级数据将允许PlumAnalytics的产品PlumX提供来自成千上万供应商的文章和图书的使用统计数据。此次合作标志着出版商将首次对每篇文章的实际使用情况（如摘要浏览次数，下载量等）进行度量。
一种基于自组织映射与径向基函数预测补值的协同过滤推荐方法

作者：薛福亮; 张慧颖刊期：2014年第07期

【目的】基于自组织映射与径向基函数神经网络对协同过滤推荐方法进行改进，提高推荐质量。【应用背景】针对协同过滤推荐方法存在的稀疏性问题，利用神经网络对缺失评价数据进行预测补值，在此基础上提出一种新的提高推荐精度的解决思路。【方法】基于稀疏用户评分矩阵，应用自组织映射神经网络对相似用户进行预聚类，利用同一聚类簇内用户的相...
Folksonomy中Tag语义距离测度与可视化研究

作者：黄微; 高俊峰; 李瑞; 周姗姗刊期：2014年第07期

【目的】探索Folksonomy中标签语义距离的可视化及测度，为进一步研究优化关联标签导航算法奠定基础。【应用背景】针对语义距离可视化方法弱化关联标签导航行为中主题漂移，提高BibSonomy等Folksonomy网站知识服务表现。【方法】以BibSonomy网站真实数据为研究对象，设计测试标签集筛选及语义距离测量算法，借助有值图谱将最终结果可视化。【结...
基于大众标注的层次信息可视化算法研究

作者：杨如意; 刘东苏刊期：2014年第07期

【目的】为了更好地分析大众标注的语义关系，以层次可视化的方式增强用户感知。【应用背景】大众标注可以从普通用户的角度很好地反映网络资源的意义。层次信息可视化技术作为一种有效的表现抽象信息的工具，被广泛应用于辅助用户认知和分析层次数据集。【方法】提出五元组描述大众标注的语义的方法，借用归类方法使大众标注具有层次关系，基于...
ProQuest扩大对Spectrum奖学金项目的资助范围

刊期：2014年第07期

一直以来，图书馆作为终身学习的一个基础设施服务于社会。但是，随着图书馆的转型，对具有多元背景的新一代图书馆员的需求更加迫切。美国图书馆协会（ALA）于近日宣布ProQuest将扩大对图书馆界Spectrum奖学金计划的资助范围。
用户在线评论数据挖掘的网商信用度分析

作者：毕达宇; 夏晓旭; 王婧刊期：2014年第07期

【目的】对搭载第三方电子商务平台的网商信用度进行分析。【方法】通过德尔菲法确立网商信用度评价指标体系权值；运用中文分词技术及情感词极性识别方法对用户评价进行量化；运用灰色关联分析方法对获取的数据进行信用度得分计算。【结果】通过用户对网商信用度的评价，得出网商信用度在非常好、较好、一般及较差4个等级的用户评价隶属度，进...
科研领域关键词网络的结构特征与启示——基于图情学科的实证研究

作者：陈果; 胡昌平刊期：2014年第07期

【目的】系统揭示科研领域关键词网络在整体层面、节点层面的共性结构特征，为后续研究提供依据。【方法】以多个领域为对象，对比分析其关键词网络与随机网络、小世界网络、无标度网络参数，拟合其指标分布、指标间相关性特征。【结果】关键词网络度序列呈负幂律分布、具有极高平均聚类系数和较短平均路径长度；其词频、节点的度数、中介中心性...

数据专员工作总结数据专员述职报告数据交换技术论文数据保密解决方案数据信息论文数据分析分析技术数据分析实训总结数据分析师统计学基础数据分析方法数据分析毕业论文数据分析的前景数据分析的方法

数据分析与知识发现杂志 CSSCI南大期刊 CSCD期刊 统计源期刊

Data Analysis and Knowledge Discovery

中国科研人员对arXiv认知和使用的现状调查与分析

科技知识组织体系共享服务平台服务接口建设研究

中图法与DDC类目自动映射研究

针对训练集分布偏斜问题的数字资源文本分类方法

利用小样本量机器学习实现学术文摘结构的自动识别

融合LDA与TextRank的关键词抽取研究

EBSCO为其开放元数据共享和技术协作政策增加50个数据库

利用主题标引进行查询重排序

PlumX增加EBSCO数据库中用户使用情况数据

一种基于自组织映射与径向基函数预测补值的协同过滤推荐方法

Folksonomy中Tag语义距离测度与可视化研究

基于大众标注的层次信息可视化算法研究

ProQuest扩大对Spectrum奖学金项目的资助范围

用户在线评论数据挖掘的网商信用度分析

科研领域关键词网络的结构特征与启示——基于图情学科的实证研究

数据分析与知识发现杂志 CSSCI南大期刊 CSCD期刊 统计源期刊

Data Analysis and Knowledge Discovery

中国科研人员对arXiv认知和使用的现状调查与分析

科技知识组织体系共享服务平台服务接口建设研究

中图法与DDC类目自动映射研究

针对训练集分布偏斜问题的数字资源文本分类方法

利用小样本量机器学习实现学术文摘结构的自动识别

融合LDA与TextRank的关键词抽取研究

EBSCO为其开放元数据共享和技术协作政策增加50个数据库

利用主题标引进行查询重排序

PlumX增加EBSCO数据库中用户使用情况数据

一种基于自组织映射与径向基函数预测补值的协同过滤推荐方法

Folksonomy中Tag语义距离测度与可视化研究

基于大众标注的层次信息可视化算法研究

ProQuest扩大对Spectrum奖学金项目的资助范围

用户在线评论数据挖掘的网商信用度分析

科研领域关键词网络的结构特征与启示——基于图情学科的实证研究

数据分析与知识发现杂志 CSSCI南大期刊 CSCD期刊统计源期刊