《数据分析与知识发现》杂志2015年第03期期刊目录-发表之家

构建可信赖的数字资源长期保存系统摄入工作流

作者：吴振新; 王玉菊; 付鸿鹄; 李春旺; 刘建华刊期：2015年第03期

【目的】在数字资源长期保存实践中，基于可信赖仓储认证标准的要求，探索可信赖数字资源保存系统的摄入处理流程。【方法】中国科学院文献情报中心的数字资源长期保存系统需要接收、处理、存档来自多个出版商的数据，摄入工作流是该系统的一个重要组成部分。基于可信赖仓储认证标准，在摄入流程设计与开发中，采用工作流程管理理论以及信任链机...
Koha获得EBSCO大力支持，以改进开源图书馆自动化系统

刊期：2015年第03期

Koha是图书馆员开发的图书馆自动化系统，是第一个开源的图书馆自动化系统，在全世界范围内得到了广泛的应用。EBSCO信息服务商是一个家族企业，致力于提供改善图书馆的解决方案。这两家单位于近日开始合作，目标是提供一个适合于所有图书馆的、基于Web的、可行的、开源的图书馆自动化系统，实现功能如下：
ORCID在机构知识库中的整合介绍

作者：白海燕刊期：2015年第03期

【目的】了解ORCID在IR中的整合现状、整合实践以及实现的技术方法。【方法】对IR整合ORCID的实践进行文献追踪和案例分析；对IR通用平台开源软件的整合功能进行技术分析。【结果】得到IR整合ORCID的发展策略和推进机制、整合实现的技术框架以及应用场景、嵌入流程、技术开发等多方面的示范和最佳实践。【结论】国内IR应参照先进经验和自身需求...
基于LDA主题关联过滤的领域主题演化研究

作者：秦晓慧; 乐小虬刊期：2015年第03期

【目的】发现领域文献中主题的新生、消亡、继承、分裂和合并的演化轨迹。【方法】根据文献出版时间划分多个时间窗口，通过LDA主题模型识别各个时间窗口中的主题；利用主题关联（TopicAssociation）过滤规则确定相邻时间窗口主题间的演化关系；形成连续时间段内主题新生、消亡、继承、分裂和合并的演化轨迹。【结果】在保证主题延续性的条件下...
带权复杂图模型的专利关键词标引研究

作者：李军锋; 吕学强; 周绍钧刊期：2015年第03期

【目的】专利关键词标引是中文信息处理领域较为基础的环节，在专利检索、专利翻译以及专利自动摘要中具有较高的应用价值。【方法】采用K-最邻近耦合图将专利文献映射成复杂网络图模型，结合平均路径变化量、平均聚类系数变化量以及当前节点对整个复杂图模型流动性的影响，提出平均连通权重评价指标。分析关键词位置信息、关键词跨度信息以及关...
基于结构和编辑历史的Wikipedia信任模型

作者：李慧; 相华婷; 汤强刊期：2015年第03期

【目的】准确计算Wikipedia中词条的可信度。【方法】采用文本分析法将词条当前版本与其历史版本进行比较，获取各版本作者的有效编辑内容，并结合词条当前版本包含的参考文献数和图片数等结构信息，构建一个动态的词条信任评价模型。【结果】通过仿真实验表明该模型能够很好地区分Wikipedia中高信任词条和低信任词条。【局限】通过该算法得出的...
一种基于类别描述的TF—IDF特征选择方法的改进

作者：徐冬冬; 吴韶波刊期：2015年第03期

【目的】对特征权重公式进行改进，提高文本分类精度。【方法】引入类内、类间信息并修正TF-IDF权重因子，得到基于类别描述的TF-IDF-CD方法。将其在偏斜文本集和均衡文本集下分别与NB、KNN等分类方法结合进行文本分类实验，比较其与TF-IDF、CTD等方法的分类精确度。【结果】TF-IDF-CD方法在特征项较少时已有很好分类效果。相比TF-IDF,在不同文...
基于动态标签-资源网络图的信息资源推荐

作者：王忠群; 蒋胜; 修宇; 皇苏斌; 汪千松刊期：2015年第03期

【目的】解决推荐系统向目标用户推荐过时信息资源的问题。【方法】提出一种基于动态标签一资源网络图的个性化信息资源推荐方法。以资源拥有的共同标签作为连边，建立资源网络图以形成资源语义链，再由资源网络图的连边投影构建具有时间属性的标签网络图以刻画用户兴趣漂移，继而在标签网络图中匹配目标用户兴趣的动态标签，实现为用户推荐精准...
一种基于本体和位置感知的图书馆书籍推荐模型

作者：李胜; 王叶茂刊期：2015年第03期

【目的】改善图书馆的推荐服务，帮助用户选择感兴趣的书籍资源。【方法】结合wi-Fi室内定位技术，提出一种基于本体和具有位置感知的图书馆书籍推荐模型。通过构建书籍分类本体，结合用户偏好和区域组偏好，在考虑推荐处理触发机制问题下进行推荐。【结果】与现有综合本体和协同过滤方法相比，提出的模型在推荐精度和相关度上分别提高13．56％...
美国和加拿大中小学将数字资源融入课堂教学

刊期：2015年第03期

近日，一项调查显示，美国和加拿大近2／3的中小学已经在执行数字内容计划，以辅助学生在课堂内外的学习，该调查由基于云的差异化学习应用程序LearningBird执行。调查结果显示，65％的学校从过去的纸质阅读学习环境转移到了数字学习环境，不仅根据教学课程为学生设置数字内容，同时还为教师提供专业的学习机会。另外，学校购买的数字内容可以帮...
电商用户需求状态的聚类分析——以淘宝网女装为例

作者：张文君; 王军; 徐山川刊期：2015年第03期

【目的】通过浏览器Et志挖掘探测消费者在电商平台下网购的需求状态，以实现有效的购物引导。【方法】获取淘宝网女装购物会话，对会话中的页面类型进行标记，对标记后的会话数据基于访问的页面特征（包括页面类型和页面复杂度）进行聚类分析，从而揭示电商用户的需求状态。【结果】基于页面类型聚类得出4种典型的电商用户需求状态类型，包括后...
行业网站搜索引擎优化指标及实证研究—基于信息生态视角的分析

作者：王晰巍; 赵丹; 杨梦晴; 魏俊巍刊期：2015年第03期

【目的】构建基于信息生态视角的行业网站搜索引擎优化指标，以指导行业网站建设和提升网站核心竞争力。【方法】从信息生态视角出发，构建“生态—搜索引擎优化”指标体系，利用层次分析法对国内外10个具有代表性的云存储网站进行实证分析。【结果】实证结果表明软硬件技术的成熟为行业网站发展创造了良好的产业环境，国外行业网站搜索引擎优化...
中国ORCID注册平台iAuthor的设计与实现

作者：张建勇; 黄永文; 于倩倩; 董智鹏; 郭舒刊期：2015年第03期

【目的】为中国科研人员提供ORCID注册，并建立个人科研成果管理空间。【应用背景】0RCID致力于解决学术研究中的科研人员姓名歧义问题，而这一问题也长期困扰中国学术界，通过与ORCID合作，满足中国科研人员身份唯一识别需求。【方法】通过ORCID提供的API帮助科研人员注册或关联ORCID，以CASIR、CSCD、WebofScience等作为基础数据源，快速形成...
科技知识组织体系（STKOS）相关工具集成服务系统的设计与实现

作者：方安; 吴思竹; 洪娜; 钱力; 王颖; 胡佳慧刊期：2015年第03期

【目的】科技知识组织体系课题产出了大量知识组织相关工具，为避免工具重复建设，实现对这些工具的复用和共享。【应用背景】“面向外文科技文献信息的知识组织体系建设和应用示范”项目是国家“十二五”科技支撑计划项目，构建了包含超级科技叙词表、本体、范畴在内的，覆盖理、工、农、医的多层次知识组织体系。在科技知识组织体系建设过程中...
基于Gimbal^TM的轻量级高校图书馆情景感知推送服务平台开发及试验

作者：鲁晓明刊期：2015年第03期

【目的】利用高通公司推出的Gimbal^TM建设轻量级的图书馆情景感知推送服务平台。【应用背景】通过用户的智能移动终端设备获取其地理位置和兴趣偏好等信息，并以此为依据提供情景感知的个性化服务，是提升用户体验的重要途径。【方法】选择Android环境下的GimbalSDK开发图书馆情景感知推送服务客户端应用程序，在服务器GimbalManager端设置地理...

数据专员工作总结数据专员述职报告数据交换技术论文数据保密解决方案数据信息论文数据分析分析技术数据分析实训总结数据分析师统计学基础数据分析方法数据分析毕业论文数据分析的前景数据分析的方法

数据分析与知识发现杂志 CSSCI南大期刊 CSCD期刊 统计源期刊

Data Analysis and Knowledge Discovery

构建可信赖的数字资源长期保存系统摄入工作流

Koha获得EBSCO大力支持，以改进开源图书馆自动化系统

ORCID在机构知识库中的整合介绍

基于LDA主题关联过滤的领域主题演化研究

带权复杂图模型的专利关键词标引研究

基于结构和编辑历史的Wikipedia信任模型

一种基于类别描述的TF—IDF特征选择方法的改进

基于动态标签-资源网络图的信息资源推荐

一种基于本体和位置感知的图书馆书籍推荐模型

美国和加拿大中小学将数字资源融入课堂教学

电商用户需求状态的聚类分析——以淘宝网女装为例

行业网站搜索引擎优化指标及实证研究—基于信息生态视角的分析

中国ORCID注册平台iAuthor的设计与实现

科技知识组织体系（STKOS）相关工具集成服务系统的设计与实现

基于Gimbal^TM的轻量级高校图书馆情景感知推送服务平台开发及试验

数据分析与知识发现杂志 CSSCI南大期刊 CSCD期刊 统计源期刊

Data Analysis and Knowledge Discovery

构建可信赖的数字资源长期保存系统摄入工作流

Koha获得EBSCO大力支持，以改进开源图书馆自动化系统

ORCID在机构知识库中的整合介绍

基于LDA主题关联过滤的领域主题演化研究

带权复杂图模型的专利关键词标引研究

基于结构和编辑历史的Wikipedia信任模型

一种基于类别描述的TF—IDF特征选择方法的改进

基于动态标签-资源网络图的信息资源推荐

一种基于本体和位置感知的图书馆书籍推荐模型

美国和加拿大中小学将数字资源融入课堂教学

电商用户需求状态的聚类分析——以淘宝网女装为例

行业网站搜索引擎优化指标及实证研究—基于信息生态视角的分析

中国ORCID注册平台iAuthor的设计与实现

科技知识组织体系（STKOS）相关工具集成服务系统的设计与实现

基于Gimbal^TM的轻量级高校图书馆情景感知推送服务平台开发及试验

数据分析与知识发现杂志 CSSCI南大期刊 CSCD期刊统计源期刊