杂志简介:《数据分析与知识发现》杂志经新闻出版总署批准,自1980年创刊,国内刊号为10-1478/G2,是一本综合性较强的计算机期刊。该刊是一份月刊,致力于发表计算机领域的高质量原创研究成果、综述及快报。主要栏目:数学图书馆 、知识组织与知识管理、情报分析与研究 、应用实践 、动态、特邀专栏、金融证券管理、企业信息管理技术
作者:张晓林 刊期:2016年第01期
图书馆学情报学正经历信息技术驱动下的巨大范式转变。必须承认,图书馆学情报学领域最近二十余年发展的关键驱动力就是数字技术、网络技术、语义技术等。计算机信息检索、数字图书馆、网络信息服务、知识组织系统、语义网络、数据挖掘、数字长期保存等等,早已是文献信息服务的发展热点,早成为图书馆学情报学的内在组成部分。
作者:张梦霞; 顾立平 刊期:2016年第01期
【目的】探索数据监管政策的实施细节,促进数据监管政策的建立。【方法】通过梳理国内外数据监管的相关理论成果,并分别从科学数据的遴选标准、存储规范和传播交流机制三方面进行归纳和总结。【结果】数据监管的政策要素主要包括:数据遴选标准(符合数据提交流程要求、优先遴选原则、数据真实可用的声明、数据来源不具争议性);数据存储规范(...
作者:刘峰; 张晓林 刊期:2016年第01期
【目的】提出一套科学数据管理计划的细化构成规范;并依此从可操作角度构建数据监护模型。【方法】对国际上主要科研管理机构的数据管理计划规范进行调研和统计;并结合当前科研数据管理的需求与特点进行补充。【结果】形成8大基本构成要素和39个子要素的数据管理计划细化构成规范,并构建出一种以数据管理计划为核心驱动的数据监护模型。【结论】...
作者:丁恒; 陆伟 刊期:2016年第01期
【目的】梳理基于相关性的跨模态信息检索中的基本策略和核心问题,从提升检索效果的角度探讨偏最小二乘法用于特征子空间投影的优劣。【方法】在Wikipedia跨模态信息检索数据集上,分别采用LDA和BOW模型作为文本和图像资源的特征表达方式,以余弦距离作为相似度度量方法,利用最小二乘法替代典型相关性分析法学习特征子空间投影函数。【结果】从P@K...
作者:张策; 都云程; 梁然 刊期:2016年第01期
【目的】通过构建简单数据样本,解决传统网页类型识别方法效率低的难题。【方法】采用URL特征作为识别依据,抽取URL信息构建训练集与测试集,使用支持向量机(SVM)建立机器学习模型以提高识别效率。【结果】在同样的数据集上,该方法的准确率为91.2%,优于其他识别方法。在效率性能方面,该方法提升近60%。【局限】当遇到URL特征不明显甚至完全相背...
作者:张李义; 刘畅 刊期:2016年第01期
【目的】解决电子商务平台中存在的虚假交易问题。【方法】依据消费者历史购买和评论行为数据,提出一种结合深度置信网络和模糊集的虚假交易识别方法,通过识别虚假交易的用户(刷客)进行虚假交易的识别。【结果】识别准确率达到89%,与浅层机器学习模型试验结果进行对比,其综合性能有明显提升。【局限】相对于淘宝存在的海量刷客,实验数据较少。...
作者:张亚明; 李娜; 赵培卿 刊期:2016年第01期
【目的】帮助网络团购消费者快速找到优质商家,商家可以有效地提高自身信用水平。【方法】利用相似权测度法对指标体系分配权重,得出的综合指标变量作为蚁群算法参数,建立基于蚁群相似权的信用评价模型。【结果】实证研究表明,该模型能够快速有效地求出节约时间成本和货币成本的最短路径,找出优质商家。【局限】未考虑退款和刷单等特殊交易对网...
刊期:2016年第01期
近日,Biblio Commons了题为《英国公共图书馆的基本数字基础设施:面向未来的计划》的报告。该报告主要研究目前用户在图书馆的体验情况,并试图给出建立一个汇总性数字图书馆的方法。该报告由英国艺术委员会赞助,并且得到一系列合作伙伴的支持。报告中的主要观点包括:
作者:杨如意; 刘东苏; 李慧 刊期:2016年第01期
【目的】在LDA模型基础上融合时间和作者特征,提出动态作者主题(DAT)模型,更好地揭示文本内容、主题和作者之间的关系。【应用背景】从海量文本中实现特征抽取和语义挖掘已经成为情报研究人员的重要工作。【方法】获取NIPS会议论文作为数据集并进行预处理,按发表年份划分到每个时间片形成一阶马尔科夫链,使用困惑度确定最优主题数,并在每个时...
刊期:2016年第01期
美国德州农工大学图书馆于近日宣布计划加入Kuali OLE(Open Library Environment,开放图书馆环境)和Kuali基金会,双方正式成为合作伙伴。Kuali OLE是一个企业规模的、基于云计算的、源于科研社区的图书馆管理系统,其建立在开放标准上,目的是构建一个健壮的企业工作流引擎,为图书馆业务流程的高效管理提供保障。OLE支持多种学术信息资源和格式,...
作者:魏静; 朱恒民; 宋瑞晓; 蒋世兵 刊期:2016年第01期
【目的】通过网络舆情传播中网民个体的“从众效应”和“阈值效应”的传递特点分析,对舆情传递的链路结构进行预测。【方法】采集真实网络舆情传递在线数据,利用舆情传递个体的节点属性及舆情传递网络结构的已知信息,使用链路预测方法,分别针对网络舆情无标度(BA)网络模拟数据和真实舆情传递网络数据,预测已有节点间即将产生的舆情传递连接。...
作者:夏立新; 谭荧 刊期:2016年第01期
【目的】对关联开放数据(LOD)进行结构特征分析,利用分析结果指导关联数据的组织实践。【方法】通过度分布、平均路径长度、聚类系数等指标描述LOD网络结构,对比复杂网络理论中的两个基本性质:无标度特性和小世界效应。【结果】LOD整体网络结构具有近似无标度网络的幂率分布特征,图书馆学、情报学领域子网具有相对均匀的指数分布特征,两网同...
作者:朱惠; 杨建林; 王昊 刊期:2016年第01期
【目的】对如何从中文非结构化文本获取术语的层次关系进行探讨。【方法】从CNKI获取数字图书馆学科领域文献,通过术语抽取、术语向量空间模型构建、BIRCH算法聚类和聚类标签确定构建术语的语义层次结构。【结果】构建数字图书馆领域术语的层次结构,并对构建结果进行验证,聚类正确率达到80.88%,类标签抽取正确率达到89.71%。【局限】对构建效果...
作者:董智鹏; 刘静羽 刊期:2016年第01期
【目的】利用Drupal快速搭建“开放资源建设”项目的成果管理和网站。【应用背景】“开放资源建设”项目需要在有限时间和技术条件下建立成果平台,Drupal因其灵活简易、具备强大模块支持等特点能够满足该需求。【方法】采用Drupal基本模块和扩展模块完成内容建设和页面布局,并对主题定制、网站升级中的难点问题进行处理。【结果】利用Drupal短时...
刊期:2016年第01期
OCLC研究中心和美国图书馆学情报学教育协会(Association for Library and Information Science Education,ALISE)已经资助由10个研究员主持的5个研究项目。这一资助名单是在2016年1月7日于波士顿举行的ALISE年会颁奖午宴上公布的。
若用户需要出版服务,请联系出版商,地址:北京中关村北四环西路33号,邮编:100190。