杂志简介:《南京大学学报·自然科学》杂志经新闻出版总署批准,自1955年创刊,国内刊号为32-1169/N,是一本综合性较强的科技期刊。该刊是一份双月刊,致力于发表科技领域的高质量原创研究成果、综述及快报。主要栏目:数据驱动的知识发现、大数据分析、学习和决策、台风发展的动力与物理过程
作者:刘宏; 申德荣; 寇月; 聂铁铮; 于戈 刊期:2017年第06期
实体识别(Entity Resolution)是指判断一个或多个数据源中两个不同记录是否描述相同实体,它有时也被称作记录连接(Record Linkage),在数据集成中被用于数据清洗(Data Clean)、去重(Deduplication)和相似连接(Similarity Joins)等集成操作中.实体识别技术可被广泛应用于人口普查、引文识别、Web搜索、数据清洗以及剽窃检验等诸多领域....
作者:巩皓; 杜军平; 赖金财; 梁美玉; 王巍; 罗盎 刊期:2017年第06期
传统的基于关键词匹配的查询方法因查询词短少,微博博文短小,容易引起歧义性,对查询效率有较大影响.提出一种基于本体和局部查询反馈的微博查询扩展算法,首先结合安全领域文档构建安全领域本体知识库,然后利用本体提供的语义知识对初始查询词进行扩展,再结合局部查询反馈对候选扩展词集进行筛选,最后通过二次查询和迭代操作得到最终查询结果.实...
作者:顾沈明; 张昊; 吴伟志; 谭安辉 刊期:2017年第06期
多粒度是当前粒计算研究的一个重要方面.在实践中,人们往往选择比较合适的粒度层次来解决问题.作为信息系统的一种特殊情况,多粒度决策系统是经常使用数据表示形式.在这样的系统中,对象可以在属性的不同粒度层次上取不同的观测值.实际使用时,常常遇到在数据属性上需要比较大小,即属性带有序关系.序关系分析是多指标决策的重要内容,而粗糙集是一...
作者:徐智康; 李旸; 李德玉 刊期:2017年第06期
层次多标签分类方法,依据标签之间的相关性组织成层次结构,并将这种层次结构作为一种监督信息,从而更好地解决多标签分类问题.在层次多标签分类问题中常用的方法有两种,一种可称为损失无关方法,另一种可称为损失敏感方法.对于损失敏感方法,常用的损失函数有HMC-loss,该损失函数可对假正和假负两种错误给予不同的权重,并将层次信息添加到损失函数...
作者:严丽宇; 魏巍; 郭鑫垚; 崔军彪 刊期:2017年第06期
随机子空间聚类集成通过属性随机采样产生属性子空间,并将子空间上的基聚类结果进行集成得到最终聚类结果.在这一过程中,子空间产生的随机性虽然为聚类集成提供了很大的差异度,但是无法保证基聚类结果的有效性,这是因为随机产生的子空间有可能只包含极少的重要属性.针对这一不足,提出了一种带核随机子空间生成策略:首先依据粗糙集理论中的互补...
作者:宋云霞; 强彦; 赵涓涓; 唐笑先; 田奇 刊期:2017年第06期
肺结节CT图像的相似性检索是计算机辅助诊断系统中最重要的部分,目前常用的检索方法通常匹配精度低,检索速度慢.针对上述问题,提出一种新的基于视觉信息与征象标签的双概率超图哈希算法,使用两层结构提高肺结节图像的检索精度:在第一层,将肺结节影像视觉信息和标签信息分别构建概率超图,最优划分概率超图得到哈希码;在第二层,使用结节图像的视...
作者:吴毓双; 陈筱语; 马静雯; 陈兴国 刊期:2017年第06期
在强化学习的值函数线性估计问题中,时序差分不动点解和贝尔曼残差的方法都是对真实值函数的斜投影,然而这两种解经证明都不是最优解.通过对两种投影进行加权平均,提出了一种一般化的斜投影算子.基于此推导出两种残差时序差分学习算法,并给出了这两种算法在异策略下的收敛性证明.在著名的Baird的异策略反例实验上,与相关算法进行了对比,实验结果...
作者:陈辉皇; 林耀进; 林国平; 唐莉 刊期:2017年第06期
多数据源高投票决策规则挖掘是指从多数据源中挖掘存在大部分数据源且具有重要意义的决策规则,此类规则在银行理财产品营销、市场营销、疾病诊断等领域中具有指导性作用.利用样本邻域粒化来构建决策规则的表现形式,在此基础上定义了覆盖度、投票数等多种决策规则的度量指标,用以挖掘满足这些度量指标的高投票决策规则.实验结果验证了所提算法挖...
作者:公冶小燕; 林培光; 任威隆; 张晨; 张春云 刊期:2017年第06期
信息主题的抽取是快速定位用户需求的基础任务,主题词抽取时主要存在三个问题:一是词语权重的计算,二是词语间关系的度量,三是数据维度灾难.在计算词权重时首先利用互信息确定共现词对,与词频、词性、词位置信息非线性组合,然后,根据词权重构建文档—共现词矩阵并建立潜在语义分析(Latent Semantic Analysis,LSA)模型.该方法借助LSA模型的奇...
作者:赵天娜; 米据生; 解滨; 梁美社 刊期:2017年第06期
决策粗糙集提供了处理不确定数据和风险数据决策问题的一个新方法,基于决策粗糙集的三支决策理论是典型的风险决策理论的推广.传统的直觉模糊粗糙集采用一对三角模与蕴涵算子来构造逻辑算子,未考虑属性之间的差别,而多伴随直觉模糊粗糙集采用多个伴随对构造逻辑算子,更好地体现了用户偏好.构造了多伴随直觉模糊粗糙集模型,研究了基于多伴随直觉...
作者:郑玮; 杨万扣; 邵斐; 赵炜 刊期:2017年第06期
以稀疏表示为代表的回归分类方法对于高斯噪声具有较好的鲁棒性,但容易受到训练样本中离群点数据的影响导致欠拟合或过拟合.通过探索余弦函数对离群数据呈现的周期不敏感特性,使用余弦函数来刻画回归残差,并在复数域空间进行稀疏回归,提出了三角稀疏回归分类器(TSRC)模型.考虑到模型的非凸特性,普通的迭代算法难以获得全局最优解.因此,通过三...
作者:张振华; 林小龙; 甘穗福; 袁申国; 胡勇 刊期:2017年第06期
熵和知识测度是表示模糊系统不确定性和有序性程度的重要工具,目前已有诸多研究成果.直觉模糊集比传统模糊集多了犹豫度向量,其模糊性和不确定性比传统模糊集更复杂.因此,在直觉模糊熵和直觉模糊知识度量领域,现有研究存在诸多不足,尤其缺乏对公理体系的细化研究,算子之间的对比和遴选缺乏统一的理论和方法指导.基于此,首先对Szmidt和Kacprzyk的...
作者:吴家豪; 彭志平; 崔得龙; 李启锐; 何杰光 刊期:2017年第06期
随着大数据时代的来临,传统的工作流计算平台已经无法满足大量工作流应用的计算要求.因此,工作流应用开始由原有的基础设施转移到更加高效、可靠、廉价的云平台上.针对现有的云工作流调度算法执行时间最小化、作业最优分配以及调度算法的收敛时间问题,提出一种基于多Agent系统的粒子群遗传优化云工作流调度算法.该算法首先利用粒子的自身历史最...
作者:谢峰; 蔡瑞初; 陈薇; 郝志峰 刊期:2017年第06期
线性非高斯无环模型(LiNGAM)具有在没有任何先验知识的情况下能够仅仅从观察数据中完整地识别因果网络的优势,这使得它得到了越来越多研究者的关注.然而,现有求解LiNGAM模型的算法中一部分存在对初始值敏感,容易陷入局部最优解的问题,一部分存在对于外生变量识别率低的缺陷.为此,提出了一种基于最大最小独立性的因果发现算法.通过引入自适应的...
作者:汪鹏; 赵学礼; 李娜娜; 董永峰 刊期:2017年第06期
情感分类的主要目的是预测用户在互联网中情绪数据的极性(积极的或者消极的),各种语言的情感分析已经成为诸多应用的研究热点,然而由于不同语言的情感资源在质量和数量上的不平衡,通常使用源语言来改善目标语言的跨语言情感分类方法,来提高目标语言情感分类的准确性.传统的跨语言情感分类主要是通过机器翻译将目标语言映射到源语言中,但是分类...
相关文章
南京社会实践总结