作者:许小媛; 黄黎 期刊:《现代电子技术》 2019年第21期
距离度量学习是机器学习领域较为活跃的研究课题之一,文中利用UCI(加州大学欧文分校)数据库的数据对度量学习算法进行比较研究。为了寻找一种可靠的没有明确定义标志的算法,选择四种算法在UCI的六个数据集上对距离矩阵进行比较。每个样本数据集的性质(尺寸和维度)是不同的,因此算法的结果也不同。编码相似度算法在大多数情况下表现良好。在未来的实际应用领域,对于提高无标记数据和相似集的距离度量学习算法的精确性提供了研究基础...
作者:章东平; 徐丽园 期刊:《中国计量大学学报》 2016年第04期
针对在不同的摄像头场景下,光线、摄像头参数的差异较大使得行人重识别困难的问题,提出一种基于距离度量学习的方法进行行人重识别.该方法首先为每一对摄像头学习一个距离度量模型.其次,根据上述因素的影响强度为这些度量模型赋予相应的权值.最后,对度量模型与其相应权值的乘积进行累加与优化,得到最终的距离度量模型.经过在两个公共数据集中进行行人重识别实验,其结果显示所提出的方法能够提高行人重识别的正确率.
作者:张婷; 高颖; 王东; 吕炎; 董军宇; 亓琳; 陈鹏 期刊:《中国棉花》 2018年第08期
由于人工定级的方法存在如效率低、主观性强等诸多弊端,本文提出了1种经济有效的棉花品级分类方法。使用主成分分析法对数据集进行预处理,从而降低特征向量的维度;使用大边界k近邻算法学习得到1个马氏距离度量矩阵,从而实现对棉花图像的分析、特征提取等操作,使用距离度量学习、机器学习的技术来模拟人类的视觉感知;训练k近邻分类器,从而实现棉花品级的自动分类。通过试验证明了本文提出的方法可以有效现实棉花品级分类。
作者:王法强; 张宏志; 王鹏; 邓红; 张大鹏 期刊:《智能计算机与应用》 2019年第01期
相似度学习方法通过学习合适的相似度度量以改进模型的分类或聚类效果。现有的研究表明,相似度学习方法在很多计算机视觉问题中起到重要的作用。近年来随着数据规模的急剧增大和应用领域的多样化,相似度学习问题发展了很多新的研究领域。本文介绍了近年来相似度学习问题的研究进展和发展过程,包括从传统的二元组和三元组约束发展到新型相似度约束、从欧氏距离与马氏距离发展到新型相似度度量、从图像间的相似度学习发展到图像集之...
作者:张娜; 张福星; 王强; 胡玲玲; 桂江生 期刊:《计算机系统应用》 2018年第05期
当前的行人再识别在度量学习上采用马氏距离相似度函数,该相似度函数只与特征差分空间有关,忽略了一对行人图像中每个个体的外观特征,针对上述问题,提出了通过学习一个双向关系相似度函数(Bidirectional Relationship Similarity Function,BRSF),来计算一对行人图像的相似度.BRSF不但描述了一对行人图像的互相关关系,而且关联了一对行人图像的自相关关系.该文利用KISSME(Keep It Simple and Straightforward Metric)算法的思想...
作者:仰迪; 白延琴; 李倩 期刊:《运筹学学报》 2018年第02期
考虑求解一类半监督距离度量学习问题.由于样本集(数据库)的规模与复杂性的激增,在考虑距离度量学习问题时,必须考虑学习来的距离度量矩阵具有稀疏性的特点.因此,在现有的距离度量学习模型中,增加了学习矩阵的稀疏约束.为了便于模型求解,稀疏约束应用了Frobenius范数约束.进一步,通过罚函数方法将Frobenius范数约束罚到目标函数,使得具有稀疏约束的模型转化成无约束优化问题.为了求解问题,提出了正定矩阵群上加速投影梯度算法,克...
作者:文俊浩; 戴大文; 余俊良; 高旻; 张宜浩 期刊:《计算机科学》 2018年第10期
为解决传统推荐系统中存在的冷启动难题,基于距离反映偏好的假设提出了一种融合矩阵分解与距离度量学习的社会化推荐算法。该算法同时对样本和距离度量进行训练,在满足距离约束的前提下更新距离度量和用户与项目的坐标,并将用户与项目嵌入到统一的低维空间,利用用户与项目之间的距离生成推荐结果。基于豆瓣和Epi-nions数据集的对比实验结果验证了该方法可有效提高推荐系统的可解释性和精确度,明显优于基于矩阵分解的推荐方法...
作者:冀中; 谢于中; 庞彦伟 期刊:《天津大学学报·社会科学版》 2017年第08期
零样本学习是一类特殊的图像分类问题,是指测试数据的类别在训练数据中没有出现的情况.为了更好地描述语义特征空间中图像特征和语义特征的距离关系,本文将距离度量学习引入零样本学习任务.具体而言,首先利用典型相关分析将样本的图像特征和相应类别的语义特征映射至公共特征空间;然后,利用距离度量学习衡量图像特征和语义特征之间的距离;最后,使用最近邻分类器进行分类.通过在流行的Aw A和CUB数据集中的实验,证明了所提方法的有效...
作者:逯波; 段晓东; 王存睿; 李泽东 期刊:《大连民族学院学报》 2017年第01期
提出利用多图像组信息构建二部学习框架进行人脸识别。首先,利用两种不同的多图像组信息源分别学习两个相应的度量空间模型;其次,将得到的模型合并为一个统一的判别距离度量空间;最后,对所构建的二部学习框架进行范化,使得框架中的多图像组信息能够用来进行子空间学习和距离度量学习。通过在多个标准通用数据集上得到实验结果验证了所提出方法的有效性。
作者:詹增荣; 程丹 期刊:《湖南师范大学自然科学学报》 2016年第05期
提出了一种基于隐含狄利克雷分布(LDA)与距离度量学习(DML)的文本分类方法,该方法利用LDA为文本建立主题模型,借助Gibbs抽样算法计算模型参数,挖掘隐藏在文本内主题与词的关系,得到文本的主题概率分布.以此主题分布作为文本的特征,利用DML方法为不同类别的文本学习马氏距离矩阵,从而较好的表达了文本之间的相似性.最后在学习到的文本间距离上,利用常用的KNN及SVM分类器进行文本分类.在经典的3个数据集中的实验结果表...
作者:罗剑; 杨印根; 雷震春 期刊:《计算机工程与应用》 2016年第11期
I-vector说话人识别系统常用距离来衡量说话人语音间的相似度。加权成对约束度量学习算法(WPCML)利用成对训练样本的加权约束信息训练一个用于计算马氏距离的度量矩阵。该度量矩阵表示的样本空间中,同类样本间的距离更小,非同类样本间的距离更大。在美国国家标准技术局(NIST)2008年说话人识别评测数据库(SRE08)的实验结果表明,WPCML算法训练度量矩阵用于马氏距离相似度打分,比用余弦距离相似度打分的性能更好。选择训练样本...
作者:高山 祖辰 张道强 期刊:《计算机研究与发展》 2012年第11期
在数据挖掘和机器学习的基于距离的各种技术中,例如基于距离的聚类和基于距离的分类,如何度量数据间的相似性已经成为一项基础任务.对于某一具体问题,采用合适的相似性度量,会使问题得到更有效的解决.越来越多的研究表明,通过对成对约束(正约束和负约束)的充分利用,从而得到与问题相匹配的相似性度量,能够大幅度地提升算法性能.目前基于约束的相似性度量研究主要是基于约束的距离度量学习,通过对约束信息的利用,学习...
作者:吕清秀 郭志刚 赵永威 期刊:《信息工程大学学报》 2013年第05期
在视觉单词包模型(bag of visual words,BoVW)模型中,由于特征检测的不足、聚类算法的缺陷及视觉单词的量化误差,用BoVW模型产生的视觉词典中,存在视觉单词同义性和歧义性的问题,因此用BoVW计算图像距离时,效果不太理想.BoVW模型产生的词典规模巨大,学习一个普通矩阵需要的运算量难以接受.针对BoVW模型上述缺陷,文章提出了一种基于SVM的BoVW距离度量学习方法.该方法利用SVM训练一个将相似图像对与非相似图像对最大程度分离的超平...
作者:吕清秀 李弼程 高毫林 期刊:《信号处理》 2013年第05期
现有的距离度量学习算法都是假设训练数据和测试数据服从相同的分布,但是该假设在实际中不一定成立。当训练数据和测试数据的分布不同时,利用训练数据学习得到的度量函数可能难以适用于测试数据。针对上述问题,本文在NCA(Distance metric learning with Probability Density Ratio Estimation, DML-PDR)。在UCI数据集和Corel图像库上的KNN分类实验表明,新方法克服了传统度量学习方法的不一致问题,提高了分类的准确率。
作者:任世锦 宋执环 凌萍 杨茂云 期刊:《小型微型计算机系统》 2014年第10期
利用数据集几何结构鉴别信息、未标记数据集等隐含先验信息是提高模式分类器性能的有效方法.实际数据集不仅具有多模态、含噪、高维等特性,而且训练数据集和测试数据集分布存在差异的现象,降低了支持向量机(Support vector machine,SVM)的性能.基于迁移学习、局部Fisher鉴别分析等方法,提出一种优化局部鉴别领域相关支持向量机算法.该方法提出一种基于维数约简的自适应距离度量学习方法,消除数据噪声以及冗余特征,更好...
作者:赵永威 张蕾 李弼程 王挺进 吕清秀 期刊:《数据采集与处理》 2015年第04期
主流的距离度量学习方法都需要求解半正定规划(Semi-definite programming,SDP)问题,而其中每次循环迭代中的矩阵完全特征分解运算使得现有方法计算复杂度很高,实用性不强,难以应用在大规模数据环境。本文提出了一种基于特征分组与特征值最优化的距离度量学习方法。引入特征分组算法,根据特征各维数之间相关性对图像底层特征进行分组。在一定的约束条件下,将求解SDP问题转化为特征值最优化问题,在每次循环迭代中只需计算矩阵最大...
作者:牛科 张小琴 贾郭军 期刊:《计算机工程》 2015年第01期
无监督学习聚类算法的性能依赖于用户在输入数据集上指定的距离度量,该距离度量直接影响数据样本之间的相似性计算,因此,不同的距离度量往往对数据集的聚类结果具有重要的影响。针对谱聚类算法中距离度量的选取问题,提出一种基于边信息距离度量学习的谱聚类算法。该算法利用数据集本身蕴涵的边信息,即在数据集中抽样产生的若干数据样本之间是否具有相似性的信息,进行距离度量学习,将学习所得的距离度量准则应用于谱聚类算法的相似...