作者:吴寿英; 张建伟; 梁斌斌 期刊:《科技与创新》 2020年第02期
目前机场场面监视系统主要以高成本的场面监视雷达为主,对于中小型机场来说通常负担不起,为此提出一种低成本的场面监视技术。使用当下最流行的深度学习神经网络模型对场面视频图像进行无监督训练,加入深度信息估计技术可以对场面目标进行检测跟踪以及航机生成。通过对深度学习方法的调研,提出基于无监督学习的深度估计技术是最适用于机场场面视频图像监视系统的技术方法,为机场监视提供了重要理论支持。
在大数据时代,基于机器学习的异常点(Outlier)检测被广泛应用在抗网络攻击、检测信用欺诈等方面,已引起工业界的普遍重视。不同于传统的分类和聚类问题,异常点检测需要面临严重数据失衡问题。为了解决这一问题,笔者提出了集成多种机器学习技术检测异常点的方法,并通过实验证明了方法的有效性。
作者:王俊丰; 贾晓霞; 李志强 期刊:《信息技术》 2019年第12期
文中讨论在文本类目数未知的情况下,如何对数据量过少的短文本进行有效聚类的问题。短文本的特点是每一份样本文章数据少,数据稀疏,用常规的聚类方法进行文本聚类不能取得很好的效果。文中提出了一种基于K-means的改进算法,提出一种简单降维方式和新的判别样本点距离的方法,经实验验证,文中改进算法比原K-means算法有更高的准确性。
作者:Harshvardhan; Gupta 期刊:《机器人产业》 2018年第01期
机器翻译通常利用深度学习技术来实现,而实现这一过程往往需要借助大量数据模型进行训练,这在一定程度上限制了小语种翻译的发展。针对这一困境,Facebook提出了无监督机器人翻译。本文通过深入浅出的讲解,详细阐述这一方法背后的工作原理。
作者:侯守明; 林晓洁; 胡明凯 期刊:《现代信息科技》 2019年第05期
本文针对传统的形状匹配算法的处理计算量过大、消耗时间过长,从而导致无法应用于大量的图像集以及在线的形状匹配场景的问题,在学者提出的距离融合算法的基础上进行了改进,在处理阶段引入无监督学习的方法进行多种聚类。通过引入预处理算法对图像集进行特征提取以及划分,在算法的计算量上做出优化,大幅降低了算法的计算时耗,并且保证其正确率几乎没有降低。
作者:古险峰; 冯学晓 期刊:《平顶山学院学报》 2018年第02期
为了取得精确的图像分类效果,一方面需要提取大量的图像特征数据进行样本分析,另一方面大量的数据又造成了维数灾难.因此,为了解决信息全面与维数灾难的矛盾,引入了深度学习.深度学习利用分层结构处理复杂的高维数据,可以完成复杂函数的逼近,是一类具有多层非线性映射的学习算法,但深度学习模型优化困难且对隐层参数敏感.针对上述问题,将无监督算法引入深度学习,这种学习方法无须人工设计特征提取数据,训练过程中样本标签是未知的....
作者:周雪; 孙俊生; 颜世航; 毛科技 期刊:《传感器与微系统》 2019年第04期
为了能够清楚地了解周围环境信息,设计了一种能够实时测量温度、湿度、PM2. 5浓度和甲醛浓度4种环境信息的无监督自适应移动环境监测系统。系统主要由可穿戴的移动硬件设备和手机端应用(APP)软件2部分组成。可穿戴设备将采集到的环境信息处理后,通过蓝牙发送到手机端APP软件。提出了一种无监督自适应的室内外场景识别算法,通过采集的环境信息对室内外的场景进行自动识别和区分。设计的系统体积小、识别精度高,适用于便携系统的应用...
作者:李明杰; 刘小飞; 翟萍; 张福泉 期刊:《计算机应用研究》 2018年第08期
大多数应用于视频监控领域的目标跟踪模式识别方法,都需要先对移动目标进行模式学习。但是这些方法不适合同时跟踪多个不同的目标,因为每一个移动目标的模式都应该是预先确定好的。因此,提出了一种新的基于粒子滤波和背景减除的无监督多运动目标检测与跟踪方法来解决这个问题。该方法能够自动探测和跟踪许多移动目标,没有任何学习阶段,也没有任何关于大小、性质或初始位置的先验知识。对多个视频测试集进行了实验验证,测试结...
作者:关娜娜; 张连海 期刊:《信息工程大学学报》 2018年第01期
针对不同语种中“语音模式”搭配关系不同的特点,提出一种基于“语音模式”发现的语种识别方法.首先采用无标注语音数据训练GMM模型,实现“语音模式”发现,获得每一帧语音在各“语音模式”下的后验概率,确定“语音模式”的边界;然后采用n-grm的方法统计每段语音中“语音模式”的搭配关系,并以“语音模式”的联合概率描述搭配关系;最后以SYM为分类器实现语种识别.实验的测试语料为NIST2003和NIST2007,针对英语、日语、汉语3个语种进...
作者:樊花; 陈华辉 期刊:《数据通信》 2018年第03期
目前大规模数据集的近邻检索引起广泛关注。早期的近邻检索多为同构数据的检索,如以图像检索图像,文本检索文本。但是随着多媒体的发展,信息表达的多样性,数据跨模态检索成为当前研究热点。跨模态检索指在文档有多种模态描述时可从一个模态检索到另一个模态,如以文本检索图像,以图像检索文本等。由于哈希方法的存储开销低和快速有效的特征,广泛应用在跨模态检索中。本文从有监督、无监督和半监督三方面介绍了主要的基于哈希跨模态...
作者:霍达; 马诗源 期刊:《计算机与现代化》 2019年第06期
对视频中的目标进行像素级分割是计算机视觉领域的研究热点,完全没有用户标注的无监督视频分割对分割算法提出了更高的要求。近几年在分割中常使用基于帧间运动信息进行建模的方法,即用光流等运动信息预测目标轮廓,再结合颜色等特征建立模型进行分割。针对这些方法产生的前景背景混淆以及边缘粗糙等问题,本文提出结合全卷积网络的视频目标分割方法。首先通过全卷积网络预测视频序列中显著目标的轮廓,结合光流获得的运动显著性标签...
作者:戴臣超; 王洪元; 倪彤光; 陈首兵 期刊:《计算机研究与发展》 2019年第08期
行人重识别任务旨在识别不相交摄像头视图下的相同行人.这项任务极具挑战性,尤其是当数据集中每个行人仅仅有几张图片时.针对行人重识别数据集中行人图片数量不足的问题,提出一个从原始数据集中生成额外训练数据的方法.在这项工作之中存在2个挑战:1)如何从原始数据集之中获取更多的训练数据;2)如何处理这些新生成的训练数据.使用深度卷积生成对抗网络来生成额外的无标签行人图片,并采用标签平滑正则化来处理这些新生成的无标签行人...
本文首先介绍了无监督学习算法的基本原理,然后对主成分进行分析,接下来对k-均值聚类进行了研究。最后对无监督学习算法的研究进行了展望。
作者:靳义林; 胡峰 期刊:《南京大学学报·自然科学》 2018年第04期
随着信息化的不断发展,越来越多的信息不断涌现出来,如何在海量的信息中快速有效地获取到最有价值的信息成为人们不断关注的热点.中文文本分类作为自然语言处理的一个分支,通过将信息归纳成已知的主题类别,可以有效地帮助用户快速获取海量信息中所需的信息.但由于传统特征选择算法存在着很大的局限性,目前在中文文本分类领域上还存在着很大的不足,集中体现在提取出的特征过于高维和稀疏,不能高效地表示类别的文本.基于此,结合三支...
作者:袁致强; 王斌; 张良力; 王玲 期刊:《计算机仿真》 2019年第01期
冶炼高炉烧结矿化学原料配比准确预测是对烧结矿化学成分提前预报、优化烧结工艺的关键方法。目前烧结矿化学原料配比准确预测的浅层网络算法未能充分发掘烧结过程的本质规律,预测精度不够高,难以应用在实际生产过程中。针对以上问题,通过对烧结过程工艺机理及特征进行深入分析,提出了应用深度学习技术中的深度置信网络算法对烧结矿化学成分进行预测,建立一种以深度置信网络为核心的烧结矿化学原料配比准确预测模型。首先设计深度...
作者:魏思政; 刘厚泉; 赵志凯 期刊:《计算机工程》 2018年第09期
为了有效解决海量复杂数据的入侵检测分类问题,基于深度信念网络(DBN)和极限学习机(ELM),提出一种新的入侵检测方法。使用DBN对大量复杂无标签的原始数据进行特征提取,得到高度抽象的重要特征,再用ELM完成最终的分类工作。结合DBN自动提取特征的能力和ELM快速学习且泛化性好的优势,提高入侵检测识别率和运行效率。实验结果表明,与原始的DBN、ELM以及DBN-SVM方法相比,该方法具有更优的精确度和运行效率。
地板块表面纹理识别和分类是实木地板生产过程中的一个重要环节,利用机器视觉技术对地板块按纹理走向、分布等进行分类,有利于提高生产效率和分选质量,对实木板材生产中的自动检测分级技术的改造与技术创新都有重要意义.地板块纹理结构精细复杂,变化无规则,一直困扰着学术界,到目前为止对纹理未有一个统一的定义.近年发展起来的新型计算机视觉技术,成为当前图像处理热点研究课题之一,其中One-class SVM 作为一种无监督的分类识别模...
作者:吴晓建; 李晶; 刘昌孝; 元英进 期刊:《化工学报》 2005年第10期
如何利用代谢物组的海量数据和信息,与其他领域整合并重构完整的生化网络,建立预测细胞表型、优化生化过程和评价药物安全性的崭新方法是生物信息学需要解决的重要问题.本文综述了代谢物组数据分析中应用的主要生物信息学方法及关键问题,列举了各种方法在植物、微生物及哺乳动物体系的重要应用.最后对代谢物组学的前景进行展望.
今天主要分3方面跟大家分享腾讯在互联网金融领域做的事情和实践。腾讯面临的金融风险随着互联网业务的飞速发展,很多产业盯着互联网环境从事相应的活动。据腾讯方面统计,每天在互联网上产生的金额比广告、游戏行业更高,此外,如传销、诈骗等恶意的活动行为也层出不穷。这些行为对我们的业务产生了非常大的影响。腾讯每天的交易量和转账量都达到上亿的级别,面临的威胁非常多,
作者:骆俊帆; 陈黎; 于中华; 丁革建; 罗谦 期刊:《中文信息学报》 2017年第04期
作为文章内容的浓缩表达,摘要蕴含着文章关键的发现和结论。自动分析挖掘摘要内容,对于充分利用快速增长的科技文献具有重要意义。该文以Medline生物医学文章的摘要为对象,对摘要的文本分割问题进行了研究。针对摘要各论述侧面(内容块)之间在长度分布上倾向于均匀的特点,提出了一种考虑长度分布约束的摘要文本无监督分割算法,该算法以信息熵作为长度分布均匀性的度量指标,将信息熵与块内语义相似度及块间语义相似度相结合作为优...