作者:马吉科; 尹飞; 祝永晋; 豆龙龙; 李剑 期刊:《计算机与现代化》 2020年第03期
针对计量装置运行异常在供电企业经济效益稳定增长和社会稳定发展等方面造成的负面影响且电网数据标识不全的现状,提出一种应用半监督学习的计量装置运行状态辨识方法。通过对电网数据进行分析,实现在标识不全的情况下判断计量装置运行状态。
作者:杜兰; 魏迪; 李璐; 郭昱辰 期刊:《电子与信息学报》 2020年第01期
现有的基于卷积神经网络(CNN)的合成孔径雷达(SAR)图像目标检测算法依赖于大量切片级标记的样本,然而对SAR图像进行切片级标记需要耗费大量的人力和物力。相对于切片级标记,仅标记图像中是否含有目标的图像级标记较为容易。该文利用少量切片级标记的样本和大量图像级标记的样本,提出一种基于卷积神经网络的半监督SAR图像目标检测方法。该方法的目标检测网络由候选区域提取网络和检测网络组成。半监督训练过程中,首先使用切片级标记...
作者:潘强 期刊:《自动化与信息工程》 2013年第05期
以往半监督多示例学习算法常把未标记包分解为示例集合,使用传统的半监督单示例学习算法确定这些示例的潜在标记以对它们进行利用。但该类方法认为多示例样本的分类与其概率密度分布紧密相关,且并未考虑包结构对包分类标记的影响。提出一种基于包层次的半监督多示例核学习方法,直接利用未标记包进行半监督学习器的训练。首先通过对示例空间聚类把包转换为概念向量表示形式,然后计算概念向量之间的海明距离,在此基础上计算描述...
作者:冯雨庭; 张锦; 肖斌 期刊:《综合运输》 2019年第09期
为解决基于手机信令数据识别大规模用户交通方式问题,多维度分析出行方式特征,提出结合主动学习和Tri-training的半监督支持向量机算法。以手机信令出行链为基础,将出行特征划分为距离、时间、速度、出行者属性等四类,并进一步研究多维度特征及其计算方法 ,基于有向无环图设计一种结合主动学习与基于Tri-training的半监督多分类支持向量机。运用HY市手机信令数据构建样本集并训练该分类器,与多种监督学习分类算法进行比较。结果表...
作者:杨绪兵; 葛彦齐; 张福全; 范习健; 姚宏亮 期刊:《图学学报》 2019年第05期
森林火灾图像识别是森林防火监测系统的核心。目前的主要研究多在图像的向量模式表示上展开。由于向量模式的样本数由图像分辨率决定,易导致模型训练的负担过重。样本类别标记的准确性,直接影响后续的模型训练和目标识别。而目前的类别标定工作多采用手工或图像预处理方法完成,任务繁琐且容易出错。此外,由于像素位置在图像向量化过程中被调整,不可避免地会损失图像原有的结构信息。鉴于此,提出了基于矩阵分块的半监督学习算法Semi...
作者:杜恒; 杨俊成 期刊:《计算机应用与软件》 2019年第12期
实时数据流中标记样本所占比例较小,并且存在大量的噪声数据和冗余数据,导致数据流的实时分类准确率较低。针对这种情况,提出基于拉普拉斯回归主动学习的大数据流分类算法。为分类器设计相对支持度差异函数作为分类的决策方法,通过阈值判断当前数据流的标记样本量。设计基于约束规则的半监督主动学习算法,从无标记样本集选择信息量最丰富的样本。采用拉普拉斯正则最小二乘回归模型作为半监督学习的回归模型,迭代地扩展数据流的标记...
作者:刘贝贝; 华蓓 期刊:《计算机系统应用》 2019年第11期
基于深度卷积神经网络的图像语义分割方法需要大量像素级标注的训练数据,但标注的过程费时又费力.本文基于生成对抗网络提出一种编码-解码结构的半监督图像语义分割方法,其中编码器-解码器模块作为生成器,整个网络通过耦合标准多分类交叉熵损失和对抗损失进行训练.为充分利用浅层网络包含的丰富的语义信息,本文将编码器中不同尺度的特征输入到分类器,并将得到的不同粒度的分类结果融合,进而优化目标边界.此外,鉴别器通过发现无标签...
论文在一维信号处理的框架下,结合语音识别和机械声音信号处理技术,提取了机械声信号本征模态中的梅尔倒谱特征,并使用半监督模糊粗糙拉普拉斯特征映射对该二级高维特征进行流行降维以及类别区分以得到更深度的特征,最后利用该特征,构建有效分类器,从而实现对蕴涵了机械转速信息的机械声音信号的高精度识别和分类。
作者:徐林; 郑晓彤; 付博; 田歌 期刊:《东北大学学报·自然科学版》 2019年第12期
提出一种基于改进GAN(生成对抗网络)的滚动轴承故障诊断方法,以振动信号作为主要依据,结合连续小波变换处理非平稳信号的能力和半监督生成对抗网络(semi-supervised generation adversarial networks,SSGAN)处理和识别图像的功能,在半监督生成对抗网络的基础上引入条件模型并对损失函数进行优化,指导生成器和判别器的训练.首次将改进GAN算法应用于故障诊断领域并利用其生成模型和半监督学习能力分别解决了样本数据不足和样本标记问...
作者:沈鸿; 刘军发; 陈益强; 蒋鑫龙; 黄正宇 期刊:《计算机科学》 2019年第12期
场景识别是普适计算中的一项重要研究内容,旨在通过识别智能手机用户所在位置的场景,为用户提供精准的个性化服务并提升服务的质量。在实际环境中,精确的场景识别存在两个问题:(1)基于单模传感器数据或无线信号数据的分类效果不佳、普适性不足;(2)场景识别的精度需要依赖大量标定数据,导致成本较高。针对这些问题,提出一种基于多模融合的半监督场景识别方法,该方法充分利用Wi-Fi、蓝牙和传感器的多模特征来提高识别精度。相比基于...
作者:王兴金; 周兰江; 张金鹏; 周枫; 郭剑毅 期刊:《小型微型计算机系统》 2019年第12期
为有效对老挝语进行词性标注,提出一种融合词预测的半监督隐马尔科夫词性标注方法.首先,为解决未登录词标注问题,基于长短期记忆网络建立词预测模型,并改进维特比算法来将词预测模型融入隐马科夫模型中;其次,为提高隐马科夫模型标注的准确率与速度,使用规则与统计相结合的方法.制定了详细的老挝语法规则集,并将规则集与隐马科夫模型进行结合;再有,为扩展老挝语词性标注语料库规模,使用半监督学习方法,以得到正、反半监督隐马科夫模...
作者:李程文; 杨念; 谭建平 期刊:《江苏科技信息》 2019年第32期
传统的支持向量机分类模型只有在利用大量已标注数据进行训练才能获得较高精度。在现实研究中,实际产生的数据类型种类繁多,有结构数据和非结构数据等,但都有一个共同特点,大多具有多个标签,因此传统分类算法无法直接应用于多标签分类。文章提出一种基于迁移学习的分类算法,引入迁移学习解决训练数据充分的问题,这种方法在目标域数据集被标注比较少的情况下有着明显的优势;同时为了在训练分类模型的过程中找出对分类起关键作用的信...
作者:王晓霞; 蒋伏松; 王宇; 熊贇 期刊:《大数据》 2018年第03期
慢性病与其相关并发症关系的研究,对患者以及医学研究都有重要意义。电子病历中记录的患者就诊数据为研究目标慢性病与其并发症的关系提供了数据基础,其中面临的挑战之一在于既需要使用临床医生的领域知识对并发症进行标注,又不希望给医生增加过多负担。设计了一种采用分组策略的基于ICD-10诊断编码的慢性病并发症半监督聚类方法,以实现在较少的医生专家参与下对慢性病并发症归类。真实糖尿病患者电子医疗记录数据集上的实验结果表...
作者:杜炜; 李剑 期刊:《信息安全研究》 2018年第03期
为了更好地检测安卓恶意软件以及分析其恶意行为,提出一种基于半监督学习的安卓恶意软件检测及其恶意行为分析的研究方案.首先收集了16179个安卓良性软件以及31964个安卓恶意软件,随后反编译安卓软件,提取了权限、服务和敏感API作为静态特征,然后使用DroidBox动态分析工具提取了7种动态特征.虽然安卓恶意软件家族体现了安卓恶意软件的恶意行为,但不同的恶意软件家族可能具有相同的恶意行为,因此,对样本数据中最主要的20种恶意软件...
作者:任亚峰; 姬东鸿; 尹兰 期刊:《工程科学与技术》 2014年第03期
已有的虚假评论识别方法主要采用启发式策略或简单特征建模。针对这些方法的不足,提出使用机器学习方法识别虚假评论。首先整合计算语言学与心理语言学的知识对评论文本进行建模,使用全监督学习算法来评价不同特征建模的性能,选出最好的特征组合。为了提高识别性能,设计2种半监督学习算法充分利用大量的未标注文本。实验结果证实所提算法超过当前的基准。
作者:毛臣; 谢铠宇; 高镭 期刊:《信息技术与网络安全》 2019年第12期
针对目前大多数物联网入侵检测系统误报率高、响应不及时、无法自主调查攻击行为的不足,提出了用半监督学习作为入侵检测的检测方法。同时,在Fuzzy C-means(FCM)算法的基础上提出了Random Fuzzy C-means(RFCM)算法的框架与实现。首先通过随机森林得到初始化的模型;然后,通过指定两个置信度参数,每轮得到分类结果置信度高的无标记样本;再将这些样本加入到原始有标记的样本集合里进行模型的二次训练,通过多轮迭代得到最终模型。实验...
作者:吴斌; 赵力 期刊:《信息技术与网络安全》 2018年第08期
半监督学习是一种重要的机器学习方法,能同时使用有标记样本和无标记样本进行学习。在webshell检测领域,有标记样本少、形式灵活多变、易混淆,基于特征匹配的方式很难进行准确检测。针对标记样本较少的现状,提出一种基于深度学习和半监督学习的webshell检测方法,先使用卡方检验和深度学习方法获取样本的文本向量,然后分别使用单分类和增量学习方式训练,提高分类性能。使用github公开数据集进行训练和测试,实验结果验证该方法能够有...
作者:李伟; 汪廷华; 郑惠宁 期刊:《赣南师范大学学报》 2018年第03期
农业文本分类旨在对主流的农业信息网抽取的文本数据集进行分类.在样本充足的情形下,经典的支持向量机方法能取得较好的效果,然而在样本较少或者样本矩阵很稀疏的情形下效果较差.提出了一种基于特征族群语义扩散核(它是语义扩散核的一种)和支持向量机的半监督农业文本分类方法.该方法在经典的支持向量机方法基础上结合特征族群语义扩散核,使得农业文本分类准确率得到一个显著的提升,在训练集样本数量只有原来一半的数量情况下预...
作者:李心磊; 杨思春; 彭月娥 期刊:《苏州科技大学学报·自然科学版》 2014年第02期
Tri-training算法是半监督协同算法里的经典算法,该文针对算法中分类器的使用做了一些改进,由原先单一的分类器换成两个不同分类器的组合。使用SVM分类器和最大熵分类器的不同组合作为Tri-training算法里的三个分类器构成分类器模型,然后分别对稀疏型数据、密集型数据与原始Tri-training算法进行实验比较,从而验证改进的有效性。