作者:王晓; 杨鹏鹏; 王榕; 李辉 期刊:《轻工学报》 2015年第05期
针对多数已有的计算方法无法同时预测抗菌肽的多种功能类型的问题,提出一种基于伪氨基酸组成和多标记最近邻算法的抗菌肽功能类型预测的系统方法:采用伪氨基酸组成抽取抗菌肽序列的特征向量,并且引入多标记最近邻算法作为预测引擎,同时预测抗菌肽的多种功能类型.实验结果表明,本方法显著地提高了预测性能,为该领域的进一步研究提供了一个有用的工具.
作者:余鹰; 王乐为; 吴新念; 伍国华; 张远健 期刊:《智能系统学报》 2019年第03期
良好的特征表达是提高模型性能的关键,然而当前在多标记学习领域,特征表达依然采用人工设计的方式,所提取的特征抽象程度不高,包含的可区分性信息不足。针对此问题,提出了基于卷积神经网络的多标记分类模型 ML_DCCNN,该模型利用卷积神经网络强大的特征提取能力,自动学习能刻画数据本质的特征。为了解决深度卷积神经网络预测精度高,但训练时间复杂度不低的问题,ML_DCCNN利用迁移学习方法缩减模型的训练时间,同时改进卷积神经网络的...
作者:马鸿超; 张坤丽; 赵悦淑; 昝红英; 庄雷 期刊:《中文信息学报》 2018年第05期
中文产科电子病历中蕴含着大量的医疗知识和健康信息,电子病历的信息抽取及辅助诊断对提高人口的生育健康水平具有重要意义。电子病历中,首次病程记录的入院诊断是根据主诉、辅助检查、查体等信息得出的。通常情况下诊断中包含正常诊断、病理诊断及并发症而非单一结果。因此,该文将辅助诊断问题转化为多标记分类任务。在对产科电子病历的首次病程记录进行数据清洗和结构化后,规范化诊断结论,将LDA所抽取的文本特征与病历中的数字特...
作者:刘海洋; 王志海; 张志东 期刊:《计算机学报》 2019年第03期
多标记分类问题需要为每个实例分配多个标记.常见的多标记分类方法主要分为算法转换法和问题转换法两类.合理利用标记间的依赖关系是提升多标记分类性能的关键.在该文中,作者从不同的问题转化方法的角度,将标记间依赖关系的利用方法分为标记分组法和属性空间扩展法两种.作者发现,对于属性空间扩展法,普遍存在的难题在于如何对标记间的依赖关系进行准确度量,并选择合适的标记集合加入到属性空间中.在此基础上,作者提出了一种基于Rel...
作者:段青玲; 张璐; 刘怡然; 王沙沙 期刊:《农业机械学报》 2018年第07期
热词提取对于监控和分析农业舆情具有重要意义,目前已有一定研究基础,但仍存在针对性差等问题,无法满足农业领域不同产业用户群的个性化需求,为此,提出一种基于农业网络信息分类的热词自动提取方法。首先采用多标记分类算法对文本语料进行分类,按分类类别构建语料库,然后采用基于信息熵的方法对每个类别分别提取热词候选词,最后采用基于时间变化的方法进行候选词热度计算,根据候选词热度排序结果得到热词。本文抽取农业网站上的15 ...
作者:张志东; 王志海; 刘海洋; 孙艳歌 期刊:《计算机科学》 2018年第03期
在多标记分类问题中,有效地利用标记间的依赖关系是进一步提升分类器性能的主要途径之一。基于分类器链算法,利用互信息度量理论构造分类对象的类属性之间明确的多标记关系依赖模型,并依据建立的标记依赖模型将分类器链中的线性依赖拓展成树型依赖,以适应更为复杂的标记依赖关系;同时,在此基础上利用Stacking集成学习方法建立最终训练模型,提出了一种新的针对树型依赖表示模型的Stacking算法。在多个实验数据集上的实验结果表明,与...
作者:纪亚亮; 郑阳 期刊:《医疗卫生装备》 2017年第07期
目的:设计一个慢性乙型肝炎用药推荐系统,对该类住院患者的临床用药进行预测,解决医生主观用药和不规范用药等问题。方法:运用机器学习中的改进惰性多标记分类(multi-label k-nearest neighbor,ML-KNN)算法,对从医院信息系统数据库中抽取的多标记数据集进行训练,并利用Java的相关框架技术在My Eclipse9.0开发平台上设计和实现该慢性乙型肝炎的用药推荐系统。结果:该用药推荐系统能够很好地预测慢性乙型肝炎住院患者的临床用药,提升...
不同于已有的显式消费意图识别的研究,提出了社会媒体中用户的隐式消费意图自动识别方法.该方法将隐式消费意图识别视作多标记分类问题,并综合使用了基于用户关注行为、意图关注行为、意图转发行为以及个人信息的多种特征.由于隐式消费意图识别难以评价,自动抽取了大量跨社会媒体的用户链指信息,利用该方法,共抽取出12万余对的用户链指.在此自动评价集上的实验结果表明,所采用的多标记分类方法对于识别用户的隐式消费意图...
由于一个类别在层次树上可能存在多个镜像,基于层次树来进行分类可能会导致不一致性。一种自然的解决方法是采用图结构来描述类别关系,在现实生活中人们实际的描述方式也是如此。鉴于此,提出了一种直接基于图的层次多标记分类方法,称为GraphHMLTC。该方法利用有向无圈图的拓扑排序而非树的自顶向下的层次关系来确定类别之间的分类顺序,并且该拓扑序根据分类情形进行动态维护。实验表明,采用层次图分类的GraphHMLTC方法比非层...
作者:孙向琨 邓伟 期刊:《计算机工程》 2011年第19期
提出一种结合词频-逆向文件频率(TF-IDF)规则与多标记分类的歌曲情感分析方法。对歌曲中基于声学特征的音乐内容,用带向量夹角的多标记k近邻算法进行分类,将TF-IDF规则用于歌词内容,以计算歌词情感分数,并将其作为情感特征。采用该方法对歌词内容分类错误的类别标记进行修正。选用396首英文歌曲对该算法进行测试,结果表明,与其他方法相比,该方法能使分类精确度从69%提高到74%。
作者:李雅林 张化祥 张顺 期刊:《计算机工程与应用》 2013年第16期
多数多标记学习方法通过在输出空间中,单示例同时与多个类别标记相关联表示多义性,目前有研究通过在输入空间将单一示例转化为示例包,建立包中多示例与多标记的联系。算法在生成示例包时采用等权重平均法计算每个标记对应样例的均值。由于数据具有局部分布特征,在计算该均值时考虑数据局部分布,将会使生成的示例包更加准确。本论文充分考虑数据分布特性,提出新的分类算法。实验表明改进算法性能优于其他常用多标记学习算法。
作者:王晓 杨鹏鹏 王榕 李辉 期刊:《郑州轻工业学院学报》 2015年第05期
针对多数已有的计算方法无法同时预测抗菌肽的多种功能类型的问题,提出一种基于伪氨基酸组成和多标记最近邻算法的抗菌肽功能类型预测的系统方法:采用伪氨基酸组成抽取抗菌肽序列的特征向量,并且引入多标记最近邻算法作为预测引擎,同时预测抗菌肽的多种功能类型.实验结果表明,本方法显著地提高了预测性能,为该领域的进一步研究提供了一个有用的工具.