作者:刘力冉; 曹杰; 杨磊; 仇男豪 期刊:《计算机与现代化》 2020年第03期
YOLO系列算法的简化版本YOLOv3-Tiny具有较为简单的网络框架,对GPU显存要求较低,该算法虽然实时性较高,却存在精度较低的问题,在识别行车目标方面不能得到精确的结果。对此,本文首先改变输入图片的大小,目的是获取图片更多的横向信息,使得网络更容易学习行车的信息,其次改进算法的网络结构提高算法的精度,最终得出改进的YOLOv3-Tiny算法。实验结果表明,改进之后的算法在保证实时性的情况下,提高了精确性。
作者:王杰; 陈志刚; 刘加玲; 程宏兵 期刊:《计算机工程与应用》 2020年第05期
随着云计算的不断普及,隐私安全问题逐渐显现,已成为制约云计算发展的重要障碍。受经济社会"问责制"的启发,从规范和约束云参与者隐私行为的角度,针对云参与者的隐私违约认定的问题,进行了基于审查对象隐私行为挖掘的研究。对隐私日志行为数据进行预处理,采用夹角余弦法来定义任意两个隐私会话之间的相似度并构建云隐私间的相似度矩阵,选择K-均值聚类算法对隐私会话基于设置的云隐私规则进行相似度聚类。实验测试结果表明所提出的...
作者:雷涛; 连倩; 加小红; 刘鹏 期刊:《计算机科学》 2020年第02期
针对SLIC(Simple Linear Iterative Clustering)算法在超像素聚类过程中耗时较长的缺陷,提出一种基于快速SLIC的图像超像素算法。该算法首先剔除在颜色空间上与聚类中心相似度较低的像素,从而仅用部分近邻像素更新聚类中心,以确保聚类中心快速达到稳定并阻止误差传播,提高边缘命中率;其次,在初始化网格后,将每个超像素的边缘像素视为不稳定像素,将超像素的非边缘像素视为稳定像素并保持稳定像素的类别不变;最后,通过对不稳定像素进...
作者:张志龙; 李爱华; 李楚为 期刊:《计算机学报》 2020年第01期
本文提出了一种新的基于密度峰值搜索聚类的超像素分割算法.首先在图像平面内的局部区域内估计像素的局部密度.其次为每个像素寻找一个距离最近的大密度像素并计算两个属性:距离和归属.之后根据距离和归属将所有像素组织成一个归属关系树,该树反映了像素之间的归属关系.然后选择局部密度和距离较大的像素作为超像素的种子,并标记在归属关系树中.最后在归属关系树中搜索距离每个像素最近的超像素种子为其分配标记,实现超像素分割.该...
作者:刘雨辰 期刊:《电脑编程技巧与维护》 2020年第01期
研发的自动视野计VFVR生成的数据为一个二维地图,分区域标明各处的视神经的敏感度。尝试运用机器学习技术对视野数据进行自动分类,并给出视神经损害的程度。使用无监督学习技术进行自动分类,经过分类的数据经人工标注以后,作为训练数据输入模型进行强化学习,模型经实际数据检验,分类准确度在85%以上。
作者:牛伟农; 吴林; 于水源 期刊:《软件导刊》 2020年第01期
互联网的飞速发展为大众带来便利的同时也产生了大量冗余信息,利用自然语言处理技术对新话题文章进行提取,控制新话题中虚假新闻传播,可为舆情控制提供有效支持。提出一种基于词聚类信息熵的新闻提取方法,并对“一带一路”相关新闻语料进行实验。实验通过网络爬虫的方式获取相关报道,利用Pkuseg工具分词进行一系列预处理后训练生成Word2vec词向量,然后利用词频统计筛选出历史高频词进行K-means聚类,将聚类后的词簇作为随机变量计算...
作者:朱四如; 陈兰花 期刊:《黑龙江科学》 2019年第24期
针对形状为横纵切、具有文字特征的碎纸片拼接存在的问题,提出了以灰度突变位置为特征的聚类方法,建立了与边界灰度相匹配的半自动拼接模型,在合理进行人工干预的基础上最终取得了较好的拼接效果,对实际应用具有一定的指导意义。
作者:陈琪; 续欣莹; 谢珺; 付文华 期刊:《计算机工程与设计》 2020年第01期
针对使用大规模数据对电站锅炉氮氧化物(NOx)排放进行建模时,建模时间长、计算复杂度高的问题,提出一种基于核极限学习机(K-ELM)和高斯混合模型(GMM)的NOx排放建模方法。通过GMM对模型输入样本进行聚类,进行均衡化处理,利用K-ELM对NOx排放进行建模,通过网格搜索和交叉验证获得模型的最优参数,应用模型对锅炉真实运行数据进行预测分析。实验结果表明,与使用同等数据量进行K-ELM建模相比,GMM-K-ELM进一步提高了模型的泛化能力。
作者:周园春; 唐明洁; 崔鹏; 张海明; 邵靖; 黎建辉; 侯元生; 罗泽; 雷富民; 阎保平 期刊:《科研信息化技术与应用》 2010年第03期
候鸟迁徙行为过程主要中涉及到栖息地发现、迁徙路线追踪以及栖息地之间的活动关系等。如何寻找候鸟迁徙过程的栖息地、追踪候鸟的迁徙路线、挖掘栖息地之间的强关联关系对候鸟和生态环境的保护、禽流感等疾病传播和防治的研究具有重要的意义。针对目前对于候鸟迁徙的卫星跟踪数据处于人工处理的现状,本论文结合生物学研究的需要,研究数据挖掘中的相关聚类、序列挖掘,并将相关算法运用到青海湖鸟类迁徙的卫星跟踪数据中。在论文中...
作者:李安亚; 王少妮 期刊:《科研信息化技术与应用》 2017年第05期
对比模式挖掘是数据挖掘的一个重要和集中的子领域,主要涉及数据集的模式挖掘和对比处理。它的目的是寻找有趣的对比模式,描述满足各种不同条件的显著差异的数据集。对比的条件可以在类、时间、位置、或其他"维"中定义,当然也可以在他们的组合中定义。对比模式可以代表类之间的不同差异,随时间推移的有趣的变化或者空间趋势变化等等,通过分析两类或多类样本中的对比信息能够得到新的未知信息。对比模式挖掘发展至今,已有了众多的...
Mahout虽然是Hadoop的一个子项目,其与Hadoop1.x版本集成比较容易,但其在与Hadoop2.0以上版本进行集成时会碰到一些问题。本文首先介绍了Mahout与Hadoop关系,然后介绍了在Hadoop分布式环境下实现K-Means聚类算法的步骤及伪代码,并以Mahout的K-means聚类算法为例,通过详细的步骤讲解了其在Hadoop2.0上如何集成,并通过实际的代码案例对该聚类算法进行了应用和实现。
作者:陈稳稳; 黄磊 期刊:《新一代信息技术》 2013年第24期
图像拼接(Image Mosaic)是一个日益流行的研究领域,他已经成为照相绘图学、计寄机视觉、图像处理和计寄机图形学研究中的热点。图像拼接解决的问题一般是通过对齐一系列空间重叠的图像,构成一个无缝的、高清晰的图像,它具有比单个图像更高的分辨率和更大的视野。在司法物证鉴定、历史书籍复原等很多领域要用到文字碎片的拼接复原,目前,对于碎纸片的拼接复原,大都采用人工拼接的方式进行。这种方法寅然准确度较高,但是效率...
作者:张颖; 刘奉君; 贾志芳 期刊:《新一代信息技术》 2014年第13期
随着网络技术迅猛发展,网络安全问题也备受关注。入侵检测技术能够通过检测网络攻击行为来及时阻止网络攻击行为。近年来,聚类分析作为无监督入侵检测算法的代表受到了广泛地应用和研究,本文概述了网络入侵检测的相关内容及聚类分析在网络入侵检测中的应用。
作者:曾光辉; 唐国强 期刊:《新一代信息技术》 2019年第13期
针对传统方法对网络数据聚类时,聚类效果不佳,时间收敛差等问题,本文引入模糊处理模型,对聚类属性进行有效分类,从而解决以上问题。分析传统网络算法的聚类过程,获得传统方法的缺陷,并根据此缺陷进行新的聚类算法的处理模型构建;通过模糊处理模型完成聚类属性分类,实现网络数据的快速聚类。通过对比实验验证所提方法的性能。实验结果表明,所提方法能够有效提升聚类准确性,同时聚类收敛时间低,效率高。
作者:王雨楠; 吉宏梅; 胡静 期刊:《信息周刊》 2019年第23期
随着获取轨迹数据信息越来越方便,实时记录用户的速度成为可能,近年来,电动自行车行业迅速发展,很大程度上改善了居民出行条件,提高了出行效率。但超速行驶给社会治安带来了一定的问题,为了更好的了解用户的行为习惯。本文基于电动自行车数据提取用户多个时刻的速度,建立并实现了基于分层模型的用户行驶速度的挖掘算法。为分析用户在不同时段的速度规律,采用速度偏好矩阵建立用户的日程速度行为,并提出一种度量用户日程速度行为相...
作者:李敏; 于增平; 李丽红 期刊:《信息周刊》 2019年第12期
本文给出了一种基于聚类的动态属性约简方法,首先根据给定的信息系统,计算各指标的相关系数,根据相关系数矩阵进行聚类,由聚类结果分析属性的重要性,然后结合基于等价关系的属性约简方法,再根据容错能力,给出聚类思想下的动态约简方法。
作者:何容; 张向东; 邱林; 陈俐冰; 周倩; 章妍 期刊:《电力大数据》 2019年第12期
为了解决在电费回收的过程中,遇到的回收不及时、回收难度大、电费回收不全等难点,严重影响了供电企业生产的最终经营成果。本文结合各个用户在近一年的各种生产活动产生的数据,建立与用户行为相关的模型。首先采用聚类的方法,根据最终得到的簇类,对重庆地区所有用户电费回收风险的类型有大致的认知。然后采用逻辑回归模型,并且针对高压、低压居民、低压非居民三种不同类型的用户分开进行分析建模,最终得到用户电费回收风险的得分...
作者:陈铁明; 王小号; 庞卫巍; 江颉 期刊:《网络与信息安全学报》 2016年第05期
微博文本具有短小快捷、主题多变等特点,社交话题检测与跟踪研究面临新的挑战。结合微博的话题时序性和短文本语义相似度等特点,提出了基于微博聚类的话题检测与跟踪系统方法。首先,通过定义微博文本的时序频繁词集,给出面向热点话题的特征词选择方法;然后,根据时序频繁特征词集,利用最大频繁项集获得微博初始聚类;针对初始簇间存在文本重叠情况,提出基于短文本扩展语义隶属度的簇间重叠消减算法,获得完全分离的初始簇;最后,根据簇...
一个改变传统产业的趋势已经出现:基于文章的阅读情况。一些网络新闻系统将读者可能感兴趣的文章列出来,甚至可以将它们排序。把最有趣的新闻放在前面。读者将不用翻上好几页来找到他们想看的新闻。记者也不用为了争取头版有限的空间而激烈竞争了。