作者:许甜华; 吴明礼 期刊:《计算机技术与发展》 2020年第02期
目前对以朴素贝叶斯算法为代表的文本分类算法,普遍存在特征权重一致,考虑指标单一等问题。为了解决这个问题,提出了一种基于TF-IDF的朴素贝叶斯改进算法TF-IDF-DL朴素贝叶斯算法。该算法以TF-IDF为基础,引入去中心化词频因子和特征词位置因子以加强特征权重的准确性。为了验证该算法的效果,采用了搜狗实验室的搜狗新闻数据集进行实验,实验结果表明,在朴素贝叶斯分类算法中引入TF-IDF-DL算法,能够使该算法在进行文本分类中的准确率...
分析复式交分道岔设备记录的大量文本数据,需要消耗大量的人力资源,可采用NLPIR软件进行特征词提取并结合现场专家意见对特征词进行筛选和分类,生成复式交分道岔的故障特征词。通过对特征词的出现频率和性质分析,梳理得到可能导致复式交分道岔发生故障的部位。
作者:陈曦; 朱小栋; 高广阔; 肖芳雄 期刊:《计算机工程》 2020年第01期
为解决TF-IDF模型表达情感信息不足的问题,提出一种情感Senti模型,通过该模型提取文本中的情感信息,包括句子中积极/消极的情感词、否定词、转折词以及程度副词,考虑标点符号在句子中起到的情感作用,利用情感词典和语义规则提取情感信息,生成相应的情感矩阵。在此基础上,与TF-IDF模型进行拼接,形成混合向量模型。实验结果表明,与只运用TF-IDF模型相比,混合向量模型精确度更高,具有较好的分类效果。
作者:我心飞翔 期刊:《新一代信息技术》 2011年第09期
TF卡是现在手机、平板电脑最常用的扩展存储设备,大家对TF的要求除了容量以外,也越来越注重速度。最近有文章介绍了用软件SD Card Speed Test测试TF卡速度方法,其实,用该软件测试TF卡速度既不全面,也不真实,我们测试一下就清楚了,完全有更好的测试方法。
作者:李雪航; 彭礼飞 期刊:《广东医科大学学报》 2014年第05期
组织因子(TF)和凝血因子Ⅶ(FⅦa)是外源性凝血途径的启动因子,在凝血级联反应中起着重要作用。该文综述了TF/FⅦa抑制剂及其应用研究现状,以期为抗凝新药研发提供新思路。
作者:杨増光 期刊:《计算机与数字工程》 2020年第01期
关键蛋白质的识别对于理解细胞的生长调控过程、疾病研究和药物设计等方面具有重要的意义。随着高通量技术的发展,越来越多的蛋白质相互作用数据被获取,使得可以从网络水平上研究关键蛋白质。目前,许多基于蛋白质网络拓扑特征的算法被提出,但是这类方法忽略了蛋白质网络的生物信息和假阴性、假阳性数据的影响。因此,论文通过结合蛋白质结构域和蛋白质网络的拓扑特征提出了一种新的算法Do-ECC。实验结果表明,Do-ECC明显优于其他8种...
作者:张国生 期刊:《微电子学与计算机》 2019年第11期
基于大数据方法对自然语言用户需求文本进行分析,用TF-IDF方法计算特征词在需求文本中的出现频率,归一化后求得特征词在文本中的权重,用卡方统计量衡量特征词和簇之间的相关性,用k-均值算法和二分k-均值算法对特征集聚类,生成用户需求文本特征树,并映射为需求功能分解树中对应的需求功能,使需求特征语义、结构更加清晰,增强了自动需求规约能力,提高了需求分析效率,使需求规约更加科学、合理、准确.
作者:高菲菲; 李志慧; 韩朵 期刊:《量子电子学报》 2019年第06期
量子密钥分发允许两个远程方生成理论上安全的密钥,但实际中往往存在光源和测量设备的非完美性,使得量子密钥分配系统存在不同的攻击。为了消除这些攻击,研究者提出了一种双场量子秘钥分发协议。该协议将密钥信息编码在光子的相位中使得光子易于传输和保持,不仅可以将传输距离延长,并且解决了测量装置的安全性问题。受此启发,在此协议的基础上提出了一种基于相位编码的B92协议,所提出协议消除了探测器的攻击,密钥率相比原B92协议也...
作者:徐振涛; 林清滢 期刊:《现代计算机》 2019年第26期
为了在大规模的图像数据中检索出与目标图像高度相似的图像,利用Hadoop平台对海量图像数据进行分布式存储和处理。利用SIFT算法提取图像特征,获得大量图像特征点;然后利用K-means算法对图像特征点进行聚类,降低特征点数量,提高图像检索效率。并利用TF-IDF算法对图像聚类中心进行量化,获取聚类中心的TF-IDF值,优化图像检索结果。最后利用HDFS对海量图像数据进行分布式存储,利用MapReduce实现相关算法。
作者:姚春华; 罗强; 胥小波; 高弘毅 期刊:《通信技术》 2019年第11期
随着移动互联网的快速发展,网络舆情信息呈现爆发式增长。快速准确地识别网络舆情的情感导向,对维护政治稳定和社会和谐有着十分重要的意义。因此,提出了一种网络文本信息情感分类的方法,通过判断网络文本的类别和文本的长度,针对不同的类别和长度的文本进行区别处理。具体地,对长度大于140个字符的文档,采用TF-IDF计算特征权重,然后利用训练好的逻辑回归分类器进行分类;对长度小于140个字符的文档,采用人工情感分类规则进行分类。...
作者:赵家瑶; 李宏伟; 邓圣乾; 姜晶莉 期刊:《测绘与空间地理信息》 2019年第12期
研究利用机器学习中的TF-IDF统计方法,基于POI数据识别北京五环范围内的城市用地功能区。实验从道路网和格网两个层面开展,首先,将两结果与相同地区的遥感影像进行对比与验证,并从中提取属于交通用地范畴中的主要交通枢纽;其次,基于空间服务范围和空间连接强度两个视角对火车站和机场的地理特征进行分析,具体包括空间分布范围的特点、受区域影响的强弱、空间联系强度的差异等内容;最后,进一步对比各重要交通枢纽所在空间单元作为出...
在北京车展宣布上市一个月后,MG名爵正式对外公布了MG TF的市场售价:MG TF 1.8MT标;隹版24.96万,MG TF 1.8CVT标准版26.58万。这款发动机中置后轮驱动的英伦跑车虽然采用同一款发动机,但手动和自动款的动力调校有明显差别,手动款强调运动性能,最大功率为100kW/6750rpm,扭矩为165Nm/5000rpm,而无级变速的自动档MGTF则偏向舒适性,最大功率仅88kW/5500rpm,扭矩也低一些,为160Nm/4000rpm。
作者:祝鹏程; 方勇; 黄诚; 刘强 期刊:《信息安全研究》 2018年第11期
随着网络技术与应用的发展,Web服务器不可避免地成为了黑客的主要攻击目标.而传统基于正则匹配的Web入侵检测系统存在规则库维护困难、特征库臃肿的问题;基于机器学习的常规检测模型也存在特征提取复杂、识别率较低的问题.针对这些问题,提出一种基于TF-IDF和随机森林构架的Web攻击流量检测模型,该模型使用TF-IDF算法构建词频矩阵,自动提取有效载荷的 特征,使用随机森林算法进行分类建模,识别出正常流量与攻击流量.实验结果表...
作者:宫婉婷; 孙作雷; 潘盼 期刊:《信息技术与网络安全》 2017年第18期
建立了2D激光扫描匹配数据的构图方案,使用GMapping(一种高效的Rao-Blackwellized粒子滤波器,从激光数据学习网格地图)通过改变内部扫描配准算法,实现录制数据(原始2D扫描数据)经过激光配准算法后生成相对运动文件作为tf,用以提高地图生成和激光扫描配准的精度。实验基于机器人操作系统(ROS),开源的GMapping软件包进行同时定位和地图构建(SLAM),通过RVIZ(用于ROS的3D可视化工具)控制机器人运动。该方案可应用于移动机器...
作者:陈长海 期刊:《信息技术与网络安全》 2017年第24期
混响是声音经过室内墙壁等物体反射、吸收后多径传播叠加产生的,是导致语音识别系统性能下降的主要因素之一。基于TF-GSC的混响消除算法在估计混响功率谱时可能会出现过估计的现象,导致输出语音失真。提出一种直达声补偿策略,并将其应用到混响抑制算法中去。实验结果表明,直达声补偿策略减小了输出语音失真,提高了输出语音质量。
作者:杨亚; 易远弘 期刊:《知识管理论坛》 2018年第03期
[目的/意义]针对用户在图书馆海量数字资源中常常面临获取信息困难的问题,构建一套个性化知识服务系统,认为该系统是图书馆帮助用户摆脱信息超载困境和提升知识服务质量的必然选择。[方法/过程]通过建立中图法和学科分类法两大知识组织体系的映射模型,基于Hadoop分布式处理平台,提出一种改进TF-IDF+贝叶斯算法构建图书馆海量学术资源自动分类模型,辅助完善图书馆个性化知识服务系统的构建。[结果/结论]以自中国知网抓取的600万余篇...
作者:王黎民; 刘远(摄) 期刊:《轿车情报》 2008年第06期
有些时候,复杂与简单为的都是同一个目的。你可以精心打扮得妖娆多姿,也可以简简单单的素面朝天,你的选择一定要配合好自身气质。就像关于敞逢车的车顶,你可以选择形如大众EOS般复杂的5片式电动开合硬顶敞篷,也可以简单的双手一拽,拉出折叠软顶。当然,这份简单,你目前只能在名爵MG TF上体会。
作者:黄道来; 吴向华; 陈俊强; 徐钰驹; 贾葵; 周静; 陆利生; 朱文祥; 李奉喜; 张勇胜; 金静; 黄可可 期刊:《肿瘤代谢与营养电子》 2017年第03期
目的对住院胃癌患者,应用NRS 2002及PG-SGA及BMI、TF测定,了解NRS 2002、PG-SGA在胃癌营养筛查评估中的作用,分析BMI、TF等与NRS 2002、PG-SGA的相关性。方法采用连续入组法,以本院2015年1月至2016年9月住院的胃癌患者136例为研究对象,入院24小时内应用NRS 2002进行营养风险筛查、PG-SGA进行营养状况评估,同时测定其BMI、TF。结果应用NRS 2002进行营养风险筛查,无营养风险(NRS 2002〈3分)的患者共64例(47%),有营养风险(NRS 20...
作者:杜若鹏; 鲜国建; 寇远涛 期刊:《数字图书馆论坛》 2019年第08期
针对相近农业科研领域文献的文本特征信息高度重合的特点,以及传统的文本特征抽取方法存在的不足,对TF-IDF算法进行优化并加以应用验证。通过引入卡方检验值与特征词频修正因子等方式,对特征词加权函数进行重构,形成改进的ImpTF-IDF-CHI方法。将该方法与文档频率法、信息增益法及TF-IDF3种传统的文本特征抽取结果应用于朴素贝叶斯分类实验,根据实验结果判定方法的优劣性。通过4种方法的58组特征抽取与文本分类实验,发现与前述的3种...
作者:黄敏; 任宗华; 朱颢东 期刊:《轻工学报》 2018年第03期
针对人们在出游前查看景区网络评价信息难以得到对该景区之整体评价的问题,提出了一种适用于海量数据的词频统计算法TF-CT.该算法采用余弦相似性算法对海量的文本数据进行词性分类,将具有相同表达态度的数据归为一类;采用TextRank算法对各类别中的一条数据进行关键词语提取;采用改进的TFIDF算法对提取的关键词进行词频统计,获取文本数据的表达态度.实验结果表明,与TFIDF算法相比,TF-CT算法在结果准确度和时间复杂度上具有更大的优...