杂志简介:《华南理工大学学报·社会科学版》杂志经新闻出版总署批准,自1999年创刊,国内刊号为44-1443/C,是一本综合性较强的社会期刊。该刊是一份双月刊,致力于发表社会领域的高质量原创研究成果、综述及快报。主要栏目:时政热点问题研究、哲学研究、政治学、法学、社会学研究、历史学研究、经济学、管理学研究
作者:王继民; 陈翀; 彭波 刊期:2004年第Z1期
北大"天网"是一个大规模分布式搜索引擎系统.文中对其用户日志进行了分析和研究.结果显示:用户对系统的访问时间并不均等,一天中早晨、下午和晚上各出现一个波峰;通常用户在一天内只进行1~2次内容不同的查询,多于2/3的用户点击了结果页面中的某些网址(URL);多数用户输入的查询串中只含有一个词项并且包含中文字符,其中以2~4个汉字居多;用户查...
作者:丁伟; 林容容; 倪良胜 刊期:2004年第Z1期
网络信息资源的迅猛膨胀推进了信息检索技术的发展和成熟,但将现有的技术应用于海量实时网络数据时,传统的信息检索算法仍存在种种不足之处.本文中以CERNET华(东)北地区的海量实时网络数据环境为依托,研究和设计了两段向量簇聚类信息检索算法,通过插入聚类和优化聚类两阶段的操作,提供高效的信息处理能力.同时,基于簇聚类树实现了群发邮件甄别的...
作者:许丞; 彭瀚; 马龙; 李双峰 刊期:2004年第Z1期
问题回答(Question Answering,简称QA)系统是当前检索等领域的研究热点之一,其目标是回答用户用自然语言提出的简单问题.文中给出了一个基于Web的中文QA原型系统--AskTheWeb的设计与实现机制.AskTheWeb利用搜索引擎获取相关网页,而后基于综合词频统计和概念的评分模型从这些网页中提取答案.文中给出的评测数据,验证了使用数据密集的思想实现基于...
作者:方勇; 戚飞虎 刊期:2004年第Z1期
根据视频邻域片段变化的特点提出了镜头边界系数模型,镜头边界系数具有良好的抗噪能力,且对视频帧的时域变化有较好的描述能力,可用于镜头边界检测与关键帧提取.它可以单独检测镜头边界,也可以与传统的基于帧差的镜头边界检测方法相结合检测镜头边界.在提取关键帧时,根据镜头边界系数的分布,自适应地确定镜头内的关键帧数,用非极大值抑制方法与...
作者:徐欣欣; 袁华; 张凌 刊期:2004年第Z1期
随着互联网络和多媒体技术的发展,色情图像的传播越发猖獗.为了有效地防止色情图像的传播,本文中提出一种综合利用颜色和纹理特征的色情图像过滤方法.该方法根据色情图像的颜色和纹理特征,建立肤色模型和皮肤模型对图像进行检测识别.利用该方法对752幅色情图像和4000幅正常图像进行过滤实验,结果表明该方法具有较高的准确率.
作者:马哲; 姚敏 刊期:2004年第Z1期
分词词典机制是影响自动分词的重要因素,而查找速度是衡量一个词典好坏的重要标准.文中分析比较了现有的几种典型的词典机制,并在此基础上提出了一种新的词典机制,即在PATRICIA tree的基础上加入Hash机制,从而在明显提高查找速度的同时,降低了构造和维护词典的复杂度.
作者:张琳; 吴蔚林; 高峰; 陆汝占 刊期:2004年第Z1期
介绍了一个基于电话和Internet的限定领域的口语问答对话系统,该系统为出行者提供上海市任意两地间的最佳的出行路线.系统集成了语音识别、自然语言理解、语音合成以及对话管理技术;在语言理解中采用了部分句法分析,系统的实现通过对话管理中情景语义框架的定义和容错控制的设计来完成.文中还介绍了系统的构成,重点分析了语言理解和对话管理的设...
作者:樊闻斌; 王守芳; 金浩; 潘金贵 刊期:2004年第Z1期
对万维网上同一主题下的大量网页之间进行特定语义关系的分析,并将其应用于搜索引擎中,可以实现智能化的查询和提供其他个性化服务.本研究借助于Ontology中的关系实例,在网页分类的基础上对网页之间的关系进行自动识别,同时提出了网页关系识别规则的自动生成和优化方法.将网页关系识剐过程应用于Dolphin系统中,使用户能够在系统的指导下,快速地...
作者:万小军; 杨建武 刊期:2004年第Z1期
利用主题检测技术可以从海量新闻信息中实时检测到主题信息,从而将新闻信息按照主题组织并加以利用.文中通过改进加窗策略,采用自适应倒排文档频率,设计了一个中文新闻主题检测系统并进行了实验.结果表明了该系统的有效性.该系统在新华网数据中心的成功应用进一步表明系统达到了实用需求.
作者:张强弓; 喻国宝; 廖湖声; 隋树林 刊期:2004年第Z1期
为克服元搜索引擎查询速度慢、独立性差的缺点,设计了一个元搜索引擎的结果处理模型.在该模型中引入了一种4级结果集的结构,从而提高了元搜索引擎结果处理的效率.在结果提取部分提出了根据反馈信息自动调整权重的算法(FBWM),从而能够在没有人工干预的情况下自动监视各独立搜索引擎的性能变化,并随之动态调整其权重.在结果排序部分提出了改进的位...
作者:梁春燕; 夏诏杰; 郭力 刊期:2004年第Z1期
为了提高化学主题搜索引擎的查询效果,采用距离加权k-近邻分类算法来进行自动分类.为了测试该算法对化学领域网络资源进行分类的效果,文中使用化学化工资源导航系统ChIN人工积累的资源和描述信息作为数据集,并采用基于化学领域的多层次分类体系进行分类.经测试,系统微平均值Fmicro最高可达到71%.文中还就文档的关键词和数据集的熵对分类性能的影...
作者:谢欣; 刘菲菲; 李晓明 刊期:2004年第Z1期
为解决因网络中共享文件大量增加而造成的现有文件搜索引擎查准率和查全率低、查询结果可用性不强的问题,在分析用户查询日志的特征和统计文件服务器文件特点的基础上,提出了一种新的文件搜索引擎实现方案,在查询中使用基于资源的匹配来替代传统的字符串匹配,并对查询结果进行个性化排序,从而有效地提高了查询结果的质量,并提供了自动纠错等功能...
作者:彭培华; 曲波; 陈荣胜 刊期:2004年第Z1期
视频流里的文本字幕包含了丰富的语义信息,对于视频内容的理解、索引和检索具有重要的作用.文中首先对视频图像进行分割,提取它们在小波变换域中的统计特征,然后用支持向量机(SVM)分类器对这些特征进行分类,实现了字幕的自动检测与提取.仿真结果表明该方法具有较好的适用性.
作者:代六玲; 李雪梅; 黄河燕; 陈肇雄 刊期:2004年第Z1期
为使支持向量机(SVM)更加适用于在线文本分类应用,利用SVM在小训练样本集条件下仍有高泛化能力的特性,结合文本特征向量在特征空间中具有聚类性的特点,提出一种用语义中心集代替原训练样本集作为训练样本和支持向量的SVM:语义SVM.文中给出了语义中心集的生成步骤、语义SVM的在线学习算法框架,以及基于SMO算法的在线学习算法的实现.实验结果表明,...
作者:付雪峰; 王明文 刊期:2004年第Z1期
在文本分类过程中,类别之间的重叠以及标志类别属性的不足会导致类别的边界之间出现模糊不确定性和粗糙不确定性,而传统的k-近邻方法无法解决这一问题;同时,在传统的k-近邻方法以及其他一些改进的k-近邻方法中,最优k值的选取需要通过训练得到.文中借助模糊-粗糙集理论来改进传统的k-近邻方法,并使用基于距离的邻域空间,以不经训练地确定适宜每个...
若用户需要出版服务,请联系出版商,地址:广州市天河区五山路华南理工大学17号三楼,邮编:510640。