首页 优秀范文 简述数据通信的特点

简述数据通信的特点赏析八篇

时间:2024-02-03 16:57:29

简述数据通信的特点

简述数据通信的特点第1篇

为了不断提高年鉴稿件质量,使年鉴更好地发挥“真实记录历史,有效服务现实”的作用,在认真贯彻落实院通知精神的同时,结合以往在编辑稿件中发现的问题,现对年鉴撰稿提几点具体要求,供各位负责撰稿的同志参考。

⒈结合单位实际设置条目。在院发通知的年鉴“框架”中,除了勘察设计项目部分外,其他分目,一般都没有规定具体条目,需要各相关单位、部门、公司自行结合实际来确定,参照往年的条目设置,做出适当的调整和增减。条目选题的原则,主要是从题材的社会价值和存查价值出发,看有没有资料价值,然后择新择特,择大择要,求真求实,力求可查可用。尽可能地在年鉴里反映上年发生的新情况、新成果、新经验、新典型、新特点、新问题,以及新获得的奖励、荣誉;反映有年度特点、行业特色或特殊性的事情;反映发生的重大事件,举办的重大活动,产生了重大影响的工作或举措;反映本单位、本部门做的主要工作,采取的主要措施,发生的主要变化等。对上一年发生的事情或所做的工作进行全面回顾,着眼全局,掌握全面情况。选题的视野要广阔,选材的范围要宽泛,对每一个选定的条目内容,搜罗材料要齐全,不要遗漏某一方面的情况。

⒉全面详尽地搜集素材。在全面了解上年情况的基础上,经过深入细致的调查研究,通过各种渠道,全面详尽地搜集素材。对搜集的资料要进行鉴定筛选,去伪存真,去粗取精,浓缩集中,进行加工、整理,去掉那些不真实、空洞无物、虚的部分,保留那些确有价值的素材。对事情发生的时间、地点、单位、人名、数据等都要弄清楚,做到准确无误,从而为写作打下良好的基础。对那些重要的年度性资料要特别关注,以便做到大事、要事不漏,新事、特事不掉。做到“条目年年写,内容年年新”,年鉴常编常新。

⒊写好概述性条目。概述性(综合性)条目,主要记述部门、单位一年内的基本情况、综合情况,包括部门的人员结构、年度工作重点、重大变化、主要成绩和存在问题等。从总体上反映发展变化,在所处的分目中起统领作用,概括而全面、简练而充实。其特点是概括性强,着眼于宏观,高度概括,记述内容涵盖所记部门、单位的基本情况、主要工作。概述条目要求做到全面、连续、可比。全面就是将本年度的工作从总体上进行精炼的叙述,通过一定的数据反映年度特点、成就、问题和趋势;连续就是每年都要反映;可比就是条目的基本内容要相对保持稳定,可进行纵向比较。此类条目一般要求写出两部分内容:一是年度基本情况,要有全面性、概括性。二是年度必要的数据,要求全面准确、有连续性。

⒋用纪实、说明文体。条目的文体是一种说明文和记叙文兼有而以说明文为主的文体。要直陈其事,言简意赅;要据事直书,不要言过其实,要留有余地,写实不写虚。记述事实和数据,要简明扼要,把所记事物说清楚、说明白,但不能罗列事实,也不要表述作者的态度和情感,无须总结归纳观点,评论前因后果。要真实、全面记述部门、单位的成绩,也要实事求是地记述存在的问题,记述工作中的失误和存在的隐忧。要开门见山,直书其事。用简明、朴实的语言,把事情发生、发展的过程写清楚,不需要导语、套话,也不需要描写、议论。要突出重点,文字精炼。抓住主要问题或实质内容,用最简洁、最精炼的文字陈述事实,做到字斟句酌,惜墨如金。好条目的标准是以尽可能少的篇幅记述最新、最多的信息。

⒌条目的写作要有好文风。好文风在年鉴条目撰稿中,主要体现在文字精炼,行文规范,表述准确,具有准确性、鲜明性、生动性,杜绝大话、空话、套话、废话。年鉴条目撰写中,有的人总是喜欢在条目开头写下一段套话,有的面面俱到,抓不住重点。还有都加上“积极”二字,似乎不加“积极”二字,就会理解成是消极的了。良好的文风,一要注意“创新”。要善于学习,开拓思路,广泛借鉴,反复锤炼,精益求精。不照抄老材料,使条目有新鲜感。二要“准确”,真实、准确是条目质量的保证,要选具有权威性、真实性、可靠可用的材料。年鉴具有“资鉴、存史、教育、咨询”等功能,条目的表述要准确,用词要准确,引文要准确,写入年鉴条目的材料要准确,体现政策性问题更要准确。用语要得体,不能言过其实,模棱两可,含糊其词。三要“记实”。用事实说话,不写空话。新闻以真实为生命线,年鉴条目也是以真实为生命线,讲求用事实说话。四要“简练”。撰写年鉴条目时要尽量挤去水分,浓缩信息含量。五要“通俗”。条目的语言要通俗易懂。年鉴属于大众化的工具书,也就特别要求通俗易懂。主要是尽可能不用方言、俗语,不用生僻词汇,要少用专业术语,非用不可的也应作通俗的解释,以保证普通读者都能读得懂,理解无障碍。

⒍条目应具备必要的要素。条目通常应具备何时、何地、何事、何人、何因、何果六个要素。比如概述性条目,要记述全年完成的主要工作,被授予的集体荣誉,工作中存在的主要问题等,要把全年的工作归纳提炼,再浓缩展现。专题事件性条目应有事主、时间、地点、事情、原因、结果等。人物性条目应有自然状况、取得的成就、获得的荣誉等。条目写作要层次分明、条理清晰。要避免杂乱无序,思路要清晰、层次要分明。

⒎条目标题要准确新颖。标题是文章的眼睛,条目的标题要简单明了,引人注目、富有特色、利于检索。条目标题要从所记述的内容中提取中心意思,抓住实质,以简洁醒目的文字反映出来,起到“画龙点睛”的作用。制作条目标题,要注意归纳和写实,尽量把标题拟制得鲜明、简短、醒目,把内容标示给读者。好的年鉴条目标题,要体现出“求实、求精、求准、求新”的特点。同时,也要注意句子的完整规范,简写、略写和缩写要规范,表意要明确。

⒏资料要翔实准确。年鉴是信息性、资料性的工具书。作为工具书的信息资料必须翔实、可信和可用。翔实是年鉴条目质量最重要的指标。要保证年鉴条目所用资料真实、准确,年鉴条目撰稿必须注意三个方面:一是尽量反映单位、部门在勘察设计生产、经营开发、技术创新、企业文化建设等方面的新业绩,遇到的新问题,以作为今后科技咨询、学习研究、信息交流的参考借鉴。二是注意搜集典型资料。先进典型给人们以鼓舞和示范作用,在年鉴条目撰写中,要注意收集劳模和先进人物的典型事迹、科技成果、管理创新和企业文化建设等各方面的突出成果、重要活动、重大举措,既要写出成就,又要写出遇到的问题。三是注意核实写入年鉴条目的数据、人名、地名要规范,数据和名称一定要真

实、准确。

⒐不要把条目写成工作总结、新闻报道。年鉴与工作总结,二者的联系:都是对一段时间内,某个范围或某个方面情况的回顾和综述,为以后的工作提供了借鉴和参考资料。年鉴条目内容可以从总结中筛选、提炼素材,总结为年鉴内容提供了写作线索和资料。二者的区别:总结是写给本部门、本单位的领导和职工看的,记述范围是本部门、本单位的工作;年鉴的读者面更广,记述读者关心或有存史价值的事情。记述的方式也是不同的。总结可以罗列方方面面的情况,描写工作过程,时间上可谈今后的计划、打算,可采用口头语、议论式文体;年鉴的条目只记大事、要事,不必详细介绍具体做法、工作过程和经验,应简洁明了,述完为止,只记述已发生的事,不作未来预测。年鉴条目与新闻报道,二者的联系:都是信息载体,记述某一单位、部门的发展变化情况,保存了演变轨迹。记述内容注重时间性,强调信息的时效性。二者的区别:功能作用不同。新闻号称宣传、舆论工具,具有传媒导向作用;年鉴是资料性工具书,注重信息的历史价值。写作方式也不同。新闻报道强调迅速及时,抢第一时间,越快越好,为使读者有身临其境的现场感,可采用多种写作手法,如描写、比喻、对话、评论等,以增强报道的感染力,一般都有导语,可夹叙夹议,注重文字的冲击力;年鉴记述内容是冷却、沉淀的新闻,写法强调朴实精炼,准确规范,注重文字的信息含量。特别是对人物的写作,新闻报道可以外貌、性格、言谈举止、家庭朋友等多侧面描述,年鉴条目则只记述其生平事迹、行为品德、主要事迹等等。

⒑要用第三人称。年鉴是记录历史的具有史料价值的工具书。在写条目时,一般都用第三人称。尽管你是在写本单位的事,也可能你还是这项工作的参与者,但是要把这项工作记录下来,载入年鉴,留给后人查阅,必须用第三人称来表述。文中不能出现“我们”“我院”“我处”这样的字眼。这样写,就是第一人称,就像总结、经验介绍一类文体。我的理解,年鉴用第三人称来写,你就是冷静的从旁观者的角度记录历史的人,显得更加客观公正。用第三人称的最简单的办法,就是一律去掉“我”字。比如“我院”是第一人称,改成“院”就是第三人称了。其余类推。用“我们”的地方,可以省略主语,也可以换成“院”、“处”、“室”、“公司”等单位的简称。

简述数据通信的特点第2篇

Abstract: Simplified distribution automation based on fault passage indicator is suitable for smart grid in some circumstance. The working principle, research dynamic and several simplified distribution automation models are described. Detailed analysis was made on the automation models from their power methods, structure of communication system and convenience of installation. No simplified distribution automation model is universal in any application. Some models based on fragile power method can not reach the aim of strong smart grid.

关键词:简易配网自动化、故障指示器、智能电网

Key Word: Simplified Distribution Automation, Fault Passage Indicator, Smart Grid

中图分类号: V242.3文献标识码:A文章编号:

0 引言

智能电网是当今世界电力系统发展的最新方向,并被认为是21 世纪电力系统的重大科技创新和发展趋势。智能电网的目标是实现电网运行的可靠、安全、经济、高效、环境友好和使用安全。其中一个重要的概念,那就是智能电网是自愈电网,所谓自愈,就是“规划网架线路中的故障检测点,在区域电网或更大范围内规划多重保障体系”。在配电系统中,随着电缆线路在配电网中使用大幅增加,电缆线路故障也是时有发生。目前当电缆线路发生故障后,故障查找的自动化水平不高,以往的依靠运行人员徒步开展故障巡视的模式不再适合电力发展的要求。因此在配电网运行管理上需要利用新技术来切实解决以上矛盾。

实现配电网监控、解决配电网故障处理环节的最理想途径是全面建设配电自动化系统。但是配电自动化系统建设需要进行电力一次设备改造、二次终端设备安装调试、通信光路架设、大型主站系统和软件的建设维护等工作,往往建设资金投入大、时间长,一般适合负荷密集及核心功能城区实施建设,对于其他供区而言,大规模实施配电自动化建设存在性价比考量的问题。

结合配电网线路的现状,依循简易型配电自动化系统建设原则,通过研发一套完善的、准确可靠的配网故障自动定位系统,作为配电自动化系统的补充,消除配电自动化系统无法覆盖的盲区,利用先进的科技手段帮助运行、检修人员迅速赶赴现场,排除故障,恢复正常供电,从而提高供电可靠性,同时提高工作效率。能够尽快的查找故障点,才能够实现故障的快速隔离、负荷转供,这是智能电网建设对于配电网的基本要求,因此具有广阔的经济效益和社会效益。

1 国内外研究动态

1.1 短路和接地故障判断原理

电力线路故障指示器起源于二十世纪七十年代的德国,发明它的目的是为了指示电力线路短路电流流过的途径。此文讨论的故障指示器主要指电缆线路故障指示器,一般都具有三个相传感器(分别安装在A,B,C 相上)、一个零序传感器(包裹住三相电缆)和一个主机(亦称显示单元)。当配电网发生短路故障时,电源侧到故障点处的指示器均故障报警,而故障点后的指示器不报警,据此可以确定故障点的位置区间,帮助人们查找到故障点。 依据实现故障定位的判断依据,故障指示器主要可以分为两种:采用过流原理的故障指示器和采用电流突变原理的故障指示器。至于采用其他原理如首半波法、五次谐波法、注入法、故障电流方向法等判断依据的故障指示器,因存在各种各样的问题,应用得较少。

1.1.1 采用过流原理的故障指示器

线路发生短路和接地故障,线路中的故障电流将增大,当电流增大超过某一设定值时,采用过流原理的故障指示器将报警显示。此类指示器都需要预先设定一个短路和接地故障报警阈值,短路一般在400A-1200A,接地一般在5-60A,范围可调。目前采用此原理的指示器占市场主流地位,例如德国EMG、HHH,英国NORTECH和部分国内厂家的产品。

1.1.2 采用电流突变原理的故障指示器

当线路发生短路和接地故障后,线路会发生较显著的瞬间电流变化,当保护装置动作跳闸后,线路的稳态电流变将为零。检测出电流值的这种突变,也可判断出短路和接地故障。因这类指示器不需要预先设定报警阈值,其适用范围更加广泛。但是因其需要实时监测线路电流,产品功耗较大,使用寿命较短。目前有斯奈德FLAIR系列和国内一些厂家的产品采用此类原理。

1.2 故障指示器实现简易配网自动化的模式

1.2.1 传统型故障指示器实现简易配网自动化模式简介

传统型故障指示器都具有故障信号远程传输接口,一般采用继电器触点的变位来指示短路故障和/或接地故障,有的指示器还具有电池欠电量和远程复位接口。将开关站内每台指示器的继电器触点汇集起来,接入到数据采集器上,再通过GPRS无线信号,将数据传输到监控主站上。监控主站一般设置有一个GPRS接收机和与其相连的计算机,应用特殊编写的监控软件即可将站内的指示器故障信息显示出来。也有配合开关站的自动化改造,将指示器的触点信号接入到DTU/FTU上,由DTU/FTU通过光纤通道将指示器故障信息上传到监控主站。再配置监控主站的软件将故障信息显示出来。

传统型故障指示器实现简易配网自动化的模式不需要对故障指示器进行任何改造,只要增加一台数据采集器和进行相应的配线即可实现,成本较低,比较适用于已经安装了故障指示器的开关站或需要进行配网自动化改造的场合。但是这种模式存在接线复杂,施工困难,无法改善指示器功能和性能等缺点。

1.2.2 新型故障指示器实现简易配网自动化模式简介

针对传统型故障指示器实现简易配网自动化模式的缺点,配合近年来的智能电网建设,目前出现了多种新型的故障指示器及实现简易配网自动化的模式。尽管厂家将其吹捧的天花乱坠,但是新型故障指示器并没能将故障判断的准确性有明显提高,主要是增加了一些参数检测功能和对其通讯系统进行了改善。

光纤型两遥故障指示器及其实现简易自动化模式:系统由安装在电缆上的故障检测传感器、本地显示主机、通讯终端和主站系统等组成。故障指示器的传感器不仅可以监测故障,而且增加了电流检测功能。故障和电流参数通过光纤分别接到主机和通讯终端上。接入到主机的故障信息本地显示,接入到通讯终端上的故障和参数信息通过无线GSM由主站监控软件接收。这种模式在南方电网的部分地区得到推广应用。

无线型故障指示器及其实现简易自动化模式:系统由无线指示器、无源型DTU、主站系统等组成。无线指示器的传感器同传统型指示器,只是其主机部分取消继电器触点的信号远传方式,用短距离无线通讯方式取代。指示器监测到故障后,通过短距无线通讯信号将故障信息传输到无线收发器,无线收发器嵌入在无源型DTU内部,无源DTU再通过无线GPRS将信息传输到主站监控系统。这种模式在北京、华北的几个省区有实际应用。

串行通讯型故障指示器及其实现简易自动化模式:系统由串行通讯指示器、数据汇集器、DTU/FTU和主站监控系统等组成。指示器主机部分具有RS485串行通讯接口,当指示器监测到故障信息后,通过串行通讯网络将故障信号传输到数据汇集器上,数据汇集器与DTU/FTU相连,相互间采用标准的MODBUS协议进行通讯,故障信息再由DTU/FTU通过光纤网传输到主站监控系统。这种模式在华东部分地区得到了推广应用。

数字式故障指示器及其实现简易自动化模式:系统由数字式故障指示器、数据采集器和主站监控系统等组成。指示器的传感器采用自取电和大容量锂电池供电,实时监测故障状态,根据故障电流特征进行故障判断。因其内部具有短距离无线通讯模块,可实现与站内数据采集器的双向通讯。传感器还可以附加上温度检测、电流检测等功能。数据采集器将所采集到的故障和参数数据通过无线GPRS上传到监控主站。

2 基于故障指示器的简易配网自动化典型模式评述

故障指示器实现简易配网自动化需要解决好指示器和远程数据通讯单元的供电问题、信号远程传输问题、与监控主站软件SCADA、GIS系统接口等问题,同时需要兼顾系统兼容性、施工简便性、免维护性和性价比等因素。下文将从上述几点对基于故障指示器的简易配网自动化几种模式进行评述。

2.1光纤型两遥故障指示器及其实现简易自动化模式评述

光纤型两遥故障指示器的传感器采用自取电和锂电池做后备电源的供电方式,因其具有故障监测和电流检测功能,其功耗为毫安级。为了省电,当线路电流较小时,电流检测功能关闭。其故障信号上传采用两路光纤分别到本地显示单元和远程数据采集器,功耗较大。通讯终端亦为无源型,采用大的开口CT从电缆线路取电,用超级电容做后备电源,电源使用用寿命较长。通讯终端接收传感器信号部分为光电接收电路,功耗较小。远程无线GSM通讯部分采用平衡式传输规约以降低功耗。这种供电方式比较适用于线路负荷较大的地方,最好是在电流大于30安培以上的场合,故障监测和电流检测的功能才能比较顺利的实现。该方式最薄弱的地方是安装在电缆上的零序传感器和短路传感器,当电池用尽,线路电流又较小时,该模式将因没有电源而失去作用。

该模式的故障信号传输通道是传感器通过光纤直接传递故障和/或参数信息到电缆子站,再由电缆子站通过GSM信息或采用串行接口及标准101协议到中心站,中心站设备再通过无线GSM将信息传输到主站系统。整个通讯系统比较复杂,层次较多。在将传感器信号上传时,每只传感器需要2根光纤,对于常见的2进6出有8面环网柜的开关站,需要铺设64根光纤,很容易造成接线错误,施工难度很大。由于需要电网断电安装,也给安装施工增加了不少难度。

监控主站系统接收各子站内指示器的数据信息,软件采用图形化界面,并将故障信息与地理信息系统结合,显示界面友好。

2.2无线型故障指示器及其实现简易自动化模式评述

无线型故障指示器主机仍采用锂电池供电,只在故障发生时采用平衡式规约通过短距离无线信号上传故障信息。因故障发生的几率少,信息代码较短,无线传输的平均功耗较继电器触点方式相差不多。接收无线指示器故障信息的无源DTU也采用自取电和超级电容做后备电源的供电方式。因其无线接收部分的功耗很大(20毫安左右),而且不可待机运行,这就决定了该模式只适用于电缆线路电流较大的场所。

该模式故障信息传输通路是无源传感器通过光纤将故障信号上传到主机,主机通过短距离无线信号(2.4GHz)再将信号上传到无源DTU,DTU通过无线GPRS将信号上传到主站系统。该通路全部采用无线进行信号传输,极大地方便了施工和安装。但是为防破坏GPRS天线必须安装在很隐蔽的地方,信号因屏蔽而消弱,在市郊比较偏僻的地方,信号可能无法顺利上传到主站。

监控主站系统一般独立与监控终端的SCADA系统,采用独立的一套软件来显示故障区段。软件也采用图形化界面,并将故障信息与地理信息系统结合,显示界面友好。

2.3串行通讯型故障指示器及其实现简易自动化模式评述

串行通讯型故障指示器电源由配网自动化监控终端DTU/FTU提供,采用交流供电加超级电容和蓄电池后备的方式。故障指示器不再使用锂电池供电,正常时处于待机状态,功耗为微安级,当传感器发送来故障信号时,指示器点亮本地报警指示灯,然后开启串行通讯电路,将故障信息主动上传给数据汇集器。数据汇集器的串行通讯电路一直处于接收状态,其功耗在20毫安以内。数据汇集器再通过另一路串行接口将故障信息传递给DTU/FTU。这种供电模式由于有交流电源和大容量后备电源,供电可靠性最高。另外去掉指示器主机的锂电池,消除了指示器最可能的故障源。这种模式比较适用于进行配网自动化改造而又不想对每一路分支线路进行监测和监控的场合。

该模式的通讯通道是指示器在接收到故障信号后通过串行接口上传到数据汇集器,数据汇集器暂存各指示器故障状态,由DTU/FTU通过串行接口采用标准MODBUS协议信号采集,DTU/FTU通过光纤网与主站系统相连。

该模式借助配网自动化主站的SCADA和GIS系统显示故障指示器的状态和位置信息,不需要一套独立的设备和软件。

2.4数字式指示器及其实现简易自动化模式评述

数字式指示器实际上就是增加了电流检测、温度检测等功能的指示器,它采用自取电加锂电池后备的供电方式。其传感器内部具有短距离无线通讯模块,功耗较大。尽管采用了大容量锂电池和特殊的磁回路来取电,但在线路负荷较小的地方,其实际使用寿命将会大大缩短。另外传感器上附加的一些不切实际的功能更加重了供电系统的负担。系统中起数据转接功能的数据采集器可以使用太阳能取电(架空线路使用)或开口CT取电(电缆线路使用)。采集器内的无线模块需要一直处于工作状态以接收传感器上传来的故障和参数信息,其实际功耗较高。

该模式的通讯通路是安装在电缆线路上的传感器直接通过无线模块将故障和或其他参数信息通过短距离无线方式传送到数据采集器上,数据采集器再通过无线GPRS上传到监控主站。由于传感器是安装在开关柜高压室内,短距无线通讯的通路被铁皮柜大部分屏蔽,该通讯方式比较脆弱。

3 结论

简述数据通信的特点第3篇

关键词:关联数据;知识组织;语义网

传统知识组织在文献信息组织与检索中发挥了巨大的作用,随着计算机技术以及语义网技术的发展,对知识组织的研究将更加深入,如何丰富和拓展知识组织的结构和功能,如何深度序化信息资源的内部属性和特征,无缝的链接相关的信息资源,消除信息孤岛使其富含语义,如何有效的整合、序化异构、动态变化的网络信息资源将成为知识组织研究的热点。关联数据作为轻量级的语义网实现方法,自2006年由Tim Bern

ers-Lee[1]提出以来备受关注,逐渐成为图情界的翘楚,关联数据以通用框架RDF描述信息资源,关注的焦点放在信息本身而不是承载信息的页面或是信息的访问接口,组织的对象直接深入到细粒度级的具有语义信息的实体,为每个信息实体定义唯一的URI,使用RDF链接相关的实体从而构建关联关系,揭示信息间的语义隐含,到达语义揭示的目的。鉴于关联数据的特性以及它在知识组织、信息聚合等方面的突出表现,本文以关联数据为视角,探索知识组织的新方法,通过关联数据的应用实现知识组织的语义化、标准化,以促进知识组织的新发展。

一、关联数据在知识组织中应用的优势

(一)关联数据一种轻量级的语义网实现方法,结构简单适合混搭。关联数据设计的技术主要是统一资源定位符(URI)、超文本传输协议(HTTP)和RDF资源框架。关联技术没有定义特定的实现方式和技术,只是提出了的原则和要求,只要遵循四个原则即可[2]:使用URI作为任何事物的标识名称、通过

HTTP协议,任何人都可以访问这一事物、以RDF的形式提供有用的信息、尽可能多的提供相关的URI链接。简单来说就是使用RDF框架描述信息资源,通过HTTP的方式去访问,利用

RDF链接的信息导航到更多的相关信息。

(二)信息之间的语义更加明显,不仅是单纯的知识链接。关联数据本身不会给信息增加任何语义含义,其在底层数据间构建了信息之间的链接,以携带语义的形式展现给用户,通过将目前文档web转化成数据的Web,并在不同的数据间通过

URI建立关联,最终实现信息资源有效整合。

(三)关联数据采用标准化的RDF描述信息资源。RDF是一种用来描述Web上资源的语言,将一个资源描述成一组三元组(主语,谓语,宾语),主语用来表示需要描述的资源,谓语用来表示主语的某个属性或者某个关系,宾语表示了属性的值[3]。主语、谓语都可以用 HTTP URI来表示,其中宾语也可以用 HTTP URI 标识另一个资源。例如:Yantai University(主语)is

located(谓语) in Yantai(宾语)。主体和客体都是一个独立的类资源,都有自己的HTTP URI标示符,通过查看“Yantai Univer

siyt”的描述,还可以链接到客体“Yantai”的具体描述的信息,同时“Yantai”还有自己的属性值可供参引。

二、基于关联数据的知识组织模型

关联数据主要使用URI,HTTP,RDF 等语义网技术来实现,使信息组织更加细化、结构化和语义化,同时能够支持机器理解和处理,另外,其统一的数据模型(RDF)、统一的存取API

(RDF/SPARQL)、统一的HTTP URI标识,为信息对象的整合和组织提供了统一的标准,使得在开发应用的时候可以考虑使用几个平台的混搭。本文设计了一个基于关联数据的知识组织的技术体系,为知识组织提供新的研究方法和思路。

图1 基于关联数据的知识组织层次模型

从图1可以得出,基于关联数据的知识组织框架可以分为底层数据源、语义标引层、RDF数据关联层、信息资源应用层,如下对四个层次进行介绍。

(一)底层数据源的组织。数据源主要包括:来自不同领域的信息资源,可以是图书的出版社、科学出版物的刊号、地名、人名、等具体化的数据资源;同时也可以是早已成型的关系数据库系统中的数据,如:图书馆的图书目录数据库、企业内部资源的数据库、科研机构的知识管理系统。这两者是目前为止比较受欢迎的关联数据底层数据源的组织形式,如果将这些信息源进行整合、组织,以关联数据的形式出去将会有惊人的发现。在此笔者将底层数据分为如下三类。(1)易于检索的结构化数据。这类数据主要设计到存储在关系数据库中的结构化数据,已经有了成型的数据模型。(2)分散的异构的网络信息资源。主要指分布在网络上,以html网页的形式表达的、异构的、分散的、形式多样的数据,对这些数据的聚合难度相对来说比较大,要进行充分的分析、预处理。(3)静态的结构化数据。主要包括了CSV、Excel、BibTeX格式的文件,这些文件要通过RD

Fizing等工具转换成为RDF格式的数据,然后存储到RDF数据库中。

(二)信息的语义标引。语义标注是使用计算机可理解的属性来描述资源,目前的语义标注中,标注往往是针对特定的应用,不能根据不同数据的特点而灵活变换标注方法,如领域本体只是针对特定的领域内的信息资源来标注、概念化信息资源。进一步而言,标注方法只能标注相互独立的数据信息,涉及到数据之间的相互依赖、相互关联时,往往不能明确的标注这种依赖关系。本文讨论的关联数据采用的是RDF三元组来描述资源,其中包括了“主体”,“谓语”,“客体”,使用规范的词表标注三元组陈述的“谓语”,不仅灵活的描述了信息资源,信息资源间的相互依赖关系清晰的展现了出来。RDF仅仅使用特定命名和值来表达与资源有关的简单声明,很大程度上了限制了用户的使用范围,比如说定义Person类了来描述人,定义Orga

nization类来描述机构等,因此需要扩展更多的词表。DC、

FOAF、OWL、SKOS等规范的词表扩展了RDF/RDFS的描述能力,作为关联数据集和用户之间的桥梁得到了很好的应用,充实饱满的描述了信息资源。

(三) RDF数据关联层。RDF数据关联层是通过数据集内部的URI来实现,一个RDF三元组描述了一个数据对象,这个数据对象的客体或者主体在其他RDF三元组中也有类似的描述或者相依赖的资源,这样就需要构建这两个RDF数据描述间的关联,此中情况只是针对本地数据库中的信息资源。另一个情况扩展其他开放的关联数据集,因为这些数据集之间已经形成了很好的数据链接,研究者只需要获得相关对象的URI就可以链接到他们的数据集,从而把自己的数据集中的相关信息进行扩展。当把开放的数据集作为链接的潜在候选目标时,如下几点应该考虑在内:(1)目标数据集中的主要领域是什么。(2)所链接的数据集中对象的URIs是否稳定、保持不变。(3)目标数据集和它的命名空间是否保持一致、不会随时变化。(4)目标数据集中的RDF links是否和其他关联数据集保持无缝的链接,没有死链接或者空节点。

(四)信息资源应用层。为关联数据的资源主要是通过以下方式浏览和检索。(1)关联数据主要是以URI来标识数据对象的,通过HTTP参引可以找到相应的资源RDF描述,通过数据间的RDF链接在这些相关的数据源间导航,获得用户感兴趣的知识。(2)后的信息资源以RDF的形式呈现,使得一些基于RDF的浏览器插件成为佼佼者,比如Tabulator

Browser、OpenLink RDF Browser插件在浏览关联数据方面发挥了很大的优势。(3)SPARQL是为RDF开发的一种查询语言和数据获取协议,能够接收客户端的查询请求,可以在关联数据源中像SQL那样查询,并把结果反馈给用户,如Wikipedia、GeoNames、MusicBrainz、DBLP bibliography这些数据集都支持这种SPARQL端点查询访问模式。

三、学术论文特色数据资源的知识组织的实例

(一)学术论文特色知识库的系统结构。为了验证前文提出关联数据在知识组织中的优势及框架的合理性,本文以“烟台大学图书馆学术论文数据库”为背景,构建了基于关联数据的特色知识库,遵循关联数据的基本原则,揭示信息资源之间的内在语义关联。

图2 学术论文知识库系统模型

鉴于学术论文数据库的特点,采用D2R的方式将学位论文数据成富含语义的关联数据。D2R Server是一个HTTP Server,支持将关系数据库中的内容成为RDF描述形式的关联数据。D2R提供一种可定制的映射文件:D2RQ Mapping 文件,该映射文件将关系数据库的数据转换为虚拟的 RDF 数据进行访问,其中表的名字转换成了映射文件中的类(d2rq:ClassMaps)、表中的列转换成映射文件中的属性(d2rq:Property

Bridges),通过映射文件中这两个类和属性来表示关系数据库中的数据表间的关系以及表内不同属性的关系。在用户在前台请求相关的信息实体时,D2RQ Mapping 文件会映射到关系数据库,将查询结果转换为RDF描述的实体、属性反馈给前台界面。

(二) 学术论文资源的建模。以“烟台大学图书馆学术论文数据库”为主要数据源,对信息进行了预处理,归纳为论文、作者、论文主题、组织机构、论文所属期刊五种实体类型,如下图是它们的关系图。

图3 实体关系图

本文采用SQL Server作为底层数据的存储容器,上述几个实体类分别包含了各自的数据项,在关系数据库建立相应的表存储,如:Papers、Persons、Topic、Department、Periodical表。在后台处理的时候还要考虑数据实体间的关联,Paper表中的作者字段必须和Persons表中的作者字段相关联、Topics表中的论文名称需关联Papers表中的论文名等等。

(三)学术论文特色知识库的实现。实现了底层数据的组织以后,就要采用D2R的方式将SQL Server关系数据库的数据成为RDF描述数据,这样才能使关系数据库中的数据富含语义,数据之间形成链接的数据网。其实在通过D2R形式关系数据的时候,所形成的D2RQ Mapping映射文件将关系数据虚拟成为RDF格式,在上层浏览、查询的时候通过此映射文件对关系数据库进行操作。

本实例使用的是SQL Server数据库,需要把SQL Server的驱动包放到D2R Server的lib下,在进行浏览、查询的时候才能驱动数据库。然后需要运行生成映射文件的脚本:gener

ate-Mapping [-u username] [-p password] [-d driverclass] [-o out

file.n3] [-b base uri] jdbcURL,参数的意义为:数据库的登录名、数据库登录密码、驱动名称、输出映射文件名、JDBC链接数据库的URL。此脚本运行后生成一个对应关系数据库的映射文件linkeddata.n3文件,用来实现上层关联数据的展示和查询。

其D2RQ Mapping是基于RDFS和OWL进行描述的,自动生成的与关系数据的映射文件显得简单、粗糙。表之间的约束关系、关联关系没有形成很好的链接,谓词的也是默认的表中列的值,在表达语义方面显得苍白无力,与外部数据源间的链接也需要用词表来描述。如下

实例中用到的部分词表有dc:title表示论文的题目,dc:data的日期,dc:author论文的作者,dc:Description对论文的描述,foaf:person说明这个类是用来描述人的,foaf:knows描述与此人有关系的人, skos:PrimaySubject描述该文献的主题,

vcard:locality描述机构的位置。这些规范词表的使用规范了对数据的描述,更容易让人明白要表达的关系,另外采用规范的词表来描述,使机器也能很好的识别,关联数据的共享和重复利用变得更加容易。

(四)结果分析。本实例经过D2R后的关系数据库,使得信息资源使用RDF描述,并且富含语义,能比较好的展示数据之间的语义关联。linked data技术在知识组织中的运用,使得用户可以通过HTML浏览关联数据,还可以通过SPARQL语言实现对关联数据的查询。Linked data不仅可以整合内部相关的信息,使其深度序化,还实现了与外部相关数据的关联,对分布式异构的网络资源的整合提出了很好的解决办法。准备好数据后在D2R的路径下启动服务器,运行命令d2r-server linked

data.n3,在浏览器中输入:http://127.0.0.1:2020/,即可进行关联数据的浏览。以一个作者的数据为例,如下图4所示。关联数据化后的作者元数据的属性和实体都是比较灵活的,都有与之相关的URI导航到作者的所属部门、发表的其他论文、合作者等等相关的信息。

图4 关联数据化的作者详细信息

其中http://localhost:2020/data/persons/1是实体的唯一

URI,分别用实体和属性来描述实体的,点击图4中属性dc:cre

ator,可以导航到作者的描述。

图 5 关联数据化的论文信息

SPARQL是W3C的RDF数据工作组设计的一种查询语言和协议,用于RDF数据的查询。本实例也支持基于

SPARQL检索。图6中检索的内容是:在烟台大学图书馆2000年以后发表的学术论文。

图6 基于SPARQL语言的查询界面

结论:本文利用关联数据对烟台大学图书馆学术论文数据库再组织,实现了关联数据的html导航浏览、SPARQL检索服务。深层次的序化了学术论文的关联关系,发掘学术论文中隐含的语义信息,比如说学术论文所属作者的合作关系、学术论文主题相关性、作者所属部门的关联等等,无缝的链接相关的信息资源,消除信息孤岛使其富含语义,以知识链的形式呈现。

关联数据一种轻量级的语义网实现方法,结构简单适合混搭,没有定义特定的实现方式和技术,只是提出了的原则和要求,因此可以不受技术的限制,定制化自己的实现平台,其强调语义关联、数据网络,无疑将成为未来信息聚合、知识呈现的佼佼者。关联数据的发展带来了语义网的普及,基于 RDF形式存在的数据也会不断增多,如何消费关联数据、如何使用

SPARQL语言进行语义发现将会成为研究热点。

参考文献:

[1] 刘炜. 关联数据:概念、技术及应用展望[J]. 大学图书馆学报,2011(02):05-12.

简述数据通信的特点第4篇

论文摘要:从信息论的角度,针对基于高斯噪声信道的数字水印容量作了初步探索。在详细阐述图像数字水印基本原理和水印信道的构造及生成方式的基础上,针对高斯信源分布具有最大的不确定性、能够在所有的二阶随机分布中提供最大信息熵的特点,重点分析了在高斯分布情况下的整个水印信道通信过程;并引入平均互信息理论,给出了基于高斯的水印信道容量的最大通信速率;同时分析了加性噪声信道下的容量问题,将高斯分布扩展到了非高斯分布,给出并优化了容量计算表达式,同时利用MATLAB软件工具给出了非高斯信源水印容量与受限失真度的二维和三维关系仿真曲线;最后结合实际给出了结果分析。

论文关键词:数字水印;信道容量;高斯噪声信道;攻击信道;信息论;

0引言

数字水印可视为通信理论的一种应用[2]。随着对数字水印算法可靠性要求的提高,目前的数字水印不论在数学理论上和技术上均不成熟,对数字水印系统的公式描述仍然没有统一的定论,在数字水印系统最终性能方面存在较多的不确定性[1,7,8]。这些均可以从信息论的角度上寻求解决出路。

数字水印系统分为水印嵌入编码,攻击信道,和水印译码三个模块。这里,我们对一般数字水印模型提出了改进,在水印嵌入之前加入待嵌入信号预处理,给出了对于水印通信模型的更加恰当的描述,如图1。

根据改进系统框图,数字水印的实施过程可分为如下步(只考虑图像水印):

(1)密钥生成:在进行水印处理之前,随机密钥经伪随机信号发生器生成,并在编码和译码端可知;该密钥与待嵌入消息M和原始载体信宿相互独立。

(2)形成水印信号:通过一预处理器对消息M作压缩或编码预处理,同时还可利用原始载体信宿提供的边信息进行预编码,保证水印的唯一性,改善误码率,提高通信容量。

(3)水印嵌入:待嵌入消息水印信号M通过某种算法,与密钥进行相关处理,被嵌入长为N的载体序列中,生成的图像水印可表示为,且。

(4)攻击信道:该生成水印在传输过程中将会受到恶意攻击导致其中的W信号被去除而生成被修改的信号。

(5)提取或检测水印:借助原始载体图像(私有水印或非盲水印),或不依赖原是图像(公开水印或盲水印),利用相关接收机、匹配滤波器、最大后验概率译码规则(MAP)来提取或检测水印。1、信道容量的数学分析

水印的信道容量是所有可达速率的上限。根据理论分析表明[1,7,8],它由如下三个参量决定:嵌入失真,攻击失真,以及载体信宿的概率分布函数{PS}。

可以证明:当原始载体信源的功率(方差)为,那么对于公开水印和私有水印,其信道容量均不超过。其中:首先定义区间:

,(10)

通过计算,当时,可以得到区间为空域。当区域非空时,定义水印容量

=(11)

特别的,当载体信源S满足零均值,方差为且独立同分布的高斯分布时,公开水印与私有水印具有相同的水印信道容量,且该容量正好等于上限。

2、信道容量计算公式的简化

上述容量计算公式过于复杂,可进行如下化简,根据水印的信道容量公式(11),我们有

==

=(12)

而前面(10)已经定义区间:

根据上面的推导,可把暂看作常量,那么容量C决定于中间变量的取值,即根据适当的选取值得到最大化的C;但实际上由(10)式我们可以看到的取值范围又由决定。经过适当的约束和简化,最终我们可以得到

(13)

但考虑到,当时,实际上这种攻击对水印是完全无效的[5];因而攻击者不会采用。所以进一步给出攻击失真的取值范。在小范围失真下,即,有,所以可得到小范围失真条件下的容量近似公式:

(14)

根据上式,我们可以看到在小范围失真情况下,容量与载体信源的统计概率分布无关。当时,根据上式,可以得到容量C=0.5bit/Symbol。

3、模型的约束性优化和扩展

为了更好的理解水印系统,简化分析,可引入加性噪声信道的概念。对比乘性信道,加性噪声信道具有统计分布参数(如方差)简单加的特点,这对模型的分析十分有利。实际上,目前关于信息论的许多研究都从加性噪声信道分析入手[1,5]。

可以将经攻击伪造后的消息Y写成如下形式:

其中,,。(15)

图2数字水印博弈模型

根据上式,可将水印理解成一种带有边信息的通信博弈[2]。将理解为被传输的信号,同时受到加性噪声S的破坏(这里将载体信源看作相对于的加性噪声);S在传输端可知。而可以理解成一种可加性干扰信号,该信号由决定。那么,当失真测量为简单的差度量度时,该失真度由加在上的干扰限制决定。特别的,在本例中,因,系统失真由加在被传输的上的总干扰功率决定,即功率受限。同样的,如果,那么可加性干扰信号也是功率受限信号。

考虑信道的输出为,其中输入的功率受限为;S为任意的功率受限且各态历经的过程,并假设S仅在编码的时候是可知的,而在解码是是未知的。为一稳态高斯过程,对编码和译码均不可知。假设S和相互独立,其联合概率分布与独立。

考虑S和均为满足独立等同概率分布的随机变量;特别的,S任意分布(可以为非高斯分布),而满足零均值,方差为的高斯分布。也为满零均值,方差为的高斯分布,并且与S和的联合概率独立。同时设辅助随机变量。那么,有

,(16)

可以证明,在条件下,随机变量和不相关,且相互独立。因和均为高斯分布,那么也满足高斯分布。又因S和相互独立,所以随机变量与也相互独立。这样,可以推出如下结论:

(17)

同时,与独立表明:

(18)

所以,综合上述两式,可以得出:

(19)

上式最后一等号的成立是因为满足零均值,方差为的高斯分布;满足零均值,方差为的高斯分布;同时考虑的是加性噪声,因此两个,联合分布的方差即为两者方差的简单和。根据高斯分布的熵公式[6]很容易得出上述结论。

简述数据通信的特点第5篇

Abstract: With the development of the internet and the widely-used information technology, the 21st-century library has been globalized, internized and digitalized. This trend urges the management system of library information to be faced with a total reform. Based on the WEB and techniques, the model of Browser/Server will offer the realization of simplicity and easy-practice which feature the library system. It also possesses the advantages of being expanded and maintained, which has been the mainstream developing direction of modern library management system.

关键词: 图书馆;信息管理;B/S模式

Key words: library;information management;the model of Browser/Server

中图分类号:TP39 文献标识码:A文章编号:1006-4311(2010)19-0141-01

1Web服务概述

Web服务是描述一些操作(利用标准化的XML消息传递机制可以通过网络访问这些操作)的接口。该接口隐藏了实现服务的细节,允许独立于实现服务基于的硬件或软件平台和编写服务所用的编程语言使用服务,允许并支持基于Web服务的应用程序成为松散耦合、面向组件和跨技术实现。Web服务是用标准的、规范的XML概念描述的,称为Web服务的服务描述。这一描述包括了与服务交互需要的全部细节,消息格式(详细描述操作)、传输协议和位置。EJB、COM+、CORBA以及任何可用于对象实现的技术都可用于Web服务的对象实现。

Web服务是一种部署在Web上的对象/组件,它具有以下特点:①完好的封装性。Web服务是一种部署在Web上的对象,具备对象的良好封装性,对于使用者而言,仅能看到该对象提供的功能列表及接口参数,不必探究其实现细节。②松散耦合。传统的应用软件设计要求各个单元之间紧密连接,这种连接形成的复杂性要求开发者必须对连接的两端元素有完全的了解和控制能力。而基于Web服务的软件应用,仅需要一种适合互联网环境的消息交互协议和相应的查找、发现机制,并允许更加自由的配置。③标准协议规范的开放性。使用标准协议规范,解决了异构平台的通讯问题。作为Web服务,其所有公共的协约完全需要使用开放的标准协议进行描述、传输和交换,这些标准协议是完全开放的,可以由任何组织进行实现。一般而言,绝大多数规范将最终有W3C或OASIS作为最终版本的方和维护方。④高度的可集成性。由于Web服务采取简单的、易理解的标准协议作为组件接口描述和协同描述规范,屏蔽了不同软件平台的差异,无论是CORBA、DCOM还是EJB都可以通过这种标准的协议进行互操作,实现在互联网环境下高度的可集成性。

2B/S结构模型基本原理

B/S结构模型:即浏览器/服务器结构,它是随着Internet技术的兴起,对C/S(客户机/服务器)结构的一种变化或者改进的结构。在这种结构下,用户工作界面是通过WWW浏览器来实现,形成所谓三层结构:即数据表示层、业务逻辑层和数据库访问层。

①数据表示层。人机界面是用户与系统之间信息交互的窗口。其主要功能是检查用户输入的数据,显示系统输出的数据。②业务逻辑层。也称为功能层,是应用的主体,位于Web 服务器端,包括了应用中全部的业务处理程序:即除了输入输出在表示层,数据库在数据访问层以外,全部的统计、汇总、分析、打印功能都存放在功能层。③数据访问层。由数据库管理系统和数据库组成,数据库管理系统负责管理其数据库,为应用程序提供支持,位于数据库服务器端。它的任务是接受Web 服务器对数据库操作的请求,实现对数据库查询、修改、更新、删除等功能,再把运行结果提交给Web 服务器。

3B/S模式的优点有

①简化了客户端程序,用户操作使用更加简便,数据高度共享 在客户端只需有浏览器以及相应的操作系统、网络协议软件即可,能实现不同的人员,从不同的地点,以不同的接入方式(比如LAN, WAN, Internet/Intranet等)访问和操作共同的数据库。②简化了系统的开发和维护。B/S 模式所有应用软件的开发、维护、升级等工作由Web 服务器承担,增加和修改服务器端的软件模块功能即可实现所有用户的同步更新,便于后期维护与升级。③安全性较高,资源利用率高。B/S结构软件通过一个JDBC连接缓冲池连接到数据库的,用户并不保持对数据库的连接,用户数基本上是无限的,并且系统在客户机与数据库服务器之间增加了一层Web 服务器,有效地防止了非法入侵。④投入成本低,易于扩展。初期一次性投入成本,有利于软件项目控制和避免IT黑洞,后期随着服务器负载的增加,可以平滑地增加服务器的个数并建立集群服务器系统,然后在各个服务器之间做负载均衡,有效地保护了原有硬件投资。⑤B/S 模型具有统一的客户端标准,集中的服务器管理,可跨平台操作等特点,正适合以网络为中心的计算特点。

4基于B/S模型的图书馆管理系统

①系统平台。WWW服务平台种类繁多,根据简单、先进和易于管理的原则,我们采用的是Microsoft公司的Internet Information Server (IIS)6.0建立WEB服务器。②数据库服务器。我们首选Microsoft SQL Server 2005作为的我们的数据库,其开放的体系结构,与系统的无缝连接,为能与Internet形成高效紧密集成的WEB服务提供了可靠的保障。③图书馆管理系统的功能实现。通过学院网页访问图书馆网站可出现读者登录窗口和办公窗口,通过办公窗口进入后,根据用户已设定的使用权限开放其功能:a)系统管理员登录:增加、删除、修改用户数据,包括用户个人信息、使用权限(采编、流通等);设定各种表格格式、备份数据;设置各种参数,包括书库、阅览室编码数据;各种类型图书编码格式、借阅期限、超期罚款额度等。b)采编人员登录:导入或编辑录入入库图书编码,验收、统计入库数据,新书推介。c)流通人员登录:增加、修改、处理读者数据,流通处理、流通数据统计,预借数据处理,超期预警提示。d)其他工作人员登录:入库验收、典藏管理等。e)读者/浏览用户登录:可根据书名、作者、关键词等查询入库图书:是否有该书籍、书籍是否在馆、在哪个馆、已外借书籍的归还限期等,读者编号登录可预借、查询读者已借阅的图书信息等功能。

参考文献:

[1]张培,金浩.基于信息构建的WEB信息管理体系研究[J].河北工业大学学报,2006,(01).

简述数据通信的特点第6篇

Abstract: IEC 61850 adopts object-oriented modeling techniques to model business functions of the substation, and defines substation configuration description object model by Substation Configuration description Language (SCL). SCL which is based on XML Schema cannot description the knowledge semantic and achieve substation knowledge exchanging of substation automation system. Knowledge semantic of substation was analyzed and substation knowledge was modeled based on ontology technology in this article, including the relationships and constrains of substation knowledge semantic. By extending the label definition of SCL we build the semantic information model and improve the description ability of IEC 61850.

关键词: IEC 61850;SCL;XML Schema;知识本体;知识语义;形式化描述

Key words: IEC 61850;SCL;XML Schema;Knowledge Ontology;Knowledge Semantic;Formal Description

中图分类号:TM63 文献标识码:A 文章编号:1006-4311(2012)29-0084-03

0 引言

IEC 61850是国际电工委员会颁布的变电站自动化网络通信系列标准,与我国DL/T 860变电站通信网络和系统国家标准相对应[1][2]。IEC 61850采用面向对象技术,通过逻辑节点(Logical Node,LN)、逻辑设备(Logical Device,LD)等概念建立起变电站自动化系统信息模型,并由基于XML格式和XML Schema构成的变电站配置语言SCL来完成模型的形式化描述工作。SCL的提出使系统设备的自描述、在线配置及即插即用功能得以方便地实现。在SCL 配置文件中,按照统一的方法对设备配置进行描述,可以保证设备之间互相识别,实现设备之间信息的无缝交换和操作[3]。

本文通过分析XML Schema的基本构成和特点,总结基于XML Schema 的SCL 基本构件的关联关系,基于本体技术对变电站相关知识语义进行建模,并通过扩展SCL实现变电站运行规范等知识语义的形式化描述能力。举例说明扩展SCL知识语义描述能力的形式化描述方法,指出XML Schema在SCL语义表达方面的缺陷,提出基于本体建模技术的变电站自动化通信网络知识语义交换模型的整体框架结构。

1 基于XML Schema的SCL应用模式分析

1.1 XML Schema组成和特点 XML Schema规范由W3C委员会于2001年颁布,主要用来描述XML文档的合法结构、内容和限制,同时定义可共享的领域词汇表和XML文档的结构并提供它们之间的联系手段。与XML DTD(Document Type Definition)相比,XML Schema增加了丰富的数据类型说明,内置多种数据类型,并通过value space、lexical space和facet三部分组成的三元组表达更复杂的数据语义,同时还支持用户自定义类型,引入的名称空间增强了XML的语义描述和扩展能力。

1.1.1 XML Schema组成 XML Schema由类型定义和元素声明组件构成,主要用来评价XML文档格式的良构性和属性信息的有效性。用于定义类型和声明元素的结构组件分为3类,组件规定了抽象数据的语义,如表 1所示。XML Schema标准中还规范了数据类型定义的方法。内置几十种简单数据类型和多种引用数据类型,用于各种数据形式化语义描述的需要[4]。

简述数据通信的特点第7篇

[关键词] XML 电子商务 数据采掘

一、引言

家用计算机的普及、互联网及网络通信的迅猛发展已经将人类社会带入了网络经济时代。电子商务以其具有的成本、效率和创新优势,在商务活动中占据了一席之地,并不断地为越来越多的企业及个人所接受和采用。

在电子商务活动中,每个客户都会有自己的消费习惯,并对信得过的商品有一定的忠诚度,分析客户的需求信息和购物行为特征就成了商家必做的功课。基于网络技术的电子商务的发展,使得商家Web服务器上积累了大量的客户信息数据,这些数据为从事电子商务的商家提供了深入了解客户需求,改进经营现状和提供更好的服务的可能性。从网络上得到的大量信息数据中提取有用的信息和知识,为商家创造更多潜在的利润,在这样的商业背景下出现了电子商务Web环境中的数据采掘技术。目前,数字采掘技术作为电子商务领域的重要应用技术之一,为商业决策提供着强有力的支持和保证,已经逐渐成为电子商务的重要工具。

二、XML与数据采掘

XML是The Extensible Markup Language(可扩展标识语言)的简写。XML是一套用来标记文档的语法,它是由SGML发展而来,由W3C(World Wide Web Consortium万维网联盟)制定标准。其目标是统一未来跨平台数据交换的格式,并取代现有的HTML成为下一代Web页的标准。

XML是一种跨平台的语言,因规范简单、良好的可扩展性、传输内容与传输方式相隔离、具有自我描述能力等优异特性而在全世界范围内得到了越来越多的认可,成为众多商家与用户争相开发及采用的技术。

数据采掘又称数据挖掘,就是从大量的、不完全的未知数据中提取隐含在其中的对使用者的分析有用的信息和规律。数据采掘的主要任务是对数据进行描述和预测,描述数据的特性,对数据进行合并分组,并进行推断预测。

数据采掘应用于商业中,它是一种新的商业信息处理技术,主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其它模型化处理,从中提取辅助商业决策的关键性数据。

三、电子商务Web数据采掘技术

客户在互联网上漫游时,其浏览信息会被网站服务器自动收集并保存在访问日志、引用日志、日志中。通过对这些信息的有针对性的分析,可以揭示其中的关联关系、时序关系、被频繁访问的页面和路径等等。

1.数据动态采集与预处理

在开发Web使用记录采掘技术中,首先要对日志文件进行预处理数据,预处理的方法包括:数据清理、数据集成和转换、数据归约。数据清理可以去掉数据中的噪音,纠正不一致。数据集成将数据由多个源合并成一致的数据存储,如数据仓库或数据方。数据转换(如规范化)可以改进涉及距离度量的挖掘算法的精度和有效性。数据归约可以通过聚集、删除冗余特征或聚类等方法来压缩数据。数据预处理在数据采掘之前使用,以便改进数据的质量,提高其后的采掘过程的精度和性能,降低实际采掘所需要的时间。

2.Web数据采掘的基本方法

Web数据采掘(Web Data Mining),是数据采掘技术在Web环境下的应用,是从大量的Web文档集合和在站点内进行浏览的相关数据中发现潜在的、有用的模式或信息。对应于不同的Web数据,Web采掘分成三类:Web内容采掘、Web结构采掘和Web使用模式采掘。

Web内容采掘是指从Web上的文件内容及其描述信息中获取潜在的、有价值的知识或模式的过程。Web结构采掘就是对Web文档的结构进行采掘。对于给定的Web文档集合,应该能够通过算法发现他们之间连接情况的有用信息,文档之间的超连接反映文档之间的包含、引用或者从属关系。

Web使用模式采掘(Web Usage Mining)是对用户访问Web时在服务器方留下的访问记录进行采掘,通过采掘Web日志记录,分析和探究 Web日志记录中的规律,可以识别电子商务的潜在客户,增强对最终用户的网上信息服务的质量和交付,改进 Web 服务器系统的性能。其主要特点是对用户信息数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键性数据。

数据采掘通过数据采掘器进行,其主要功能是进行实际的采掘操作,从经过预处理的数据中发现模式和规则,借助OLAP引擎和相关算法实现动态更新。

在Web日志记录上可以进行数据采掘,用于找出关联模式,序列模式,和Web访问趋势等。 

3.Web数据采掘的主要技术

适用于电子商务数据采掘的主要技术有关联分析、序列模式分析、分类分析和聚类分析等。数据采掘器按照数据采掘的技术方法进行设计,每种采掘技术包含一些不同的具体实现算法,构成在功能上相互独立的子模块,存放在采掘算法库中。采掘算法库包括:

关联分析:应用已有关联规则算法侧重进行兴趣关联规则分析,找出或判断出客户对网站进行访问的相关关系,揭示数据间的内在联系,可据此调整站点的结构。

序列模式分析:采掘出数据的前后时间顺序关系,分析其是否存在一定的趋势,以预测未来的行为(访问,浏览等)。

分类分析:通过对数据的分析,给出数据间类的公共属性描述,为每个类别做出准确的描述或建立分析模型或采掘出分类规则,然后用这个分类规则对其它数据库中的记录进行分类。

聚类分析:分类分析的逆过程,按照“类内相似性最大,类间相似性最小”的原则,对数据进行类的聚集。通过分组聚类找出具有相似行为的客户,分析其共同特点,据此可向客户提供更为合适的服务。

路径分析:通过对日志文件中的数据进行分析,寻找到被访问最频繁的路径。

借助图形学和图像处理技术,将通过数据采掘获得的数据模式,以图表或可视性文本的形式呈现给使用者,以利于具有不同知识背景的使用者能够快速地从采掘结果中得到有效信息,从而尽快做出决策。

4.数据采掘面临的问题

利用数据采掘技术可以帮助获得决策所需的多种知识。但是随着数据采掘研究的深入,需要解决面临的问题:(1)数据预处理是一个比较烦琐的过程,每个数据库描述数据的格式几乎都是不同的;(2)不同来源数据的集成问题的存在,搜索多样的不兼容的数据库实际上也是不可能的;(3)客户端采用不同的应用程序,不同的系统间在编程语言、操作系统、网络协议等方面存在异构性,使系统的可移植性、可重用性和互操作性受到限制。

 随着结构化标记语言 XML 越来越被人们接受和采纳,将会有大量的 Web页面用 XML书写,可以促进不同 Web 站点间的信息交换,方便构造多层次 Web 信息库的信息提取。我们可以利用XML 语言的优异特性来解决数据采掘中面临的困难。

四、基于XML的电子商务Web数据采掘技术的应用

XML 是一种非常适于应用程序之间数据交换的格式,特别是松耦合的应用程序。XML 能够使不同来源的结构化的数据很容易地结合在一起,可以促进应用程序代码的重用,提高应用系统在面对需求和程序变化时的适应能力。

1.XML格式转换器

在源数据端,数据可以是多种格式的,XML仅仅起到中间数据表示和消息传输的作用。 在数据预处理前,将源数据直接进入一个XML格式转换器,转换器是由 XML格式分析模块、XML 格式转换模块、XML格式生成模块构成,其中XML格式分析模块对进入的数据进行分析,判断进入的数据格式。XML格式转换模块中存储了相应的格式转换程序,加入智能搜索引擎机制,用来把其他的数据格式转换为 XML格式,能够自动地进行格式匹配和格式转换,该模块是整个转换器的中枢。XML格式生成模块则把格式转换结果进行整理,经过 XML格式转换器处理过的数据为统一、清洁的数据,具有规范的格式,能够被用来进行高效的数据采掘。这样就大大简化了数据预处理操作。 

XML格式转换器的思想就是通过统一访问接口和不同访问实现异构数据源互连,数据源的异构性从而被屏蔽,可以改善应用的可移植性。 

2.在电子商务Web数据采掘中的应用

在电子商务活动中,XML简化了商家与消费者、商家与商家之间的数据交换过程。Web数据采掘是为了从数据中发现模式。XML具有很大的灵活性,为Web数据带来了结构化、智能化和互操作性,可使使用者共同享有标准的信息,也可根据他们商务应用程序的特定参数来采纳信息。 

3.客户购买行为分析

通过对客户购买行为的分析,可以发现客户的购买习惯、爱好模式和需求趋势,便于商家改进服务质量,设计出更好的网页服务界面和销售策略,动态地调整Web页面以满足客户的需要。提高满意度,保持忠诚度,并通过信息共享和优化商业流程有效地降低经营成本。

通过用户在网站上的浏览行为分析,发现潜在客户群体并对这类客户实施一定的策略,使他们尽快成为注册客户群体,增加网站经济和社会效益。

 4.优化Web站点链接结构

通过对日志的采掘,发现用户访问页面的相关性,从而对密切联系的网页之间增加链接,方便用户使用。利用路径分析技术判定在一个Web站点中最频繁的访问路径,可以考虑把重要的商品信息放在这些页面中,改进页面和网站结构的设计,增强对客户的吸引力。通过对Web日志的采掘,发现用户的期望位置,实现对Web站点结构的优化。

推荐系统采用聚类算法,按照客户的特点进行分类,根据客户的基本信息和购买经历、习惯、爱好等,进行个性化的商品推荐。聚类技术可以将具有相似特征、购买经历、购买习惯的客户分配到相同的组中。同类的客户具有一定的相似性,聚类产生后,就可以在推荐商品时借鉴这类客户的特点和爱好,推荐更合适这类客户特点的商品,取得客户更多好感、树立良好的商家形象的同时也对客户有了更进一步的了解。

简述数据通信的特点第8篇

23.达到目标 24.竞争方向竞争目标及其实现途径

25.外存储器输出设备 26.机器语言

27.以太网 28.分组汇总

29.结构化 30.多媒体

31.人员 32.简化处理之间的关系

33.高少 34.设计图表

35.客观性相对性

三、36.信息流是指除去物流、资金流和事务流的物理内容外的信息的流动过程。如生产计划、销售计划及各种各样的文件、统计、报表构成的信息处理过程。

37.系统软件是用来管理计算中央处理器、存储器、通信连接以及各种外部设备等所有硬件资源的程序,主要包括操作系统、语言处理程序、数据库管理系统和系统维护软件等。

38.从狭义上讲,电子商务是指在网上进行交易活动,包括通过Internet买卖产品和提供服务。电子商务系统是以电子数据处理、环球网络、数据交换等技术为基础,集订货、发货、运输、报关、保险、商检和银行结算为一体的综合商贸信息处理系统。从广义上讲,电子商务是指利用Internet、Intranet 、Extranet来解决商业交易问题,降低产、供、销成本问题,开拓新的市场,创造新的商机,通过采用最新网络技术手段,从而增加企业利润的所有商业活动。

39. IS09000系列的核心内容是质量保证标准,它是质量体系认证的依据。IS09000标准系列是一个大家族,它由五个部分组成:(1)质量术语标准;(2)质量保证标准;(3)质量管理标准;(4)质量管理和质量保证标准的选用和实施指南;(5)支持性技术标准。该标准重视评价的结果。

40.在每个模块完成单位测试后,需要按照系统设计要求进行组装测试。集成测试的主要目的是保证单元接口的完整性、一致性,人机界面及各种通信接口能否满足设计等要求。

四、41.简述虚拟组织的主要特点。

(1)通过计算机网络与中间商、承包商、合作伙伴保持联络。

(2)可以把每个伙伴的优势集中起来,设计、制造和销售的产品。

(3)具有很大的灵活性、机动性和反应的灵敏性。

(4)各公司之间很难确定边界。

(5)在虚拟组织的环境下,组织与管理上非常依赖信息技术。

42.简述DBMS的功能。

DBMS的功能可以大致划分为数据定义、数据操纵、数据库的运行管理、数据库的建立和维护等几方面。

(1)数据定义功能指用数据定义语言对数据库的结构进行描述。这些定义存储在数据字典中,是DBMS运行的基本依据。

(2)数据库操纵功能指用数据操纵语言实现用户对数据库中数据的基本操纵,包括对数据库数据的检索、插入、更新和删除等。

(3)数据库运行管理包括多用户环境下的事务管理和自动恢复、并发控制和死锁检测、安全性检查和存取控制、完整性检查和执行、运行日志的组织管理等。这些功能保证了数据库系统的正常运行。

(4)数据组织、存储和管理功能包括字典、用户数据、存取路径等。其主要目标是要确定以何种文件结构和存取方式组织这些数据,如何实现数据之间的联系,以提高存储空间利用率和存取效率。

(5)数据库的建立和维护功能包括数据库的初始建立、数据的转换、数据库的转储和恢复、数据库的重组织和重构造以及性能检测分析等功能。

43.简述CASE方法的主要特点。

(1)既支持自顶向下的结构化开发方法,又支持自底向上的原型化开发方法,更加实用。

(2)解决了由现实世界到软件系统的直接映射问题,强有力地支持信息系统开发的全过程。

(3)简化了软件管理维护,使开发者从繁杂的分析设计图表和编程工作中解放出来。

(4)自动生成文档和程序代码,使系统产生了统一的标准化文档。

(5)着重于分析与设计,具有设计可重用性,使软件开发的速度加快而且功能进一步完善。

44.简述系统调查的主要内容。

系统调查是对企业和组织现行系统及其周围环境现状的了解,从而掌握与系统开发有关的基本情况,确定信息需求。一般而言,系统调查的主要内容包括以下一些方面:

(1)现有系统的基本情况。

(2)管理业务。

(3)信息需求、处理手段和信息资源。

(4)信息化现状。

45.简述代码设计应遵循的基本原则。

代码设计应遵循的基本原则有:

(1)惟一性。

(2)标准化。

(3)合理性。

(4)可扩充性。

(5)适用性。