首页 优秀范文 信息计量学论文

信息计量学论文赏析八篇

时间:2023-03-23 15:16:32

信息计量学论文

信息计量学论文第1篇

关键词:学位论文 网上评审系统 应用研究

中图分类号:G643 文献标识码:A 文章编号:1672-3791(2013)02(c)-0027-01

1 现行评审方式存在的问题

近年来,我校研究生授予学位人数逐年递增,其中2012年授予学位人数比2008年增加了75.7%,增加了近一千人,论文送审的工作量也越来越大,传统论文送审方式也暴露出了一些问题。

1.1 周期长

论文寄出和寄回的时间需要一周的时间,对方学校需要整理和商定合适的平时专家,评审专家论文评审,对方学校汇总评审结果等需要一定的时间保障,根据统计,传统的论文评审周期要一个月左右。

1.2 费用高

论文的打印装订费用、邮寄费用随着论文送审数量的增多,也越来越高,随着毕业生基数的递增,这一费用势必逐年加大,给研究生管理部门带来了较大的经济负担。

1.3 效率低

传统的论文评审方式主要依靠工作人员的手工操作:论文的编号、寄送、评阅书的整理统计,学位评审管理人员需进行大量的重复简单劳动,工作效率低。

2 系统设计与结构功能

2.1 系统设计原则

(1)用户分级管理。

研究生上评审系统用户分管理员和评审专家、学生三级:①管理员用户可以将本年度申请学位研究生的基本信息和论文电子版上传、审核、修改评审专家基本信息;可以查阅专家提交到系统上的评审结果;打印论文评阅书。②评审专家用户可以管理本人基本信息,对系统里的评审论文进行下载、评阅,最后将最终的评审结果上传。③学生用户可以上传评审论文(pdf格式),查询评审结果,下载打印论文评议书[1]。

(2)系统操作简单。

为方便各级用户使用,系统在设计上始终强调操作简单明了,各个操作界面都设计的非常人性化,让用户对各种操作一目了然,如在评审专家界面,在点击“提交评审结果”后,会提醒评审专家,一旦确认后,将不能再修改评审意见,有效的防止了有的专家误点击。

2.2 系统结构功能

我校设计研发的研究生学位上评审系统具有四项主要功能,即论文基础数据管理、评审标准管理、评审专家管理和论文管理。

(1)论文基础数据管理。

本模块的主要功能是将学生信息安排批次进行管理,可以批量或单个将学生信息导入到系统内,系统根据学位类别进行分类,管理员可以通过本模块对学生信息进行修改、删除等操作。

①批次管理。

批次管理用来区分每年申请学位的研究生,通过批次管理可以设置网上论文评阅的批次,以便于论文评审信息归档和统计。

②学位类型管理。

该系统针对不同的学位类型进行分类管理,在学生学位类型管理界面,选择查询条件将会查询符合条件的学位类型信息。“添加学位类型“链接,将会显示添加学位类型界面。通过点击“设置为有效“或“设置为无效“链接,将会改变对应学位类型的状态。可以修改、删除对应学位类型的信息。

③导入学生信息。

该系统使用前,需要将学生的相关信息导入系统,为方便快速导入学生信息设置了“批量导入学生信息“功能,该功能提供批量上传论文学生信息的excel模板。按照模板要求填写完上传信息,就可以实现批量学生信息的导入,随着研究生论文送审数量的增多,这一功能显得尤为重要,为了方便个别增加的学生信息的导入,系统也设置了“添加学生信息”功能,方便了管理管理。

该功能可以对导入系统的学生信息进行查询、修改学生信息“修改密码“将会显示对应学生的修改密码界面,进行密码的修改。“删除“将会删除对应学生的信息,如果该学生已经存在论文信息,那么删除失败。为方便删除学生信息,还设置了“批量删除”功能,将会对所选择的学生信息进行批量删除,管理员可以方便的进行编辑学生信息。

(2)评审标准管理。

不同学位类别的评审标准不同,同时根据管理规定的变化,评审标准也在不断的修改,该评审系统通过评审标准管理这一功能,可以方便的增加、删除和编辑各个学位类别的评审标准,不同学位类别的评审标准将会在论文对应学位类别的评阅书上体现。

(3)评审专家管理。

该功能主要用于对评审专家进行信息导入、编辑、账号分配。为方便快速导入评审专家信息设置了“批量导入评审专家信息“功能,该功能提供批量上传评审专家信息的excel模板。按照模板要求填写完上传信息,就可以实现批量评审专家信息的导入,为了方便个别增加的评审专家信息的导入,系统也设置了“添加评审专家信息”功能,方便了管理管理。系统对专家的信息可以进行修改、删除等操作。

(4)论文管理。

主要提供了上传/查看论文、审核论文信息、统计评审专家信息、统计评审结果信息。

①论文上传管理。

该功能将评审论文电子版上传到评审系统中,为了论文保密,系统要求提交pdf格式的电子版。对于上传的论文电子版,需要经过管理审核后,才能传到系统上,这样保证了研究生上传的论文符合学校的送审要求。

②评审结果统计。

该功能将论文评审结果进行统计,按照查询条件进行评审结果信息的查询,并导出excel评审结果统计库。通过点击“统计评审专家信息“链接,将会显示统计评审专家信息界面,可以选择查询条件进行评审专家信息的查询,并导出excel或专家编码信息。

3 研究生学位网上评审系统应用实践

通过我校使用研究生网上论文评审系统的情况,极大方便了老师和研究生,受到了一致好评,该系统有如下特点。

(1)缩短了评审周期。该系统的操作是在网上进行,评审专家已提交评审结果,学校管理员就可以得到评审结果,大大缩短了评审周期,评审周期的缩短,可以让研究生有更多的时间进行论文修改。

(2)降低了经济成本。系统采用无纸化办公,评审的论文通过系统导入电子版即可,节省了论文打印装订和论文邮寄的费用。

(3)提高了管理效率。运用研究生上评审系统,可将论文评审工作相关的信息收集、校对、整理、传输由传统的手工作业方式转变为基于网络技术的网上评审、审核和办公自动化模式,将学位评审管理人员从大量的重复简单劳动中解脱出来,大大减少了学位论文评审工作所耗费的时间,提高了工作效率。

4 结语

研究生学位上评审系统,改变了传统论文评审方式,方便了评审专家的使用,缩短了论文评审周期,节省了评审费用,且能够保证评审信息信息快速准确,将研究生学位论文评审工作变为简单规范,提高了研究生学位论文评审工作的质量和效率。

信息计量学论文第2篇

摘 要:文章以CNKI所收录的文献为依据,利用文献计量方法,对我国中小学图

>> 我国中小学图书馆研究:基于文献计量学的统计分析 2006年―2015年我国中小学图书馆研究文献计量分析 基于共词分析的我国文献计量学研究主题分析 基于文献计量学的梨研究动态 档案管理体制研究的文献计量统计分析 基于文献计量学的我国化学学科半衰期分析 基于文献计量学的世界苹果研究态势分析 基于文献计量学的栀子研究领域全景分析 基于文献计量学的图书馆资源建设 我国中小学图书馆的发展现状与对策 我国中小学图书馆建设的问题与对策 统计分析法与文献计量法在档案学研究中的应用分析 《科技与经济》文献计量与研究热点统计分析 基于文献管理软件NoteExpress的文献计量学研究的探讨 基于文献计量学的我国心理学学科半衰期分析 基于文献计量学分析的我国酸枣研究现状 基于文献计量学的国内知识竞争力研究现状 基于文献计量学的管理学学科半衰期研究 基于文献计量学的无人驾驶汽车技术研究 浅谈我国中小学校图书馆员应具备的素质 常见问题解答 当前所在位置:l.

[2] 邱均平.信息计量学(二)第二讲 文献信息增长规律及应用[J].情报理论与实践,2000(2):153-157.

[3] 于斌斌.学校图书馆利用对中学生学业表现的影响研究[D].天津:南开大学,2012:7.

[4] 邱均平.信息计量学(三)第三讲 文献信息老化规律及应用[J].情报理论与实践,2000(3):237-240,192.

[5] 吕红,马海群.近8年我国信息构建论文的文献计量统计分析与评价[J].情报科学,2010(10):1526-1531.

[6] 邱均平.信息计量学(四)第四讲 文献信息离散分布规律[J].情报理论与实践,2000(4):315-320.

[7] 全浮.中学图书馆建设现状调查:以烟台市为例[D].烟台:鲁东大学,2013:3.

[8] 邱均平.信息计量学(五)第五讲 文献信息词频分布规律:齐普夫定律[J].情报理论与实践,2000(5):396-400.

[9] 杨海花.近5年我国中小学图书馆理论研究综述[J].图书馆学刊,2012(6):137-139.

信息计量学论文第3篇

关键词:维吾尔文;信息熵;多余度;语料库;统计

中图分类号:TP391.1 文献标识码:A文字编码:1009-3044(2008)04-1014-02

Statistical Estimation for Entropy of Uyghur Script

SAMAT Mamtimin1,2

(munication University of China, Beijing, 100024; 2.Xinjiang University, Urumqi 830046, China)

Abstract: In information theory, entropy is a measure of the uncertainty associated with a random variable. Estimating the entropy of natural language is a fundamentally important problem in natural language information processing. In the experiment, the entropy and redundancy of Uyghur script are estimated by statistic results of more than 2.5 million words in the Uyghur Corpus. The result shows that the entropy and redundancy of Uyghur script are 4.387bit and 13% respectively which very similar to that of other alphabetical languages.

Key words: Uyghur script; entropy; redundancy; corpus; statistics

1 引言

自然语言字符的熵(entropy)表示该语言每一个字符所包含平均信息量的大小,是语言符号不确定性程度的一种度量。从字符编码的角度来看,语言符号的熵可以被认为是对该语言字符编码所需的最小平均码长。通过计算某种语言的字符熵可以找出该语言符号系统的信息量和多余度之间的关系,以便能用最小的成本和消耗来实现最高效率的数据储存、管理和传递。因此,正确地估计信息熵的值对语言信息处理具有重要意义。利用熵的概念,可以从理论上研究信息的计量、传递、变换、存储。此外,熵在控制论、概率论、数论、天体物理、生命科学等领域也都有一定的应用。

到目前为止,在国外很多学者研究不同语言的信息熵,计算出了这些语言的信息熵。各种语言字母的熵:法文3.98比特;西班牙文4.01比特;英文4.03比特;俄文4.35比特;德文4.10比特;罗马尼亚文4.12比特。在国内最早冯志伟先生用了将近10年的时间,进行手工查频,从小到大地逐步扩大统计的规模,建立了6个不同容量的汉字频度表,最后根据这些不同的汉字频度表,逐步地扩大汉字的容量,终于在70年代末期首次计算出了在不考虑上下文影响的前提下汉字信息熵的值是9.65比特,1995年,冯志伟又进一步测定了在充分考虑汉字上下文的影响时包含在一个汉字中的熵,这个熵叫做“极限熵”。他测得,汉字的极限熵平均为4.0462比特。黄萱菁等在4年的《人民日报》语料的基础上,所求得的零阶熵、一阶熵、二阶熵分别为9.62,6.18和4.89比特。刘源给出汉字熵的计算结果是9.71比特。孙帆等基于词的语言模型估计方法比基于字的直接计算方法得到了汉字熵的更为精确的估计,其熵值为5.31比特。

由于维吾尔文的特殊性决定了至今未有人计算出维吾尔文的信息熵。近年来由于计算机可读文本的大量出现,以及计算能力的不断提高,使得在更大的语料规模上,更为精确地用统计方法计算维吾尔文的信息熵成为可能。本文将在大规模文本的基础上,运用概率的估计方法来计算维吾尔文字符的信息熵和多余度。

2 基本概念

2.1 熵

熵(entropy)是1865年作为热力学的一个重要概念引入的。信息理论中的熵是从不同的观点引入的,两者间虽有相同的数学形式,但它们并没有什么直接的联系。在信息论中,熵可用作某事件不确定度的量度。信息量越大,体系结构越规则,功能越完善,熵就越小。利用熵的概念,可以从理论上研究信息的计量、传递、变换、存储。

熵的定义:如果一个随机变量x共有n种取值,概率分别为P0, P1, P2,.....,Pn,则其熵为H(x) =f(P0, P1, P2......,Pn) =-∑Pnlog2Pn

2.2 信息熵

信息熵也简称为熵(entropy),是信息论中用于度量信息量的一个概念。一个系统越是有序,信息熵就越低;反之,一个系统越是混乱,信息熵就越高。所以,信息熵也可以说是系统有序化程度的一个度量。信息熵的基本作用就是消除人们对事物的不确定性,变量的不确定性越大,熵也就越大,把它搞清楚所需要的信息量也就越大。

根据人们的实践经验,一个事件给予人们的信息量多少,与这一事件发生的概率(可能性)大小有关。一个小概率事件的发生,给予人们的信息量就很多。相反,一个大概率事件的出现,给人们的信息量就很少。20世纪40年代末,香农(C.E.Shannon)在著作《通信的数学理论》中提出,信息论中的熵是信息不确定性的度量单位。他用公式(1)来表示不确定性程度:

H=Log2P (1)

不确定性的值与概率P的对数值有关,其单位则由对数的底决定,当以2为底时,单位为比特(bit),两个等概率的事件实验结果的不确定性就是1比特。将其推广,就可以用信息熵来表示一个各事件出现概率已知系统的不确定性。

H=∑-PiLog2Pi(2)

H为信息熵,Pi表示系统中事件i出现的概率,因此有:Pi

语言的熵是数学方法和语言文字学的结合,语言的熵反映语言中每个字符的平均信息量。同样,用公式(2)可以计算某种语言符号系统的信息量。但是,我们在测定这个熵值的时候,只是把文本看作不等概率独立链的熵,测定时只需要考虑语言符号出现概率的不同,不必考虑语言符号出现概率之间的相互影响。因此,用这个公式求到的数值是静态平均信息熵。根据信息论的基本原理,这个熵也可以叫做“零阶熵”。

2.3 多余度(redundancy)

由上可知,有n个符号的文字,每个字符最大的信息量(最大熵)Hmax=Log2(n)(即-Log2 (1/n)),而有不相等概率时,其平均信息量(平均熵)H=-∑Pnlog2Pn总小于最大信息量Hmax。例如英文的最大信息量等于4.7,就要用5个二进制数码来编码和传输。但它的平均信息量近于4.03,表示实际上可用比4个多一点点的二进制位就可以了。说明这一部分熵是多余的,被浪费了。信息论研究这样的多余度,多余度的计算公式:

R=(1-H/Hmax)×100=(Hmax-H)/ Hmax×100 (3)

从多余度的计算公式可知,多余度随最大熵Hmax的增大而减小。而从最大熵的计算公式Hmax=S(n)可知,最大熵则随字符个数的增加而增大。

3 维吾尔文和语料介绍

3.1 维吾尔文

维吾尔语(简称维语)属于阿尔泰语系突厥语族,是维吾尔族所说的语言。维吾尔族在历史上使用过突厥文、回鹘文、察合台文。现在中国维吾尔族使用的维吾尔文是在晚期察合台文基础上形成的以阿拉伯字母为基础的拼音文字,是从右向左书写的文字。

现行维吾尔文有32个字母,其中有8个元音字母和24个辅音字母,每个字母按照出现的位置而具有单独、前、中、后等几种不同的形式。词与词之间用空格来分开写。

3.2 语料介绍

本文所使用的语料来源于新疆大学在2003-2006年期间建立的现代维吾尔语语料库。为了保证语料的平衡和代表性,我们按照一定的比例从语料库中抽取了不同领域的2558810词次规模的语料。这样规模的语料基本包含了各种语体和体裁的文本,其中,文学类30%,学术类27%,新闻公文等30%,综合类23%。

4 维吾尔文信息熵和多余度的计算

语言通常都是由一组符号的集合构成的信息源,如汉语、英语、日语、维吾尔语等。在书面语中,汉语采用的符号是汉字;日语采用的符号是汉字和拼音文字;英语和维吾尔语等采用拼音文字的符号集,也就是它们的字母表(还可以加上标点符号和空格)。而且这些字母在各种文本中的出现也有一定的规律性。我们对各个维吾尔文字母在上述语料中出现的频率作了统计工作,统计结果如表1所示。

如果我们假定这些字母是独立出现的,就可以利用计算信息熵的公式(2)计算出维吾尔文33个符号(32个字母和1个空格)携带的平均信息量。

根据表1的概率,代入计算信息熵的公式:H=∑-PiLog2P ,其中 i=1~33

得到 H=∑-PiLog2Pi≈4.387 (平均信息熵)

已知Hmax= Log233≈5.044,根据多余度公式:

R=(1-H/ Hmax)×100, 得到R≈0.13×100≈13% (多余度)

各民族的语言都有“多余度”,我们并不能因此就认为“多余度”是多余的。恰恰相反这种“多余度”是用语言传递信息时必不可少的。没有多余度的语言实际上是无法理解的。

应该注意的是,我们在计算这个熵值的时候,仅只考虑到了字符在文本中出现概率的差异,而完全没有考虑文本中汉字出现概率之间的相互影响。所以我们计算得到的是维吾尔文字母的静态平均信息熵。事实上,语言符号的出现概率是相关的,是彼此相互影响的。在充分考虑上下文关系的情况下,达到的最小条件信息量,称为极限熵。根据极限熵,我们可以进一步研究使传输更快的编码,即不是对单个文字符号,而是对文字进行编码,就可使平均码长减小,逼近极限熵。

5 结论

综上所述,本文在大规模语料的基础上,采用统计的方法对维吾尔文的信息熵和多余度进行估计和计算,在250多万词的语料规模下,所求得的零阶熵约4.387比特,多余度为13%。得到的值已经是相当接近了其它拼音文字的信息熵。可以看出,维吾尔文字信息量小,今后在处理维吾尔文时完全可以使维吾尔文信息管理和传递成本降低和效率提高,进一步说明了维吾尔文同样是个高效率的文字方式。

当然,这里所求得的熵仍然只是维吾尔文信息熵的一个静态平均值,结果也不很精确。我们希望将来有更巧妙的方法,以便算出更加精确的维吾尔文字母的平均信息熵和极限熵的值。

参考文献:

[1] 孙帆, 孙茂松, 等. 基于统计的汉字极限熵估测[A]. 中文信息处理前沿进展――中国中文信息学会二十五周年学术会议论文集[C]. 2006. 542-551.

[2] 冯志伟. 关于汉字的熵和极限熵致编辑部的一封信[J].中文信息学报,1998,12(1):63-64.

[3] 冯志伟. 汉字的熵[J]. 语文建设; 1984(04): 40-42.

[4] 冯志伟. 汉字的极限熵[J]. 中文信息,1996(2):53-56.

[5] 黄萱菁, 吴立德, 郭以昆, 刘秉伟, 等. 现代汉语熵的计算及语言模型中稀疏事件的概率估计[J]. 电子学报, 2000,(08):110-112.

[6] 那日松,淑琴. 蒙古文信息熵和拉丁转写研究[A].中国计算技术与语言问题研究――第七届中文信息处理国际会议论文集[C], 2007:782-785.

[7] D. A. Huffman. A Method for the Construction of Minimum Redundancy Codes [A].Proc.of IRE[C]. 1952, 40(10):1098-1101.

信息计量学论文第4篇

【摘 要 题】信息资源管理

【关 键 词】知识管理/知识计量/知识评价

知识的计量与评价包括知识量的评价、知识质的评价和知识价值的评价3个方面。目前国内外在间接知识计量与评价、知识创新评价等方面取得了一定的进展,如在文献计量、科学计量、信息计量、网络计量、经济计量的理论、方法、技术与应用等方面都获得了不同程度的突破,促进了知识计量与评价的发展,为直接进行知识计量与评价打下了坚实的基础。但是由于知识的载体依附性、知识计量单元的不确定性、知识内容的不可分割性、知识价值的环境与对象的依存性,目前直接对知识内容本身进行计量与评价还有很大的难度,而核心的问题就是知识内容计量与评价单元的确定。

当前已有的知识计量与评价单元都是以知识的载体——文献为基本计量与评价单元,都是间接的知识计量与评价,离对知识内容本身进行直接计量与评价还有很大的差距。尽管有研究表明知识的直接计量与评价是可以实现的,并且提出了“知识元”的概念与模型[1-8],但其可操作性还没有得到有效检验。

自从1996年联合国经济合作与发展组织(OECD)提出了题为《以知识为基础的经济》(Knowledge-based Economy)的年度报告后,“知识经济”一词随即在全球范围内变得炙手可热,有关知识经济、知识资产、知识产品、知识管理和知识创新的研究风起云涌,此起彼伏。知识经济、知识管理和知识创新的基础是对知识本身的测度、计量与评价,包括知识量与知识价值的测度、计量与评价。知识的测度、计量与评价研究是一项基础性的研究,既包括知识经济和知识产业测度、计量与评价,也包括对知识的物理测度(载体)与价值测度(经济贡献)的研究[9]。因此,作为知识创新活动评价的基础,知识计量与评价开始逐渐引起了人们的关注。

近年来,人们在科学计量学、文献计量学、信息计量学以及经济计量学(国内又称数量经济学)等方面的研究都直接或间接地涉及到对知识(信息)的计量研究。如科学计量学科研绩效的评价(从本质上说,科学计量学是对科学知识的数量与质量进行测度,因此,包含知识计量学的内容),文献计量学对核心期刊的测定与评价(文献是知识的载体,对文献的计量也间接地反映了对知识的测度与计量),信息计量学对网络信息流量的计量与评价,特别是近几年来经济计量学(一般说来,经济计量学侧重于经济过程中投入与产出的价值测度,但经济过程又包含着知识的投入、流动、应用和转化等过程,因此经济计量学也同知识计量有相通之处)对知识经济理论的探讨都取得了重大研究成果[10]。

对知识本身及其在经济中所起的作用进行研究,包括对知识在经济系统中的生产、传播、扩散等现象进行深入的研究;测定产品、企业、部门中的知识含量;知识的质量、价值和价格的评估;知识存量与流量的确定,以及确定因特网上知识传播带来的经济效益等,都涉及到一个问题,即需要从知识这一角度进行量化研究,包括编码类知识和经验类知识。

因此,对知识进行计量和评价是知识经济理论中的核心问题,是知识经济发展的必然要求,也是文献计量学和科学计量学、信息计量学和情报计量学、网络计量学、经济计量学共同关注的焦点问题。国外科学界、学术界和企业界很早就开始关注对知识本身及其价值的测度,并形成了较为完善的理论和方法体系[11-14]。而我国则注重从整体上和宏观上来测度科学知识体系(文献计量学和科学计量学以科学知识的载体为基础对科学活动的成果进行计量,即间接的知识计量)及其对经济发展的贡献(知识经济测度和经济计量学)[9]。有学者提倡建立“知识管理学”来囊括关于知识获取、表达、管理、计量等方面的研究。甚至有学者直接提出要建立“知识计量学”这样一门学科来研究知识内容本身的计量与评价问题[15]。这些都明确地反映了知识社会和知识时代对知识进行直接管理的客观要求。

然而,知识管理、知识计量都难以回避一个最核心、最关键的问题,就是确定知识单元和知识计量单元的问题。只有明确了知识单元和知识计量单元,才使得知识的管理与计量具有可操作性。是继续延用原有的知识载体计量与处理单元(知识的物理计量单元),还是寻求新的知识计量与处理单元,是摆在知识管理界和学术界的难题。本文从知识计量单元的演变及其关系出发,并对不同类型的知识计量单元进行了比较与评价,期望能对知识内容的直接管理与计量有所裨益。

1 知识计量单元的内涵与类型

知识计量单元是进行知识管理、计量与评价的基础,知识管理、计量与评价就是要通过对确定有效的知识计量单元进行处理以便对知识进行独立、自由、有效识别、处理与组合,达到知识服务、知识发现和知识创新的目的。知识计量单元是指在知识管理、计量与评价中可以对知识进行独立、自由、有效识别、处理与组合的基本知识单位。

人类对知识的处理经过了以篇为单位的文献(分离)处理时期,正在进行以数据库为单位的信息(集成)处理时期,将要进入以知识元为单位的知识(知识元链接)处理时代[1]。

按照划分标准的不同,知识计量单元可以进行如下划分:

1)按知识计量对象划分:可分为文献计量单元、信息计量单元和知识计量单元;也可分为知识载体计量单元和知识本体计量单元,或知识物理计量单元和知识内容计量单元。

2)按知识计量方式划分:分为直接计量单元(如知识元等知识内容计量单元)和间接计量单元(如文献计量单元)。

3)按知识计量的层次划分:分为宏观层次的知识计量单元和微观层次的知识计量单元。

4)按知识计量的学科领域划分:有文献计量单元、科学计量单元、知识计量单元、经济计量单元。文献计量单元有外形特征计量单元和内容特征计量单元;知识计量单元有知识元和知识单元;经济计量单元有投入、产出、效率、效益等计量单元。

5)按知识计量的内容划分:有知识的物理计量单元 (包括知识的数量和质量)和知识的价值计量单元(知识的经济价值和社会价值)。

6)按知识计量的载体类型划分:有纸质文献计量单元(主要是文本,如册、本、卷、期、篇、字数等)、电子文献计量单元(如磁盘、光盘、网站、网页、链接数、节点数、点击数、下载量、浏览数、比特数、字节数等)、缩微文献计量单元(如卷、张、版等)、声像文献计量单元(如曲、首、帧、盘、盒、套、卷等)。

尽管知识计量单元类型多样,但使用最广泛、最频繁的还是文献计量单元、信息计量单元和知识计量单元3种。

2 知识计量单元的演变过程

知识计量单元是指在知识管理中可以对关联知识进行独立、自由、有效识别、处理与组织的基本单元。由于人类社会的知识管理活动大致经历了3个重要的发展阶段,即以文献(知识的载体)为基本单元的知识管理时期、以信息(知识的某些属性特征,如主题概念、关键词概念、数据等)为基本单元的知识管理时期和以知识本体 (知识内容本身)为基本单元的知识管理时期。目前,随着知识经济和知识管理热潮的兴起,人们开始把知识管理的目光从文献单元和信息单元的管理推进到知识单元的管理上,并期望能实现从对知识载体和知识属性特征的管理过渡到对知识内容本身的管理。即从间接知识管理上升到直接知识管理。因此,知识计量单元的发展也经历了从文献计量单元到信息计量单元,既而到知识计量单元的演变过程。 国内外的许多有识之士,早就对这种以文献为单元的管理方法提出了质疑,而把目标定位在知识管理上。早在 20世纪70年代后期,有专家就指出,知识的控制单位将从文献深化到文献中的数据、公式、事实、结论等最小的独立的“知识元”。20世纪80年代初,英国著名情报学家布鲁克斯提出了绘制“认知地图”的任务。美国情报科学研究所研究员斯摩尔(H. Small)提出了用思想“网络图”揭示重大发现,用学术思想“网络图”来表述重大发现的来龙去脉。知识的控制单位一旦实现由文献深化到“知识元”,大量文献中所包含的“知识元”及相关信息间的链接,将产生极大的知识增值。从而大大推进人类对知识的利用,促进对新知识的创造,从而也将推动知识资源业的重大发展,这正是我们现在应该做也可能做的工作[2]。

3 文献计量单元及其评价

文献计量单元,即文献知识单元,是指以知识的载体——文献,作为知识管理与计量的基本处理单元,知识管理与计量的全过程都是以文献计量单元为基础和核心的。文献计量单元,也称为知识的物理计量单位,主要指图书的册、本、卷、套,论文的页、篇、期、卷,专利和标准的项、件,磁盘、光盘的张、盒或存储设备的个数,缩微胶片的卷、张,还有文献的字数、行数、页数、篇幅数等物理载体计量单位,有时尽管也涉及篇幅和词汇等计量单位,但目的是为了更好地处理和定位需要管理的目标文献,主要是文本单元和以文本为核心的其他相关单元,如流通量、借阅量、发文量、引文量等。

文献是指记录知识的一切载体。随着人类社会的快速发展,特别是科学技术的迅猛发展,一方面文献的类型不断丰富和完善;另一方面对文献进行有效处理和管理的方法、技术与手段也日益先进和完善。不可否认,对文献计量单元的有效管理、计量与评价,在过去很长一段时间内是人类实现对知识进行管理的最有效、最科学、最有影响的管理方式,并且形成了一整套完善的理论、方法和技术,如文献计量学、科学计量学、SCI和EI等文献数据库。直到今天,尽管我们在信息管理、知识管理等诸多领域取得了突破性进展,但在许多领域我们仍不能摆脱文献管理理论、方法和技术的影响,以文献计量单元为基本的知识管理单元仍然是最有效、最易实现和最易控制的手段和方法。

目前,信息管理和知识管理领域的许多重大突破还是建立在过去文献管理系统和文献管理数据库的基础上,是在文献计量单元管理基础上的改进和创新。例如增加和改进文献管理系统和文献数据库的信息管理(增加文献外形信息特征和内容信息特征项)与知识管理(增加基于引文的知识网络和知识关联网络等)功能,这些无非都是为了更好地实现对文献计量单元的处理和管理。

当然,文献计量单元之间并不是孤立和毫无联系的,而是通过各种文献计量单元、信息计量单元和知识计量单元之间的关系形成了各种复杂的知识网络关系。例如,文献计量单元之间可以通过主题词、关键词、分类号和引文等建立联系。

因此,我们研究文献计量单元的管理,并不只是关注单个独立的文献计量单元,还要研究和分析文献计量单元之间通过各种方式建立起来的关系链和关系网络(如学科关系、引文链、引文网络、共引和引文耦合等)。因而,文献计量学、科学计量学不仅研究知识载体的数量、质量和价值等特征,还要研究知识载体之间存在的各种关系 (包括关系链和关系网络),并由此产生的各种数量特征与数量关系。文献计量单元是信息计量单元与知识计量单元的基础和来源。

人类生产和创造的知识最终都以不同的形式存储在不同类型的文献中,尽管新的文献类型仍有可能出现,但已有的文献内容格式都是以纸质型文献内容格式的方式存在 (如电子文献和网络信息仍然是以纸质文献格式表现),因为长期以来人们已经习惯并接受这种

比较完善的知识表达和生产方式。因此,对知识单元和信息单元的处理离不开对文献单元的处理。所以知识的控制单位长期以来一直停留在文献这一级上,而人们对知识的需求一般不是以文献为单位的。

现有的以文献——知识的物理计量单元为基础的知识组织与生产方式(如目录、题录、索引、文摘、文献数据库等)有两大缺陷[3]:其一,组织和管理的是知识载体——文献单元,而不是知识本身,尽管通过文献单元能反映和揭示知识的某些特征,但这只是表面的、粗糙的和不精确的特征,较难深入地揭示知识的内在特征与联系;其二,检出的文献只含已有的知识,未能揭示其间的内在联系,不能为产生新知识提供营养土壤。由于文献计量单元和知识计量单元在处理对象上的差异,因此它们在反映知识的关系程度上相距甚远。

信息资源虽可以通过标题、关键词、作者、内容分类特征等“元数据”进行关联检索,甚至可以进行简单的全文任意词检索,然而对于“求知者”所要解决的问题来说,并不能迅速而准确地提供全面、系统、针对性的知识信息。加之这些数据库在结构、信息加工标准和质量上的差异,使得数据库之间的信息关联、内容关联更加难以实现。在这个意义上,在现有数字化图书馆建设目标下开发的知识信息资源,本质上还只是一本一本“堆积”起来的数字化图书、期刊。除了信息量大、检索查询速度快等方便之外,数字化图书馆使人们感受到的获取信息的手段与方式,依然类似于传统图书馆的“计算机书目检索”与“开架借书”,与在现代信息技术水平之下人们追求的信息资源共享所应当达到的境界还相距甚远。

以文献计量单元为基础的知识计量与评价,主要是通过对文献信息流的分布规律(如文献量的时间和空间分布)、文献主题分布(如词频统计分析、内容分析、结构分析、关联分析等)和引文分析(如被引量和被引率等),用文献的数量与质量来间接反映知识量和知识的价值。但由于文献量与知识量并不等同,文献计量单元和知识计量单元是两个完全不同的计量单位,所以很难用文献量来准确反映知识量。

同时,也因为文献的价值主要在学术价值、科学价值、精神价值和社会价值上,无法用文献本身的价值来准确衡量文献中知识的综合价值(学术价值、科学价值、精神价值、社会价值和经济价值等)。因为文献是有形的,文献的价值可以通过被使用次数(如被借阅次数、被引用次数)等文献计量指标较为准确地评价,而知识是无形的,也是无价的,其表现形式多种多样,作用的结果也是综合性的,目前还没有科学的方法和指标对知识量和知识的价值进行直接计量与评价。尽管如此,文献计量与评价、科学计量与评价同知识计量与评价在一定程度上是同步的,目前还只能通过间接方式来对知识进行计量与评价,文献计量与科学计量方法还是较为有效的用来评价知识量与知识价值的方法之一。

4 信息计量单元及其评价

随着计算机技术和网络技术的快速发展与广泛应用,电子信息资源和网络信息资源数量迅速增长,信息(Information)作为一个影响深远的重要概念在全球范围兴起,对各个学科领域的发展都造成了巨大的冲击。因此,围绕着信息的计量与管理产生了新的知识计量单元,即信息计量单元,也称信息知识单元(在我国还有情报知识单元之称),它是指以文献知识的某些属性特征(包括文献的外形特征信息和内容特征信息)作为知识计量与管理的基本单元。我们通常把一部文献所包含的完整信息称为文献信息,文献信息主要包括文献外形特征信息(如题名、著者、出版社、出版时间、出版地和相关载体特征等)和内容特征信息(如摘要、提要、主题词、关键词、标题、文献中的字、词、句、段、篇幅、参考文献等)。信息计量单元的处理通常用信息熵,词频数、篇幅量,数据、信息和情报的比特量、字节量,图像、声音的帧、幅等来表示。

信息计量单元既反映了文献计量单元的基本特征,也是知识的重要来源。信息计量单元往往通过提炼、加工、组合、转换等过程即可形成知识计量单元。可以说,信息计量单元是联结文献计量单元和知识计量单元的一座桥梁。但信息计量单元既没有克服文献计量单元本身固有的缺陷,也没有实现对信息、知识内容本身计量与管理的目标,因而信息计量单元只是从文献计量单元到知识计量单元发展的一个过渡性的计量单元。传统的信息服务只提供文献的信息或作为知识素材的文献,并没有揭示文献中的知识链。人们获取的只是文献数据信息本身,并不是知识。比如人们看到了题录摘要,从中未必可以看到知识。即使读完了一次文献,也许仍不能准确了解其中的知识所在。

随着现代信息技术的发展与应用,以及信息经济的产生,信息、情报作为一种重要的战略资源引起了人们的广泛关注,信息计量学、情报计量学随即兴起。但信息、情报的直接计量与评价是一件十分困难的事情,因为在计量和评价中如果无法有效确定信息单元和情报单元,就无法实现对信息、情报进行直接计量与评价,也只能通过间接方式进行。 特别值得注意的是,信息、情报的价值同知识的价值一样,也是无形和无价的,而且具有多变性。所以早期的信息计量、情报计量与评价也主要是通过对信息、情报载体(如以各种文献、信息情报产品的计量与评价为基础)的计量来间接完成的。到后来,随着信息技术手段日益提高,对信息量的测度与评价不断精确化(如信息熵、比特量、字节量等),但对信息价值的测度与评价仍只能间接完成(如通过对信息产品价值、信息产业、信息经济等的测度与评价)。尽管信息、情报与知识之间的关系十分复杂,但它们在本质上具有很大的相似性,因此对信息、情报的计量与评价能有效地运用到对知识的计量与评价上。只是目前对信息、情报的准确计量与评价还没有取得突破性进展。

信息计量单元之间也不是独立的,同样也存在着各种复杂的关系。信息计量单元之间可以通过词频反映其在文献知识单元乃至整个知识体系中的重要程度,通过主题关联发现信息计量单元之间的学科关系、主题结构、关联程度(如主题词或关键词共现频次),通过信息计量单元的不同组合还能发现新的知识计量单元(如主题词或关键词链及其网络)。

以文献计量单元和信息计量单元为基础的知识组织与管理或只停留在以整篇文献或文献信息为单元,选取若干主题词,没有分离出构成知识的最小单位——知识元;或采用引文索引,但没有建立知识元之间的直接联系;或只是采用文本知识发现提供文献中精细的信息和多篇关联的信息,但输出的仍是文献,难以提供脱离原始文献的独立知识元。文献检索和信息检索只能通过间接地获取文献再获取知识。

5 知识计量单元及其评价

知识单元,也称知识的内容单元,是指在知识管理中用来处理知识的最小的、不可分割的、独立的基本单元。知识单元主要用主题知识单元、关键词知识单元、知识元、知识单元、知识基因、知识因子、知识项、知识本体、知识概念、概念地图等来表示,目前主要用知识元来表示。

知识元是指文献中相对独立的、表征知识点的一个元素,它可以是一段文字、一幅图表、一个公式、一章或一节、一段动画、一个程序等。知识元也往往直指知识产品 (图书、论文、专利等)中的概念、论点(观点)、论据 (数据、资料)、论证(方法、模型)、结论等知识核心和知识创新点,也可称为元知识,知识元的粒度没有十分明确的规定,是知识管理、知识计量与知识评价的最小的基本单元,由不能再分割的框架结构来表示。元知识为不可再分的知识,元知识是我们进行知识检索的依据,某一具体的元知识我们称它为知识元[2-8]。同时,知识元之间也不是相互独立的,而是相互之间存在着各种复杂的关系。因此,基于知识单元和知识元的知识管理不仅研究知识元的数量、质量和价值等特征,还要研究知识元之间存在的各种关系(包括关系链和关系网络)。

知识元是具有独立的确定意义且不可再分的一个知识单元,在不同的应用中,对知识元的描述是不同的。知识元不仅可以直接表述知识的内容,也可以通过文献单元和信息单元将使用这一知识元的文献关联起来,将大量不断更新、不断出现的知识元建成知识元数据库,将会产生各种知识内容之间的内在网络化关联,体现出各学科专业交叉渗透的关系特征。

文献[3]将知识元分成两大类型:①描述型,包括信息报道型,名词解释型,数值型,问题描述型,文献引证型。②过程型,包括步骤型,方法型,定义型,原理型,经验型等。也可分为理论与方法知识元、事实型知识元和数值型知识元。而文献[17]将知识元分为以下几种类型:①概念类知识元,是对事物性质、事物变化规律的认识。如“杠杆平衡”是一个概念。②原理类知识元,是对事物性质、事物变化规律的认识。如“杠杆平衡原理”是一个原理。③方法类知识元,解决同样的问题,方法可以多样,方法类知识元是指分析、解决问题的某种确定的方法。如“因式分解法”有配方法、十字相乘法、求根法等。④事实类知识元,反映一个事实。如历史事件、地理现象、社会现象等。⑤陈述类知识元,是用来表述两者之间的关系或为了表达某个观点。如生物学的基本特征、细胞中的种类和含量等。⑥数值类知识元,是用来表述对象或过程的数量特征和关系。如工业总

产值、 GDP、变化量、变化率等。⑦模型类知识元,用来描述事物或对象的数学或图形模型。如统计模型、DNA双螺旋结构等。

从“知识元”层面研究知识计量与管理,揭示单篇文献个体中的“知识元”信息与某领域共性中的“知识结构”的链接关系,从而找出信息与知识的导航链接的普遍规律,为用户提供直接获取有效知识元而不是大量文献的有效方法。因此,知识元计量与管理是知识管理的起点。知识检索是在知识结构中获取知识的过程,用户可以通过知识单元间接地获取知识,更可以通过知识元直接获取知识[2-3]。 尽管在现有的一些文献中提出了“知识元”的概念及其在知识组织与管理中的操作方式,确实是突破了以往知识组织与管理的模式,但在知识单元和知识元的处理上还存在大量的问题。首先,目前所提出的“知识元”这一概念是抽象的、不确定的,即具有不确定性和不稳定性,还不能清楚地界定。其次,虽然在许多文献中已经对知识元的结构描述颇具特色,较为清楚,但知识元的长度、来源、识别、组合等依旧十分模糊,导致在知识元标引、组织、存储、检索、利用等方面尚不具有可操作性,特别是计算机自动处理。第三,知识元的基本构成单元还是要以字、词、句、段、全文中的主题知识概念等为基础。仍然不能脱离文献单元和信息单元,也就是说,知识元应该是一个最小的表达一个完整知识概念的独立单元,它最终还是由一个或多个主题词、关键词等组合而成。因此,对知识元的明确界定、知识元的有效提取和对知识元的可操作性是目前仍然要解决的关键问题。最后,由于知识组织和管理的惯性,以知识元为知识单元的知识组织与管理还有相当长的路要走。首先面临着人们习惯的挑战。我们在知识的组织与管理上已经形成了比较成熟的方法和体系,在技术上也得到了有效实现,正趋于完善。人们在思维、学习、知识获取、知识生产和知识利用等方面已经习惯于以文献单元为中心,在知识的组织与管理上也已经形成完整的知识体系。毫无疑问,要打破这种现存的、完善的知识组织体系,在知识管理和利用习惯、观念以及社会成本上都是一个巨大的挑战。可以说,知识单元的发展不仅面临着本身的缺陷和瓶颈,还要解决和克服来自知识利用习惯和社会成本等方面的压力。

6 结束语

知识管理、知识计量与知识服务要把文献知识和信息转化为可用知识,为用户提供知识产品和服务,首先要依赖于实现对知识内容的加工处理。知识的内容加工处理先要解决两个问题:一个是知识单元的表达和组织,从物理层次的文献单元向认知层次的知识单元转换;另一个是知识的内容计量从语法层次向语义层次转换。从知识标引的阶段开始,把知识分解为最小独立的“知识元”,建立以知识元为计量单位的“知识元自由集成系统”,是实现知识组织和管理的本质和关键[4]。

知识单元的组织与管理离不开对文献计量单元和信息计量单元的处理。知识元、知识单元、知识结构都以文献单元和信息单元的方式表现,文献单元、信息单元转换为知识单元是实现知识组织与管理的关键。深入研究文献单元、信息单元的结构与内容特征,如何用文献单元和信息单元所包含的内容特征及其关系等为基础来分析和表达知识元,从文献单元和信息计量单元中有效识别和提取知识单元仍然是今后长时间内要研究的核心问题。此外,还需要借助于现代知识管理技术,利用知识管理技术发展的最新成果,将知识元和知识单元的智能化管理向前推进,真正地实现知识元和知识单元的集成、综合、推理与自由管理,达到知识自由组合、高效创新的目标。

【参考文献】

[1] 温有奎.基于知识元语义网格平台的知识发现研究[J].计算机工程与应用,2006(4):4-7

[2] 温有奎,徐国华.知识元链接理论[J].情报学报,2003(6):666-671

[3] 温有奎,赖伯年.网格技术将推动知识管理革命[J].情报学报,2004(1):125-129

[4] 曾民族.向知识标引进军——阅读《知识元挖掘》的体会[J].情报学报,2006(2)

[5] 朱庆华.《知识元挖掘》评介——兼议情报学的理论研究[J].情报科学,2006(12)

[6] 温有奎,等.基于创新点的知识元挖掘[J].情报学报,2005(6):663-669

[7] 温有奎.基于知识元的文本知识标引[J].情报学报,2006(3):282-289

[8] 温有奎.基于“知识元”的知识组织与检索[J].计算机工程与应用,2005(1):55-59

[9] 陈禹,谢康.知识经济的测度理论与方法[M].北京:中国人民大学出版社,1998

[10] 姜春林.漫漫求索之路,景致这边独好——介评《在科学交叉处探索科学——从科学学到科学计量学》[J].情报杂志,2004(2):118-120

[11] Reich Y. Measuring the value of knowledge[J]. International Joumal of Human-computer Studies, 1995,42(1):3-30

[12] King A W, Zzeithaml C P. Measuring organizational knowledge: A conceptual and methodological framework[J]. Strategic Management Journal, 2003, 24(8):763-772

[13] 邹珊刚,等.基于知识经济的知识测度研究——关于澳大利亚几种测度方法的评述[J].科研管理,2001(4):34-38

[14] Fung M K, Chow W W. Measuring the intensity of knowledge flow with patent statistics[J]. Economics Letters, 2002, 74(1):353-358

[15] 刘则渊,冷云生.关于创建知识计量学的初步构想[C]//王战军,蒋国华.科研评价与大学评价(国际会议论文集).北京:红旗出版社,2001:401-405

信息计量学论文第5篇

关键词:信息论 编码 理论教学 实验教学 教学改革

中图分类号:G64 文献标识码:A 文章编号:1672-3791(2012)10(a)-0007-01

进入21世纪以来,信息日益成为大家关注的焦点。信息有广义信息和狭义信息之分。《信息论与编码》是一门理论和实践紧密结合的课程,书中大多讨论的是关于狭义信息的最基本的理论,内容所涉及生活和工业领域非常广泛,包括信号滤波和预测、统计检测和估计、移动通信、遗传学、神经生理学,社会学等等有关信息的问题。信息论与编码是电子信息工程、通信工程和信息与计算科学等专业的一门重要专业基础课。本人结合3年的信息论课程的授课经验,针对目前教学过程中的出现的问题进行了分析,提出一些理论与实验相结合的教学改革方法。

1 信息论与编码课程的特点和存在的问题

1.1 所需准备大量的基础课程,知识量大

信息论与编码课程涉及大量数学知识,主要包括高等数学、线性代数、离散数学、概率论与数理统计、随机过程以及数值分析等。这些数学知识本身比较复杂、抽象,对于非数学专业的学生来讲,由于缺乏系统的学习,因此对繁杂的数学定理及其推理感到抽象和枯燥,比较难以接受,进而形成畏难情绪。而数学专业的学生在储备了大量的数学知识之后,还需要掌握一些通信方面的基础专业知识。这方面的薄弱使得他们在学习的过程中往往觉得穿插生硬,容易失去学习兴趣。

1.2 概念抽象,证明推导过程复杂

信息论与编码课程中大量的概率论的知识和随机过程的知识,比如马氏链的稳定的极限熵,香农极限的推导过程,信道定理推导过程中的大量不等式证明都使得学生感觉这门课程更像纯数学理论,一直在做逻辑证明。从而使得学生逐渐因为不熟悉的数学知识丧失学习动力,因此在学习中适当加入实例和计算机模拟算法更能贴近学生的思维。

1.3 教材所限,不可体现实际应用

信息论与编码的教材通常先引入各种定义,比如信息、信源熵、信道容量等等,然后提出性质,定理,仍然是“定义,定理,例题,练习”老套路的数学逻辑模式,没有合适的引入和应用。即使后面的信源编码,压缩编码如此思路明确的算法,也没有结合计算机进行数值试验,使得整个课堂教授乏味难懂。如何优化信息论与编码的教学,提高教学质量与效果,增进学生分析问题和解决实际问题的能力,培养适合于信息时代需要的人才,是我们教师一直需要努力的目标。

2 理论教学的改革方法

根据信息论与编码课程的特点,应合理选择课堂教学内容,针对当代大学生的特点,要求掌握香农理论中的核心内容,强调可与实践结合的章节的重要讲解,譬如离散信源编码,离散信道信道容量求解。减少纯粹的定理推导证明,并通过简洁的实例使得学生深入透彻地理解公式和定理表达的内容。在充分理解课程内容的基础上,将相关知识和当前的信息技术如移动通信技术、互联网技术等结合,不仅可以扩大学生的知识面,还可以让学生在课堂学习的过程中感受到信息与通信领域最前沿的理论与技术又能有兴趣学习相对乏味的基础理论知识。

除了相应的丰富教学内容,还可以采取多种教学手段,将多媒体和黑板相结合,尽量减少黑板带来的大量证明推导的板书时间,展现多媒体授课的生动形象,还可以增加课程内容的信息量。但也要努力克服多媒体长时间的视觉疲劳而有重点的停顿和强调,吸引学生课堂的注意力。

3 实验教学的引入

信息论与编码的本身学科特点决定了它是一门来源实践并指导实践的课程,因此有必要设计一些实验课。通过实验可以大大提升学生的学习动力,提高学生的动手实践能力。

实验教学不仅能使学生更好地掌握理论知识,使理论结果可视化,更重要的是能激发学生的兴趣,进而促进理论教学。设计适合不同层次学生的实验项目,即针对一个实验,给出由易到难阶梯式的任务要求,鼓励引导学生一级级攻克。但实验内容必须精选和优化,适合不同专业的需要。首先有验证性实验,主要是信源熵的计算等;其次是设计性实验,对给定的离散信源进行Huffman编码、费诺编码等,这些适合信息与计算科学专业、生物信息专业的学生进行。最后是综合性的实验,搭建一个包括信源、信源编译码器、信道、信道编译码器等各模块在内的仿真通信系统。此实验适合通信工程专业的学生进行。

近些年为了大学生数学建模比赛的需要,大学都开设了数学实验课程,主要选取了MATLAB软件作为实验平台。相对于传统的C语言,MATLAB语言简单易懂,其特有的工具箱可以对编程进行辅助。另外MATLAB可以实现动态建模与仿真,因此MATLAB软件在信息论与编码的实验教学中得到了广泛的应用。因为信息论与编码课程中用到大量的矩阵计算,比如信道容量的计算、线性分组码等,因此选择MATLAB软件作为实验平台非常适合课程自身特点。

4 结语

本文总结了信息论与编码课程的特点以及目前教学中存在的一些问题,针对理论教学和实验教学两个方面讨论了一些课程教学改革的见解,提出了该课程在教学和实验环节都需要的改进之处,对该课程教学的模式进行了一定创新。对于该课程的教学探索还要在今后的教学过程中不断摸索中前进,争取达到良好的教学效果,培养出适合信息新时代的优秀人才。

参考文献

[1] 曹雪虹,张宗橙.信息论与编码[M].北京:清华大学出版社,2008.

[2] 傅祖芸,赵建中.信息论与编码[M].北京:电子工业出版社,2010.

[3] 刘莺,胡剑伟.信息论基础课程教学班优化改革的探讨[J].科技信息,2011(35).

信息计量学论文第6篇

关键词:基本前提变革、会计约定、基本前提新论

本文讨论的会计学基本前提即会计核算的基本前提(亦称会计假设),是会计学的理论基石。现在的会计核算的基本前提是在以前社会经济、科学技术、会计工作环境下设定的,当时是合理的。但是随着社会经济、技术环境发生了巨大的变化,特别是信息技术使会计处理工具起了质的变革,从而现有的会计学基本前提与当今的社会经济(尤其网络经济)活动和会计处理工作已经很不相适用,面临着脱胎换骨的大变革。

一 会计工具即会计信息处理系统成为基本前提

会计信息处理(人机)系统,包括互联网情形处理会计业务的会计信息处理系统,统称为会计信息处理系统。此会计信息处理系统是会计核算的工具,简称会计工具。随着会计信息化的发展,会计工具日益重要,以致成为会计核算工作的基本前提。若会计信息处理系统运转不正常或性能不可靠或不稳定,则将影响会计业务的正常运行,甚至会使整个经营业务陷入瘫痪。如银行的会计业务网络系统出故障,则整个业务就得停止;一般财务部门,如果停电不能开机,则就不能进行报销等业务;现在的超市如果收款机不能工作,就得关门停业。这些都是会计信息处理系统不能正常运行,会计就无法进行,造成暂停业务。实际上就是会计核算的基本前提不成立,即没有会计核算工具,就不可能有会计工作。由此可见,会计工具即会计信息处理(人机)系统已经成为会计学的会计核算的基本前提。有了这一前提,就能很好地解释或解决会计实务中发生的问题,并将会计理论知识与会计实际工作紧密联系起来。

还有,就会计信息处理系统而言,信息技术发展到今天,价值信息与非价值信息完全可以同时处理(因为越来越同时需要这两者信息),而现在的状态是会计核算仅处理价值信息,其他信息系统处理非价值信息,这主要是受原手工处理系统的影响,造成使用信息技术的会计信息处理系统还停留在模仿手工处理系统的模式;另一方面原因是理论研究不够,没有产生新的理论来指导这方面的实践,提高会计信息处理水平,做到价值信息与非价值信息同时处理。作者提出的会计核算的基本前提即会计信息处理系统为价值信息与非价值信息同时处理的系统。会计工具成为基本前提,这是全新的论点,是原来没有的论点。

二 会计核算的基本前提会计主体本末倒置

传统的会计核算的基本前提会计主体,是指会计工作为其服务的特定单位或组织。这里将被服务对象称为会计主体,显然这种称谓不妥,犯有概念错误。依据哲学观念,被服务对象即会计人员认识和实践的对象应属客体。所以传统的会计主体应该称为会计客体更为确切,而会计主体则是从事会计工作的人员或组织,不是会计人员工作的单位。特别的是,中国财政部是中国会计主体的最 重要组成部分,与其余的中国全体会计工作人员或组织构成中国会计主体。因此,传统的会计核算的基本前提会计主体本末倒置,需要更正,使其正确。再者,企业会计准则中指出,“会计核算应当以企业发生的各项经济业务为对象,记录和反映企业本身的各项生产经营活动”。从这句话可以看出,企业是会计的承受者,属于会计客体的位置,怎么能成为会计主体呢,但按照传统的会计核算的基本前提,企业属会计主体,显然产生矛盾。还有,按传统说法,会计主体是单位或组织,但现实中无自身组织机构,却具有会计主体方面要求的经济形式也不少,如投资基金,政府基金等,这又作何解释呢。实际上,不管是单位或组织、投资基金或政府基金,还是企业或公司都是会计客体;只要有必要,任何一个经济上独立或相对独立的组织都可以成为一个会计客体,典型的会计客体是经营性企业。会计核算范围由会计客体的经济活动业务事项而确定。

会计工作中,会计人员是主要的,是会计主体;而会计工作的单位是次要的,是非会计主体。因为在会计工作中起主导作用的是会计人员,所以会计主体是会计人员。若会计主体是会计人员的工作单位,则会计人员的主体作用就被抹杀掉了,因为会计主体不是会计人员,那么怎么能起主体作用呢。这样的话,会计人员工作的单位即会计主体就可控制会计信息的质量(因为会计主体在整个会计工作中起主导作用),就可以弄虚作假,徇私舞弊。这从理论上就使得会计信息质量无法控制,开了会计信息失真的绿灯。所以单位领导可以指使会计人员作假账,粉饰财务报表等,这些都是此理论产生的恶果。作者对这一理论寻根求源,发现它可能还是当时计划经济的产物。由此看到,会计主体不应该是会计信息的产生或发生者,而应该是会计信息的加工或处理者,即会计人员。这样从理论上就使得会计信息是完全可以控制的。另外,会计主体应该独立于会计工作的单位,即会计工作人员应该与传统的会计主体独立,否则无法发挥会计人员的主体作用。如果非说会计人员不是会计主体,那么会计信息质量谁控制?若是会计主体自身来控制,这就回到了上面讨论过的问题即开绿灯问题。若是会计人员来控制,那么非会计主体怎能控制会计主体的信息质量呢?这从理论上就是不可行的,自然也是错误的。由此得出结论:若会计人员不是会计主体,则无法很好地控制会计信息质量。

三 会计分期、货币计量只是会计约定

传统的会计核算的基本前提会计分期,是指为了定期总结企业的经营状况,人为地将企业持续不断的经营时期按照一定的时间间隔分割开来,形成一个个的会计期间,并将其作为编制一个个的财务报告的时间范围。传统的会计核算的基本前提货币计量,是指会计核算以货币作为计量单位的最小单位;尽管会计数据不只限于货币单位,但传统会计报告主要包括以货币计量的财务信息。这是传统的会计学原理中对会计分期、货币计量含义的解释。随着社会经济、技术环境的巨大变化,带来了对其的巨大冲击。鉴于此,作者对会计分期、货币计量内涵进行了更深入的研究,理解分析得更为透彻,使其含义更为确切。

(一)关于约定

1.约定的含义

约定的含义是既定俗成。例如,程序设计中用C开头的变量名(如CName)表示字符变量,这就是一种约定。实际上,不用C字母开头变量表示字符变量也行,但是没有约定的使用方便、习惯。因此,通常都按约定的方法来做事情。时间长了习惯了也就不再改变这种约定了,但实际上约定是可以改变的。会计约定是会计学或会计工作中会计核算的约定的简称。会计分期、货币计量是会计约定的典型例子,稍后有对它们的专门讨论。

信息计量学论文第7篇

【关键词】信息论 大学物理 教学设计

【中图分类号】G64 【文献标识码】A 【文章编号】2095-3089(2014)09-0182-02

大学物理是大学理工科的基础教学课程,能够帮助学生了解和熟悉自然界物质结构,对于学生的未来发展和生活都有着非常重要的意义。大学物理和其他教学学科相比,大学物理知识较为抽象,教学难度也相对较高,运用合理的教学方法和教学模式对于大学物理教学工作的开展有着非常积极的作用。

一、信息论与大学物理教学的联系

从信息论的基本原理中能够看出,信息论和物理教学之间有着较高关联性,信息论中对信息数据的解释以及信息的传输原理,对于研究物理教学工作来说将起到非常积极的作用。我国高等教育教材由我国教育部门统一编制,根据我国社会发展需求制定人才培养的目标和计划,在教育教学工作开展的过程中,对信息只是进行选择、改造以及组合,不断完善教学内容,提升教学水平,为国家培养更多具有丰富知识的优秀专业人才。

就物理教学来说,物理教学并不是单纯的灌输性教学,而是双向的交流教学,教学过程中的信息交换是一个双向的过程,老师向学生输送相关理论知识,同时学生也会向老师提供一定的信息反馈,老师和学生不存在绝对的信息发出者和接收者,两者的关系是相互的。在课堂教学当中,信息数据经过输入、记忆、变换、加工以及反馈等多个流程,最终才能够真正的完成教学目标,达成教学目的。上述的信息流程都是信息论所研究的主要内容,信息论即是对信息的研究原理,信息论研究信息的计量、传输、变化、使用规律以及反馈等过程,利用信息论对物理教学实施研究,能够从理论的角度寻求改善和提升物力教学质量和效率的有效方法,促进教育教学水平的提升。

二、基于信息论的大学物理教学设计目的

(一)提高信息传播质量,提升教学效率

信息论是应用概率论以及数据统计的方法对信息熵、数据传输等问题的应用数学学科。信息论中指出,信息是生命系统、机器系统等适应外部世界和同步世界所开展的一种交换物质的运动形式。在大学物理教学过程中,教师和学生之间所进行的便是一种交换过程,在这一过程当中,老师的教学内容即是信息,而学生则是接收这些信息的外部世界。要保证信息传输的真实性和准确性,教师首先需要做的,便是对教材的深入了解和分析,掌握教材的教学中心,提炼准确的教学元素,保证信息的输出质量和输出效果,最终实现大学物理教育教学效率的显著提升。

(二)优化教学方法,改善教学质量

从信息论角度开展大学物理教学方法的研究和设计,对于改善教学质量也将起到非常积极的租用。信息论研究的主要方向是信息的传播路径、信息的传播方法以及信息的传播形式,通过改善信息通道和优化信息传播方法,以达到提升信息量和信息传播质量的目的。大学物理教学中引入信息论,能够对大学物理教学过程中教学方法进行分析和评估,指出教学中所存在的问题和不足,根据分析结果选择合理的教学手段来优化知识传播途径,达到改善教学质量的目的。

三、基于信息论的大学物理教学设计

(一)提炼教学元素,准确输出信息

一名优秀的教师,应该懂得如何对信息进行转化,将枯燥的信息转成丰富而生动的图文,使学生能够乐于接受这些信息,让学生能够牢牢地记住教学知识。教材中关键点的挖掘,是信息传输的前提。许多教师虽然课堂教学方法灵活多变,课堂氛围活跃,但是教学水平则一般,究其原因,主要是教师没有真正的抓住教材的主要思想,没有将教学信息完全的传输给学生。因此,教师在大学物理教育教学过程中,必须要抓住信息关键,消除思维屏障。

适当的教学方法,也是提升信息传输效果的有效途径。在教学过程中,教师可以依靠合适的教学方法来提升教学氛围,提升学生对知识的理解兴趣,提高学生的学习积极性。较为常用的教学方法主要有实验法、互动学习法、实践法等多种方法,教师可以根据实际情况采取行之有效的方法达到教学目的。比如,电动势概念一直以来都被人们当做是大学物理教学中的难点和重点,概念的抽象和不便于理解,使得教师难以达到教学预期。针对这类问题,教师可以采用实验法,带领学生进行试验操作,较低教学难度和坡度,使学生在操作过程中能够掌握非静电力的有关概念,激发学生学习积极性和学习兴趣,并牢牢记住非静电力的作用原理和效果。由此可见,从信息论角度来看,教师要想准确的输出教学信息,保证信息输出质量和效果,就必须要重视信息元素的提炼和分析,采用行之有效的方法,以达到教学目的。

(二)精简教学结构,畅通信息渠道

大学物理教学过程中,教师要想实现真正意义上的信息高效率转化,就必须要从教学结构入手。所谓教学结构,就是教师对教学要点的合理布置,课堂教学时间的应用,以及对教学方法的整合。

合理的教学结果,能够使信息逐层增加难度,在不断的探索和理解过程中帮助学生掌握相关知识要点,达到教学预期。大学物理中的许多知识点都相对较为复杂,具有一定的教学难度,教师应该根据信息论进行教学结构的优化和改良。在香农-维纳公示,信息的频带宽越大,则信噪比越高,传递的理想信息量就会越大。信息组块是信息量的一个有效单位,也是测量人短时记忆的最小单位。信息论中指出人的短时记忆容量小于或者等于五个组块时才能够牢固的将信息贮存在长时记忆当中。因此,在实际的教学过程中,应该灵活的运用这一原理进行结构的调整,遵从信息块不得大于5的原则,以4个信息块来设计新的教学结构。

(三)建立信息反馈机制,发挥信息调控作用

在信息论理论当中,信息在完成输出活动之后,信息的反馈则成为信息的重要调控元素。信息的存储和长期保持,必须要有信息反馈的参与。大学物理教学中,教师通过多样的教学方法和教学结构以实现信息的传输目的,帮助学生了解和掌握相关物理学知识。然而,如果缺乏必要的信息反馈和交流,学生将无法完全的吸收和消化信息,这个信息的传输工作也便没有真正的完成。由此可见,建立信息反馈机制是非常重要的,发挥信息调控作用,能够更好的保证教学质量和教学效率。

首先,信息的反馈可以在教学课堂上进行完成。老师在课堂上可以就本堂课所传输的信息提出部分问题,供学生回答和思考。根据学生对问题的回答结果,老师能够较为清楚的了解学生对信息的获取和吸收情况,并根据实际情况来调整教学内容,巩固教学知识。同时,教师也应该在课堂之外加强和学生之间的交流和沟通,在和学生的沟通当中了解课堂教学中自身所存在的问题和不足,并对其进行及时的优化和改善。例如,在楞次定律的教学中,老师便可以围绕这楞次定律提出相关问题:比如,感应电流在什么样的情况下才会产生,当线圈当中有磁感线的时候,线圈就会产生电流吗?法拉第电磁感应定律和楞次定律之间存在什么样的联系?感应电流磁场是如何阻碍原磁场的变化的?会不会将原磁场中的磁感线阻碍掉一半呢?

以上问题的提出,充分的结合了本堂课所传授的知识信息,学生对该问题进行积极思考和分析的同时,也是自身加强记忆和信息回顾的过程,这对于提升学生对知识的掌握能力以及对问题的处理能够有有着非常积极的作用。

四、基于信息论的大学物理教学设计体会

(一)调动学生积极性,提升信息传输质量

通过将信息论与大学物理教学相结合,一定程度上保证了信息提取的准确度和有效性,使教材中教学内容更为清晰的展现在学生面前,避免了信息数据不准确而导致的教学质量低下的问题。同时,结合信息论理论,实现了教学信息传输的准确性,降低了学生的理解难度,调动了学生的学习积极性。

(二)大学物理教学应用信息论开展教学设计的注意点

信息论作为一门专业的应用数学学科,信息论原理较为抽象,导致不同程度的应用困难和障碍,最终影响到信息论的应用效果和教学效果,为此在实际的运用中必须要注意以下几点。首先,应用信息论开展教学设计和教学分析,必须要循序渐进,将教学过程划分为准备阶段、教学阶段和反馈阶段,分阶段应用信息论开展评估和优化。其次,信息的传播是相互的,信息反馈是优化信息传播路径的关键。应用信息论进行教学设计,必须要重视学生的反馈,采取适当的手段在课上及课后开展信息反馈和整理工作,认真分析问题,并解决问题,从而真正的实现教学质量的提升。

信息论与大学物理教学有着非常紧密的联系。大学物理教学本身就是信息传递的过程,而这个过程也是学生双边共同进行和开展的信息交换。教师作为信息的发出者,需要懂得如何去提炼信息元素,如何选择合适的方法提高信息的传播质量和效果,真正实现教学目标的达成,以及教学质量的显著提升。

参考文献:

[1]康天斌.信息论在物理教学中的应用[J].教育时空,2009(11)

[2]鲍鸿吉.物理教学与生活实际结合[J].物理与工程,2010(03)

[3]吴天刚,倪忠强,吴於人.数字化物理教学的设计与实践――大学物理教学设计[J].物理与工程,2009(06)

[4]杨国海,张增常.大学物理教学设计及理论基础[J].襄樊学院学报,2008(08)

信息计量学论文第8篇

【摘要题】信息化与网络化建设

【关键词】内容分析法/学科信息门户/信息选择/信息组织/信息导航/信息服务

【正文】

1内容分析法概况

1.1发展历史

内容分析法(ContentAnalysis)是发源于新闻传播领域的一种方法,通过对传播内容进行客观、系统和定性与定量相结合的分析,有效描述传播内容特征和检验传播研究假设。其发展最早可以追溯到第二次世界大战期间,当时美国著名传播学家哈罗德·拉斯韦尔等人在美国国会图书馆组织了一项名为“战时通讯研究”的工作,以德国公开出版的报纸为研究对象,通过内容分析法获取重要的军政机密情报,取得重大成就。这项工作不仅显现出内容分析法的强大作用,而且总结出了一套内容分析法的工作模式,战后,内容分析法在传播领域得到更多研究,20世纪50年代,美国学者贝雷尔森(BernardBerelson)发表著作《内容分析:传播研究的一种工具》,奠定了内容分析法的地位,其对内容分析法的定义也被广泛引用。目前,内容分析法已经被广泛运用到新闻传播、图书情报、政治军事决策、社会学和心理学等社会科学研究的各个领域。随着网络的发展,它开始成为网络信息组织、描述和利用的重要方法和研究热点。

1.2定义

按照贝雷尔森的经典定义,内容分析法是一种对具有明确特定的传播内容进行的客观、系统和定量描述的研究技术[1]。在运用到图书情报领域时,内容分析法依然遵循客观、系统和定量原则,通过对各种类型文献信息的数据计量、比较、分析和推理,描述学科发展特点和趋势、发现学科空白实现学术创新、实现信息的有效组织和利用以及分析用户需求提供个性化服务。按照使用的方法模式不同,内容分析法可以分为:(1)解读式内容分析法,通过精读、理解并阐释文本内容来传达作者的意图;(2)实验室式内容分析法,主要是定量和定性内容分析相结合;(3)计算机辅助内容分析法,运用计算机来辅助数据搜集、编辑、整序和分析[2]。

1.3特点

内容分析法的特点主要体现在四个方面:(1)定性、定量相结合。内容分析法首先要提出研究意图和假设,对分析单元和程序进行质的规定。以定性为基础,再采用统计、计量等定量方法和数字、图表等描述方法对信息内容进行揭示,最终还将回归到内容的解释和深化的定性层面。(2)客观性。内容分析法得以实现的前提在于文献的内容特征可以通过符号群(包括语词、图像、音频、视频和多媒体元素等,其中语词是最常用的符号群)来体现,而且同一符号群在同一文献中具有相同的意义[3]。人们是通过对符号群出现的频次、位置等外在客观信息的计量来了解文献的信息内容特征的,这就保证了内容分析的客观性,它不会因为实施者的不同而出现巨大差异。(3)系统性。这主要体现在样本选择和分析框架建构上。内容分析法一般是对一段时间的(通常是5年-10年)、连续稳定的、内容体例基本一致的大量文献信息进行分析,从时间跨度、数量要求、稳定程度等多方面对研究样本进行了限定。在分析单元和框架体系上要求尽可能全面反映样本的所有信息特征,具有互斥、完备、可信的特征。(4)统一性。内容分析强调统一的标准和规则,选择样本上必须按照统一的程序,保证每个项目接受分析的机会相同,而且所有的研究内容应以完全相同的方法进行处理,编码和分析过程必须一致,保证长时期分析效果的一致性。

2学科信息门户概况

2.1定义

学科信息门户(SubjectBasedInformationGateways,简称SBIGs)是用户访问某学科资源与服务的一个单一入口或通道。它是一种网络服务,用以完成本学科网络资源内容的高度组织集成和网络应用程序的聚集,并将这些资源与应用集成在一个可定制个性化的界面中来满足每个最终用户的需要。它还提供一个统一协作的学术交流环境。从用户角度来看,它是某学科用户访问该学科网络资源和服务的起始站点或称入口[4]。目前,国外都开展了各种学科信息门户项目,例如:欧洲的Desire项目、美国的Infomine项目、英国的RDN(ResourceDiscoverNetwork)项目、SOSIG(SocialScienceInformationGaterway)项目等等,国内近年来开始发展的上海图书馆“数字图书馆”资源项目、中科院“国家科学数字图书馆(CSDL)”项目建立的数字图书馆中心门户和生命科学、化学、数学物理、资源环境和图书情报5个学科信息门户、武汉理工大学图书馆建立的“材料复合新技术信息门户”等。

2.2特点

学科信息门户主要针对特定学科领域,服务对象基本上是专业研究人员。这一主要特征决定了学科信息门户建构的要求:(1)专业化,在资源选择上要选取学科研究中可靠的信息源,资源描述和组织上要依据专业词表和分类法,对门户要经常更新和专业测评;(2)集成化,将专业领域里所需要的各种信息资源,包括网站、图书情报系统、文摘索引、电子期刊、科技报告、学位与会议论文、研究机构、学术团体、教育机构、学术会议、工具书、专业服务系统以及与学科科研紧密相关的其他资源系统集成到一个网络平台上提供服务;(3)知识化,信息资源强调专而精,根据对知识内容及其关系来选择、描述和组织资源与服务;(4)智能化,要能提供符合专业领域的检索浏览方式及资源导航模式,并能在用户使用过程中提供智能化的服务帮助[5]。

2.3研究内容

目前学科信息门户研究也主要围绕上述要求来开展,内容有:(1)信息资源的选择研究,包括对学科信息门户需要涵盖的资源广度和深度进行界定,制定选取标准、流程规范和搜寻控制策略;(2)信息资源的组织研究,包括资源的整合策略、资源的描述方式和深度、资源的组织方式、知识挖掘;(3)信息服务研究,包括异构数据库的统一平台检索研究、信息导航研究和个性化推送服务;(4)技术研究,对建构学科信息门户的各种智能技术研究。

3内容分析法在学科信息门户构建中的应用

3.1应用的必要性和可行性

(1)必要性。学科信息门户是一种在网上获取高质量信息资源的重要工具,面向专业研究人员,因此在信息资源选择、组织和服务上都要求具有较高的专业水平,在内容选择上不仅强调完备性,而且更强调一定的指导性,要能够反映学科热点和前沿,在信息服务上,要能够针对个人研究情况的转移提供个性化的服务。当前出现的各种资源选择和评价标准还主要停留在定性描述上,虽然具有一定的指导性,但因为缺少量的规定而在实际操作中难以避免人为差异,而且定性描述难以准确反映学科研究的中心内容,内容分析法结合定性与定量描述,能够科学地反映学科核心资源、基本资源和边缘资源,还能够分析出研究的热点和重点所在,保证资源组织内容全面、重心突出。在服务方面尤其是个性化服务方面,目前的发展还远未完善:信息导航还主要依据专家意见,不够客观;推送服务主要是依据用户提供的要求来进行自动检索和发送,用户潜在的信息需求无法满足,也无法跟上用户的动态研究状况。内容分析法的优势就是从公开资料中提取秘密信息,信息服务人员可以通过对用户使用习惯、查询内容等的深度分析,了解用户的使用偏好、研究内容,从而提供针对性的指导、资料推送等个性化的服务。

(2)可行性。首先,内容分析法与学科信息门户具有某些相同或相近的特征和要求。学科信息门户要求信息资源具有连续性、稳定性和系统性,在选择范围和质量以及组织方面要求统一性和标准化,在信息服务方面也特别强调内容挖掘和知识内涵。而连续性、系统性、标准化也正是内容分析法的实施要求,并且内容分析法就是要从数据的分析中提炼内容主题,能够满足学科信息门户建设的知识要求,还能够弥补现存资源标准定性多、定量少的缺点,使学科门户资源提供更加科学合理。其次,目前已经有部分研究者将内容分析与信息建设和服务结合分析,取得了一定成果,这些可以作为内容分析法运用于学科信息门户的基础。如李敏等人研究了基于内容分析的信息导航建设框架和技术[6],朱少强等研究了内容分析运用于文献群隐含信息的挖掘的理论和方法[7],毕达天研究了内容分析法在网络数字信息分析中的应用[8],缪其浩利用内容分析考察了国际图书馆学术前沿及其发展[9],张蕊、王曰芬等人研究了计算机辅助内容分析软件[10-11]等。这些研究表明内容分析法能够运用于学科信息门户的信息选择、导航和知识挖掘,并且具有实际的可操作性。

.2具体应用内容

(1)信息资源选择。严格的资源选择是学科信息门户专业性、知识性的重要保障,目前国内外对资源选择都制订了各种标准,例如SOSIG从内容、形式和选择过程确定筛选标准,包括有效性、权威性、准确性、全面性、唯一性、有组织和时效性[12]。但这些标准还局限在质的规定上,结合内容分析法可以达到量的限定。在进行全方位信息选择之前可以先选取消范围的文献资源进行内容分析,从而制订可量化的信息选择标准。仅以确定信息选择的相关性标准为例,首先,选取某些体系完备、发展稳定、信息含量大的主要信息源,对其中的文章或网页里出现的专业词汇进行切分和索引,并依据专业词表进行规范和合并,然后对索引词汇进行词频统计、语义分析和特征提取,从而确定学科研究的核心词汇、基本词汇和边缘词汇。反过来,这三种类型词汇在各个信息源中出现的频次可用于确定某一资源与门户建设目的的相关性。按照样本结果,可以订立便于计量和操作和全面资源搜寻标准和策略。

(2)信息资源描述和组织。

内容分析法在信息描述方面的应用主要体现在:第一,内容分析与数据挖掘、语义结构和知识发现技术相结合,能够从大量不完全的、模糊的外显信息中发掘其隐含的有用知识信息,这种隐含信息可能信息创造者自身也未意识到,这就使信息描述更加完备、深入。第二,内容分析法在创建分析类目时,要将意义相同、相近和相关的分析单元进行归类整合,因而分析类目可用于描述资源之间的参照关系,并建立符合网络资源特点的动态词表。

目前主流的资源组织方式是分类浏览和主题检索,这两种方式的缺点在于作为受控语言,需要依据分类法或主题词表,而分类法和主题词表更新往往滞后于动态的学科发展形势。如前所述,运用内容分析法能够反映学科的核心词汇、基本词汇和边缘词汇,体现学科发展的热点和重点,再通过分析单元的归类整合,可以形成学科研究词库。而且词库产生的分析结果能进行迅速、有效的更新,更新一次内容分析只需下载最近一段时间内的信息文本并用原来开发的编码程序执行分析,研究趋势、重点分析可以每年、每季甚至每周更新,即使发生突况,也能及时反映。每当加入一个新问题,内容分析也能延伸到之前研究开展的时期再次分析,不受时间限制[13]。可见,采用内容分析能够提供一种更加适应网络和学术研究特点的、半受控的知识元组织方式。

(3)信息服务。信息服务是学科信息门户价值实现的关键所在,是资源创建者和使用者之间沟通的重要环节,主要包括信息导航服务、检索服务和用户个性化服务等层面,运用内容分析法能够提高这三个层面服务的质量。

信息导航可以帮助用户迅速、准确地定位到所需信息,但目前的导航系统还多是基于语词的静态物理链接,要达到用户满意就必须在用户导航路径的选择上给予内容提示与知识指导。通过信息的内容分析,抽取信息资源的核心领域和相关领域的含量、质量及相似度,从而实现资源的动态聚类,根据查询目的不同从多角度切入导航路径,并且不断转入相关导航节点,优化导航过程[14]。在日常维护中,通过对用户查找和点击情况的内容分析加以不断调整导航项目和设计,满足用户要求。信息导航除了门户内信息的快速定位,还包括外部相关网站的合理链接。选择独立网站作为分析单元,对其规模、内容、访问人数、学科信息内容的和用户使用评价情况做内容分析,确立关联程度、内容质量和使用频率较高的网站进行外部链接导航。

由于内容分析提供了信息的半受控的知识元组织方式,相应地,这种知识元索引库可以作为知识元检索方式的基础。运用一定的智能技术,在信息选择和组织过程中构建索引数据库,库中的内容都是专业领域的知识单元,是最小的知识组分。当用户查找某个关键词时,通过知识组分的逻辑组配合运算,包含该关键词的信息源将被作为知识元索引结果被检索出来提供给用户。还可将用户的检索要求和对检索结果的选择情况进行分析和积累,作为备用索引库,不断完善学科信息门户检索的专业化和知识化。

个性化信息服务离不开对用户个人使用情况的跟踪分析,内容分析法的应用主要是对网络使用记录的挖掘。显在的用户信息包括用户注册信息、发表评论等,隐性的用户信息要通过Web服务器日志、Cookie记录、动态跟踪软件、网络调查等方式来获取[15]。分析显在和隐含的用户信息,可以提取有关的用户行为特征,对用户的资源使用行为、频度、关注内容、使用偏好进行了解,总结其信息利用特点和规律,从而提供个别化的使用帮助和个性化的推送服务。

3.3实施步骤

内容分析法一般可以分为以下几个独立的阶段执行:

(1)提出研究问题,确定研究范围。在研究开始阶段就要明确表述研究目的,提出研究假设,并且依据研究主题划定研究范围,详细说明所分析内容的界限以便给出可操作的主题领域和时间段。

(2)抽取样本。样本选择的标准是符合研究目的、信息含量大、具有连续性、内容体例基本一致,简言之就是能从样本的性质中推断与总体性质有关的结论[16]。

(3)选择分析单元。即寻找内容分析所需考察的各项因素,这些因素要符合研究目的,且便于抽取操作。分析单元可以是数据库或网页中的特定语词、符号、主题、人物或者句子、段落乃至全文或网站,也可以是声音、视频信息或用户行为。

(4)建立类目体系。即确定分析单元的类目归属,有效的类目体系应保证所有的分析单元具有唯一的分类指归,各个类目界限明晰,并且分类标准一致,不同的编码者对分析单元的归属意见相同。

(5)内容编码和计量。将分析单元分配到类目系统中并对各个类目出现频次、空间数额等进行计量,这个过程可以采用计算机和相关软件来完成。

(6)解释与检验。通过数据的分析,进行合理的分析与阐释,并与研究假设相互印证,发现研究目的与结论之间的异同,得出对某一现象或理论的科学认识。分析结果还要通过信度和效度的进一步检验,信度包括对文献编码一致性、分类准确性和方法稳定性的检验,效度包括结论与事实的相符程度、理论研究结果的适用性检验[17]。

3.4应用内容分析法的优势与不足

内容分析法运用于学科信息门户的优势是由它的性质决定的。作为一种通过信息记录的数量分析来间接研究资源和用户行为的科学方法,内容分析法具有客观性,方法的运用者不与研究对象发生直接联系,研究者的主观态度和偏好不会对分析的数量结果造成影响,而且分析过程是按照规定的程序、方法和选择评价规则来执行,分析结果表现为一系列的量化数据,这些都保证了内容分析的客观性和统一性,使分析者能够从模糊、虚假的显在信息中抽取真实信息和有用知识,并能较深刻、精确地反映资源的知识含量和用户的个性化需要。在一定程度上能够弥补目前学科信息门户信息资源选择、描述、组织和服务标准定性化、主观化(依据专家意见)带来的不确定、易变的缺点。

内容分析法应用于学科信息门户构建也存在不足:一方面体现在内容分析法系统性要求与网络资源分散性特点的冲突。内容分析法要求选取比较稳定、连续、体例基本一致的大量信息作为样本,而学科信息门户作为对资源的二次整合,既包括数据库等比较稳定的资源,也包括互联网上比较零散的、形式多样的易逝信息,后者难以达到内容分析的要求,但对于学科信息门户资源建设又是十分必要的。同样的问题还存在于对暂时的、分散的用户使用情况的分析过程中,因而如何对这些即时性的、零碎的信息进行可靠的内容分析成为需要关注的问题。另一方面表现在内容分析法评价判断的不确定性。内容分析法采用定性与定量相结合的方式,定量建立在定性基础之上,这就使得任何信息在被统计分析处理之前,必定要划分到一定的类目体系中,而任何类目体系都是高度人工选择性的,不可避免的主观判断却成为客观定量分析的前提,这是内容分析自身无法克服的矛盾。当然,目前已有学者提出了一些解决方法,引入概率论、数理统计方法、模糊数学方法、灰色系统理论方法、贝叶斯定理来尽量减少内容分析法的不确定性[18],达到最大化的科学性。

4结语

内容分析法具有客观性、系统性、统一性、定性与定量相结合等特点,在实际运作中具有灵活性、易操作性,这些特点使它能够广泛地运用到学科信息门户资源建设和用户服务领域中,为信息资源选择、描述、组织和服务提供量化数据和规范基础,优化学科信息门户资源和服务质量。当然,内容分析法也还存在不足,需要结合其它方法和深入发展来加以完善。

【参考文献】

[1]卜卫.试论内容分析方法.国际新闻界,1997(4):55-68

[2]邱均平等.关于内容分析法的研究.见:邱均平主编.文献计量与内容分析——2004信息化与信息资源管理研讨会论文选集.长春:吉林科学技术出版社,2005:55-64

[3]叶鹰.文献计量法和内容分析法的理论基础及软件工具比较.见:邱均平主编.文献计量与内容分析——2004信息化与信息资源管理研讨会论文选集.长春:吉林科学技术出版社,2005:33-37

[4]孔敬,李广建.学科信息门户:概念、结构与关键技术.中国图书馆学报,2005(5):50-53,90

[5]张晓林.分布式学科信息门户中网络信息资源导航系统的规范建设.大学图书馆学报,2002(5):28-33,43

[6,14]李敏等.基于内容分析的网络信息导航研究.情报科学,2005(6):928-931,954

[7]朱少强,邱均平.文献计量与内容分析——文献群中隐含信息的挖掘.见:邱均平主编.文献计量与内容分析——2004信息化与信息资源管理研讨会论文选集.长春:吉林科学技术出版社,2005:77-84

[8,15]毕达天.基于数字信息的内容分析研究.现代情报,2005(7):62-67

[9]缪其浩.观察国际图书馆学术前沿及其发展:内容分析.中国图书馆学报,2002(3):5-8

[10]张蕊等.计算机辅助内容分析软件进展研究.见:邱均平主编.文献计量与内容分析——2004信息化与信息资源管理研讨会论文选集.长春:吉林科学技术出版社,2005:120-126

[11]王曰芬等.文献计量与内容分析综合应用软件的开发与实验.见:邱均平主编。文献计量与内容分析——2004信息化与信息资源管理研讨会论文选集.长春:吉林科学技术出版社,2005:44-54

[12]常唯.学科信息门户的资源选择与组织.图书馆,2005(1):60-62,67

[13]周黎明.基于网络的内容分析法.见:邱均平主编.文献计量与内容分析——2004信息化与信息资源管理研讨会论文选集.长春:吉林科学技术出版社,2005:107-114