首页 优秀范文 常见的统计学分析方法

常见的统计学分析方法赏析八篇

发布时间:2024-03-11 16:11:48

常见的统计学分析方法

常见的统计学分析方法第1篇

方法 选取44例先天缺失下切牙的青少年患者(男20例,女24例),拍摄X线头颅定位侧位片进行头影测量分析,并与哈尔滨地区正常GFEA1Coben分析法所得正常值进行统计学对比。结果 先天缺失下切牙青少年Coben分析法结果与正常GFEA1相比,中面部深度、下面部深度绝大部分测量项目差异有统计学意义(P<0.01),全面高、后面高部分测量项目差异有统计学意义(P<0.05或0.01)。结论 Coben分析法反映了先天缺失下切牙青少年的颅颌整体特征,在其诊断过程中有重大指导意义。

【关键词】 Coben分析法;先天缺失;头影测量

文章编号:1003-1383(2012)04-0536-03

中图分类号:R 783.5 文献标识码:A

doi:10.3969/j.issn.1003-1383.2012.04.036

Coben分析法[1]是以线距比例指数测量为主的X线头影测量方法,通过将各个测量点向基准平面(眼耳平面)作垂线,计算线距间指数的相互关系分析颅面结构特征。Coben分析法避免了由于眼耳平面倾斜所带来的对于角度测量的影响,通过线距比值客观地反映错GFEA1畸形的变化[2],故本研究采用Coben分析法分析先天缺失下切牙青少年的颅颌特征,为其诊断提供参考。

资料和方法

1.研究对象 选择2005~2012年在我院正畸科就诊的先天缺失下切牙青少年患者44例(男20例,女24例),平均年龄 13.1岁(10~16岁),既往体健,无唇腭裂,无影响牙齿发育的全身疾病,无骨性疾病及颞下颌关节疾病;无影响口腔正常发育的不良习惯,无正畸治疗史及外伤史。

2.方法

(1)收集临床资料,拍摄X线片:所有先天缺失下切牙青少年患者均在同一条件下拍摄正中GFEA1位X线头颅侧位定位片。

(2)定点、描记:采用手绘测量方式,由本文第一作者在相同条件下对所有研究对象的X线头颅定位侧位片进行定点、描记。参考平面及标志点按照Coben分析法[3]。

(3)测量项目见图1。

3.统计方法 采用SPSS 11.0统计软件包对测量内容进行统计分析。将所得到的数据与哈尔滨地区青少年正常GFEA1人群Coben分析法正常值[3]进行t检验(暂未找到华东地区青少年Coben分析法正常值数据库),P<0.05为差异有统计学意义。

结 果

1.Coben分析法中面部深度结果 先天缺失下切牙青少年Coben分析法结果与正常GFEA1相比,中面部深度四个测量项目差异均有统计学意义(P<0.01)。见表1。

2.Coben分析法下面部深度结果 先天缺失下

切牙青少年Coben分析法结果与正常GFEA1相比,下面部深度绝大部分测量项目差异均有统计学意义(P<0.01)。见表2。

3.Coben分析法全面高结果 先天缺失下切牙青少年Coben分析法结果与正常GFEA1相比,全面高部分测量项目差异有统计学意义(P<0.05或0.01)。见表3。

4.Coben分析法后面高结果 先天缺失下切牙青少年Coben分析法结果与正常GFEA1相比,后面高部分测量项目差异有统计学意义(P<0.05或0.01)。见表4。

讨 论

Coben分析法比角度分析法能更精确地了解颅颌面的内部结构和具体情况。譬如角度分析法只通过SNA了解上颌骨相对于颅部的发育情况,Coben分析法则能通过对Ba-S,S-Ptm,Ptm-A,Ba-A的测量了解上颌骨的内部结构;对下颌的分析,角度分析法主要通过SNB、面角和Y轴角了解下颌骨相对于颅部的发育情况,Coben分析法则根据下颌支、下颌体实长测量,掌握下颌骨上下前后的位置、大小等。而且Coben分析法通过研究各线距与Ba-N和N-Me之间的比例关系,分析颅面结构的特征,描述颅面相互之间的结构及位置关系。

先天缺失下切牙青少年面部深度与正常值相比,绝大多数测量项目比较差异均有统计学意义(P<0.01)。Ba-A/Ba-N(中面部深度)、S-Ptm/Ba-N(上颌后部深度)、Ptm-A/Ba-N(上颌骨长度)均小于正常值,存在统计学意义;Ba-Pog/Ba-N(下面部综合深度)、Ar-Go/Ba-N(下颌支长度)及Go-Pog/Ba-N(下颌体长度)相比正常值减小,而Ba-Ar/Ba-N大于正常值,说明先天缺失下切牙青少年下颌骨整体长度生长不足且下颌后缩;代表颅颌面部垂直向关系的N-S/ N-Me小于正常值,说明先天缺失下切牙青少年颅底角的生长方向可能发生了向后的旋转。且先天缺失下切牙青少年错GFEA1畸形的类型多为安氏Ⅱ1类,代表下颌体长度的Go-Pog/Ba-N比Ptm-A/Ba-N 更小于正常值,在本研究中可以解释安氏Ⅱ1类错GFEA1畸形患者的面中1/3前突现象;面中部深度中,Ba-S/Ba-N比正常值大,但并不能表明后颅底长度的绝对值增大,这也可能是颅底角度增大或向后倾斜,使得具有正常颅底绝对长度的个体投照距离加大,这也与Dibbets的研究结果相似[4]。

先天缺失下切牙青少年全面高及后面高与正常值相比部分测量项目差异有统计学意义(P<0.05或0.01),这说明先天缺失下切牙的青少年患者在面部高度上与正常GFEA1青少年间差异没有其在中面部及下面部深度上的程度大。

Coben分析法分别从颅颌深度和高度解释错GFEA1畸形的特点。本研究应用该方法客观分析了先天缺失下切牙青少年的整体颅颌特征,在其临床诊断过程中有重大指导意义。而男女间性别差异无统计学意义,这也与龙红月等人的研究结果相似[5],一方面可能是由于先天缺失下切牙青少年患者数量少导致的本研究样本偏量小,另一方面也不排除先天缺失下切牙青少年患者间本身不存在性别差异的可能。

参考文献

[1]Coben SE.The integration of facial skeletal variants[J].Am J Orthod,1955,41(6):407-434.

[2]闻 越,王 军,任 斌,等.女性恒牙GFEA1安氏Ⅱ类1分类错GFEA1畸形的Coben法分析[J].口腔医学,2011,31(2):93-95.

[3]崔玲玲.王培军.张 晔.哈尔滨地区120名正常GFEA1人群Coben法分析[J].华西口腔医学杂志,2007,25(2):146-148.

[4]Dibbets JM.Morphological associations between the Angle classes[J].Eur J Orthodont,1996,18(2):111-118.

常见的统计学分析方法第2篇

关键词:程序设计竞赛;在线评测;计算机算法;教学改革

中图分类号:G642 文献标识码:A

1程序设计竞赛

近年来,针对大学生的程序设计竞赛开展得越来越多,比较常见的有ACM-ICPC、TopCoder、百度之星、Google挑战赛等。其中ACM-ICPC (ACM International Collegiate Programming Contest)即ACM国际大学生程序设计竞赛,是历史最悠久、规模最大的竞赛。

由于程序设计竞赛具有开放性、综合性和评判的客观性特征,可以有效检验参赛选手综合应用知识分析和解决问题的能力,因此它不仅培养参赛选手的创造力和团队合作精神,而且也检测选手们在压力下进行创新思维和理性实践的能力。通过参与比赛,学生提高了利用计算机求解问题和程序设计的能力,形成积极向上的自主学习氛围。

在程序设计竞赛中,在线评测系统是开展竞赛的核心。它是一个在线程序与算法设计的练习和竞赛平台,提供大量程序和算法设计的题目,供学生练习或竞赛,学生可以使用自己熟悉的语言提交程序代码,系统编译提交代码,如果没有错误,则生成可执行文件,并利用系统的测试用例来测试,如果输出结果正确,则返回程序消耗的内存空间和时间。对于竞赛题目,系统可以从程序正确性、运行总时间、消耗内存空间、返回结果等方面来考察学生提交的代码,且支持多种语言。系统可以实现在制定的时间段提供竞赛的功能,根据学生解题数目和时间进行排名,也可以批量导出学生代码,进行分析。在线评测系统除了能用于程序设计竞赛外,还可以广泛用于辅助程序设计类课程的教学,为学生提供一个开放的、自主学习的实验环境。

2基于竞赛模式的算法分析与教学设计

2.1 “算法分析与设计”课程的特点

计算机专业要培养具备较强程序设计能力的程序员,需要掌握高级程序设计语言及数据结构、算法设计策略及设计模式、软件体系结构及开发方法等知识。“算法分析与设计”是面向设计的核心课程,主要通过介绍常见的算法设计策略及复杂性分析方法,培养学生分析和解决问题的能力,为开发高效的软件系统奠定坚实的基础。该课程理论与实践并重,内容具有综合性、广泛性和系统性,是一门集应用性、创造性及实践性融为一体的课程。主要内容包括算法效率分析基础、分治法、贪心法、动态规划、分支限界、回溯、近似算法、概率算法等常见的算法设计策略,也覆盖了排序、搜索、图论、几何、组合、数值计算等问题,这也是程序设计竞赛中常见的核心问题。因此,该课程在强调算法的设计思想和方法的同时,需要更加注重算法的应用和实现,教会学生如何利用计算机创造性地解决问题,培养学生独立分析和解决问题的能力。

目前,该课程的教学方法还是以传统的讲解为主,教师通常只是将已有的经典算法在已有的数学模型和数据结构上片面地解释给学生;在实践环节只是盲目的验证算法,而对该算法的运行效率、测试数据规模以及实际的应用场景则很少考虑。学生的学习则主要以理解和记忆为主,没有“理解”和“消化”,不能灵活运用算法;在实践环节,学生代码抄袭严重,很难达到训练的效果。这种教学模式下,学生缺乏问题抽象能力,在遇到实际问题时无从下手,思维创新能力和实践能力难以得到有效的提高。

针对以上问题,笔者利用程序设计竞赛模式和在线评测系统的特点,来弥补课程教学中的不足,探讨“算法分析与设计”的课程教学改革,培养高水平的创新型IT人才。

2.2基于程序设计竞赛的算法分析与设计教学模式

程序设计竞赛具有一定的时效性、开放性和评判的客观性,学生通过竞赛可以有效提高问题求解和程序设计能力。“算法分析与设计”课程通过介绍一些具体问题(如排序问题、检索问题、路径问题、组合问题等)的解决策略,让学生掌握算法的设计策略和分析方法。把这些问题编制成在线评测系统上的竞赛题目,在指定的时间内以竞赛方式开展实验或考核,让学生提交解决问题的程序代码,最后再导出学生代码进行分析。为了避免学生大规模的代码抄袭,可以使用代码甄别系统,该系统可判断代码的雷同率,有效分析学生代码的抄袭程度。教学基本模式(图1)以“竞赛题目”为中心,通过课堂教学和课后实践两个环节,让学生掌握算法分析方法和常见的算法设计方法,并应用到实际问题中,训练学生的程序设计能力。

竞赛题目的设计是课程教学的核心。题目设计应注意难度适中、内容新颖、能有效激发学生的学习兴趣,更重要的是要融入一种或多种算法设计策略,创造一种与现实应用紧密结合的环境;同时提供具有一定规模的一组或多组测试数据,以测试算法的效率。另外,设计题目时还应考虑学生水平的差异,对于能力强的学生,在完成基本要求的基础上,再增加一些有难度的问题,并引导学生自主研究新的问题解决方法,激发学生的创新能力。在具体实施时,考虑提供多个难易程度不一样的题目,如可分为基本算法的验证、基本应用、综合应用三个层次,一些为必选,一些为可选,让学生选择完成,因材施教。如合并排序、快速排序可作为基本算法的验证,最近点对和凸包问题可作为分治法的基本应用,而挑棒游戏可作为动态规划策略中求解有向图传递闭包的Warshall算法的综合应用。

课堂教学重点应放在指导学习方法,根据任务引导学生理解算法设计的基本策略与分析的基本思路;通过具体实例解析一些经典算法,让学生讨论算法在求解该任务时的效率,分析方法的优劣及适用场景;注意对问题进行归类,揭示算法设计策略的规律,使学生触类旁通;采用启发式提问,运用富有思考性的问题,引导学生自己去分析、解决问题。在题目求解方案找到后,适时地开展课堂讨论,引导学生对方案提出疑问,讨论算法的效率及实际应用场景,激发学生探求新的解决思路,让学生对各种方法加以评价;启发学生的思维,加深对问题的理解。

2.3基于程序设计竞赛的教学模式的优势

(1) 提供了开放的、自主学习的实验环境。通过网络使用,学生可以随时提交程序代码,并可在丰富的程序与算法设计题库中寻找合适的题目,训练程序设计能力。

(2) 有效训练了学生的程序设计能力,培养创新型IT人才。“算法分析与设计”的学习难点在于如何将常见的算法策略应用到实际环境中。通过三个层次(算法验证、基本应用、综合应用)的实践训练,让学生熟练掌握常见的算法设计策略,加深对各种算法设计策略的认识,理解算法的意义及精髓,达到学以致用。

(3) 形成良好的学习氛围,加强学生之间的交流。使用在线评测系统进行课程考核并举办程序与算法设计竞赛,以团队方式参与,可以形成良好的校园竞争和交流的学习氛围;学生有了在课余时间自主进行本学科知识钻研的机会和环境;也让学生体验团队协作的重要性,为软件项目团队化的合作要求做好准备。

3教学实践及实效

在笔者的教学实践中,采用了北京大学的POJ搭建了程序在线评测平台,并在近两年的算法分析与设计课程中利用该教学模式进行了改革,取得了很好的效果。为了更全面的训练学生的程序设计能力,课程考核采用了过程考核、课程报告、出勤三部分综合考查的考核方案,三部分分别占总成绩的70%、20%、10%。过程考核考察学生对算法设计策略的掌握程度,一共安排4次,每次以竞赛的方式进行,共计24道试题,每次选做3~5道,共计选做15道,每次考核中均有1~2道稍有难度的试题,内容覆盖了简单算法、分治法、减治法、变治法、时空权衡、动态规划、贪婪策略、回溯和分支限界等。课程报告考察学生综合应用算法分析和设计方法的能力,为9选1,根据所选题目撰写详细的解题报告。

在最近的一次教学中,笔者对教学班上66名同学进行了问卷调查,调查学生对教学改革的满意度、可取之处和不足。调查结果如表1、表2、表3所示:

从调查结果可以看出,学生的满意度很高,表明学生对此教学模式的认同度较高。从每次考核代码雷同甄别情况看,代码雷同率90%以上的低于10%,学生在POJ上做题的积极性也很高,常常会有1/3的非教学班同学参与每次考核。可见这种注重过程的考核方式在教学中取得了很好的教学效果。

4结论

基于在线评测系统的程序设计竞赛具开放性和评判客观性的特点,教师结合“算法分析与设计”课程的特点,将程序竞赛模式应用到课程的教学中,可以有效训练和考察学生的程序设计能力,还可以激发学生的学习兴趣。当然,在该教学模式的实践中,应注意每次考核或实验题目的选择要紧密结合课程知识点和实际应用;在实践过程中注重与学生的交流,激发学生学习热情,注重教学过程,促进学生掌握算法的精髓。

参考文献:

[1] 王卓威,尹宝林. 一个基于网络的程序自动评测系统[J]. 北京航空航天大学学报,2004,30(6):502-505.

[2] 武建华. 基于 ACM 模式的数据结构实践教学改革与探索[J]. 计算机教育,2007(12):114-116.

[3] 王素立,白首华. 算法分析与设计教学方法[J]. 湘潭师范学院学报:自然科学版,2005(9):124-127.

[4] Alex Aiken. A System for Detecting Software Plagiarism[EB/OL]. theory.stanford.edu/~aiken/moss/.

[5] Anany Levitin. 算法设计与分析基础[M]. 潘彦,译. 2版. 北京: 清华大学出版社,2007.

[6] 李文新,郭炜. 北京大学程序在线评测系统及其应用[J]. 吉林大学学报:信息科学版,2005,23(8):170-177.

The Teaching Exploration and Practice of Algorithm Analysis and Design base on Programming Contest

YANG Chun-ming, CHEN Nian-nian

(School of Computer Science and Technology, Southwest University of Science and Technology, Mianyang 621010, China)

常见的统计学分析方法第3篇

[关键词]梗阻性黄疸;早期诊断;治疗方法

[中图分类号] R442.4[文献标识码] A[文章编号] 1673-9701(2010)02-107-02

梗阻性黄疸主要由于肝外或胆内胆管部分性或完全性阻塞所引起,其病变涉及到肝脏、胆道、胰腺、十二指肠及

胆管周围等部位,由于梗阻性黄疸的病因较多,对表现不典型的病例早期诊断困难较大,因此正确判断梗阻部位和发病病因,是决定治疗方针和判定预后的重要依据。我院自2005年1月~2009年6月收治该类患者120例,均经手术、病理证实为梗阻性黄疸。现将临床表现、病因、实验室检查、影像学检查和治疗方法作回顾性分析,报道如下。

1资料与方法

1.1一般资料

本组梗阻性黄疸患者120例,男65例,女55例,年龄28~80岁,平均年龄59.5岁。其中恶性病例57例,良性病例63例,所有病例均经手术及病理证实。

1.2方法

对本组患者的临床表现、病因、实验室检查、影像学检查和治疗进行回顾性分析,统计学方法采用t检验或χ2检验。

2结果分析

2.1临床表现

黄疸为最主要的症状,入院时恶性疾病者血清总胆红素(TBIL)平均为(258.2±10.3)μmol/L,良性疾病者为(158.1±11.3)μmol/L,差异有显著性(t=5.326,P=0.000)。恶性患者血清碱性磷酸酶(ALP)水平为(536.9±13.5)U/L,良性患者为(405±18.3)U/L,差异有显著性(t=3.274,P=0.007)。恶性梗阻性黄疸的进行性黄疸、波动性黄疸、无痛、隐痛、绞痛、无热、高热及胆囊触及的发生率分别为89.5%、10.5%、36.8%、57.9%、5.3%、82.5%、5.3%、 50.8%,相应的良性梗阻性黄疸各症状的发生率分别为36.5%、63.5%、14.3%、22.2%、63.5%、23.8%、60.3%、17.4%,两组各症状发生率统计学分析显示差异有显著性(χ2=13.962,P=0.018;χ2=27.536,P=0.000;χ2=7.713,P=0.037; χ2=7.421, P=0.039;χ2= 38.136,P=0.000;χ2=8.436,P=0.031;χ2=35.468,P=0.000;χ2= 7.867,P=0.0036;),而两组的低热的发生率比较(12.3% vs 15.9%)无统计学意义(χ2=3.269,P=0.374)。

2.2病因

本组病例,恶性57例、良性63例。具体发病原因见表1。

2.3实验室检查

良、恶性梗阻性黄疸的实验室检查结果见表2。从表2可以看出恶性梗阻性黄疸血清胆红素>10.1mg的检出率明显高于良性梗阻性黄疸胆红素的检出率(40.4% vs 4.7%),统计分析显示差异有统计学意义(χ2=40.176,P=0.000);而两组谷丙转氨酶及碱性磷酸酶指标的变化统计分析显示差异没有统计学意义(各指标比较P值均大于0.05)。说明进行性升高的血清胆红素可作为鉴别良恶性梗阻性黄疸的鉴别指标。见表2。

2.4影像学检查

我们比较了B超、CT、磁共振胰胆管成像(MRCP)和内镜下逆行胰胆管造影术(ERCP),对导致梗阻性黄疸病因的提示作用(和最终诊断比较),结果为B超78.5%、CT 83.6%、MRCP 92.9%、ERCP 94.1%,可见MRCP、ERCP的准确性比B超、CT要高。

2.5治疗方法

对恶性患者,施胰腺、十二指肠切除术16例,不能切除者行胆囊或胆总管空肠吻合术41例。对于良性患者,胆囊结石切除胆囊,胆总管结石切开取石T型管引流,胆总管远端狭窄行胆总管十二指肠吻合术,胆总管囊肿行囊肿空肠吻合术。

3讨论

梗阻性黄疸是常见的临床现象,其发病原因甚多,大部分可经询问病史、体检及实验室检查作出临床诊断,导致梗阻性黄疸的主要原因仍是恶性肿瘤和胆石症,本组统计出发病顺序为:胰腺癌、原发性胆管癌、胆管结石、胆囊结石并胆管结石、壶腹周围癌及其他,可见胰腺癌已成为最重要的病因,其比例明显高于以往研究报道[1,2],这与胆管癌发病率的增高及诊疗手段的进步有关。恶性患者的黄疸程度常呈进行性加重,而良性疾病患者多有波动性,本文在良性疾病中有腹痛症状占85.7%,在恶性疾病中占63.2%,两者相比有统计学意义(P

[参考文献]

[1]唐植忠. 胆肠内引流术268例临床分析报告[J]. 中国医师杂志,2003,5(3):322-323.

常见的统计学分析方法第4篇

1对象与方法

1.1调查对象

本次调查对象采用分层整群抽样的方法选自某大学医学院女生700人,临床女生346人(占49.4%),护理女生354人(占50.6%),年龄18~25岁;大一182人,大二199人,大三197人,大四122人。研究对象纳入标准:在校大学生,既往无精神病史和严重疾病史,愿意参与本次研究者。

1.2调查工具

1.2.1大学生压力源问卷[1]

参考由陶琪编制的大学生压力源问卷,经预调查后变为25个条目,采用5级计分方式,每个条目得分在1~5分之间。

1.2.2简易应对方式问卷[2]

由解亚宁编制,共有20个项目,采用4级计分方式,分为积极应对和消极应对两个维度,1~12个条目为积极应对维度,13~20个条目为消极应对维度,该量表具有良好的信度和效度。

1.3调查方法

采用团体方式施测,于2010年4月12~15日发放问卷,测试时间约为10min,现场收回。发放问卷时收集一般人口学资料。本次共发放调查问卷720份,回收有效问卷700份,问卷回收有效率为97.2%。1.4数据处理将所有数据资料输入SPSS11.5forwindows软件进行统计检验和处理。采用一般描述性统计方法、t检验、方差分析及相关分析。

2结果

2.1护理系与临床医学系女生常见压力源分析用常见压力源得分运行描述统计分析,各项目得分在1~5分之间。压力源平均得分为(2.98±0.52)分,高于理论中值2.5分。不同专业间压力源平均得分:护理系为(2.94±0.54),临床医学系为(3.02±0.50),差异无统计学意义(t=1.905,P=0.057)。不同年级间压力源平均得分:大一为(3.017±0.54),大二为(3.019±0.47),大三为(2.983±0.50),大四为(2.93±0.57),差异无统计学意义(F=1.377,P=0.109)。

2.1.1护理系与临床医学系女生常见压力源排名前10位评分

护理系与临床医学系女生常见压力源大于3的条目得分及排序,见表1。2.1.2护理系与临床医学系女生常见压力源差异性分析将护理系与临床医学系女生常见压力源,运行独立样本t检验,进行比较,结果发现,在下列条目上差异有统计学意义。结果见表2。2.2护理系与临床医学系女生应对方式测试结果2.2.1应对方式描述性统计分析用简易应对方式得分运行描述统计分析,各项目得分在0~3分之间。得分大于等于2(有时采取)的项目包括:在生活中经受到挫折打击或遇到困难时可能采取的态度和做法:①与人交谈,倾诉内心烦恼(2.15±0.78);②尽量看到事物好的一面(2.11±0.80);③改变自己的想法,重新发现生活中什么重要(2.11±0.79)。这3个项目均为积极应对的条目。1.905,P=0.057)。不同年级间压力源平均得分:大一为(3.017±0.54),大二为(3.019±0.47),大三为(2.983±0.50),大四为(2.93±0.57),差异无统计学意义(F=1.377,P=0.109)。2.1.1护理系与临床医学系女生常见压力源排名前10位评分护理系与临床医学系女生常见压力源大于3的条目得分及排序,见表1。

2.1.2护理系与临床医学系女生常见压力源差异性分析

将护理系与临床医学系女生常见压力源,运行独立样本t检验,进行比较,结果发现,在下列条目上差异有统计学意义。结果见表2。

2.2护理系与临床医学系女生应对方式测试结果

2.2.1应对方式描述性统计分析

用简易应对方式得分运行描述统计分析,各项目得分在0~3分之间。得分大于等于2(有时采取)的项目包括:在生活中经受到挫折打击或遇到困难时可能采取的态度和做法:①与人交谈,倾诉内心烦恼(2.15±0.78);②尽量看到事物好的一面(2.11±0.80);③改变自己的想法,重新发现生活中什么重要(2.11±0.79)。这3个项目均为积极应对的条目。

积极应对方式平均得分为1.91±0.42;消极应对方式平均得分为1.19±0.48。

2.2.2应对方式差异性分析

护理系与临床医学系女生应对方式比较,差异无统计学意义。结果见表3。不同年级间应对方式比较,积极应对方式差异无统计学意义;消极应对方式差异有统计学意义,年级间的差异再经LSD两两比较,大一学生得分比大二、大三、大四都小。见表4。

2.3护理系与临床医学系女生压力源与应对方式的相关分析

积极应对方式与压力总分呈负相关(r=-0.273,P﹤0.01)而消极应对方式与压力总分呈正相关(r=0.336,P﹤0.01)。

3讨论

3.1护理系与临床医学系女生常见压力源分析

本次调查显示:竞争、就业、学业、家庭期望、经济压力成为护理系与临床医学系女生群体压力的主要来源,与查康[3]所调查的女大学生压力和姜海燕等[4]调查的医学院大学生压力事件比较相似。

3.1.1竞争、就业压力“想要获得奖学金或三好学生等荣誉”、“同学间的竞争较激烈”、“毕业找工作很难”分别排第1、4、8位。当今时代的一个重要特征就是竞争加剧,整个社会处于激烈竞争之中。由于连续多年的扩招加大了大学生竞争就业的力度,也是形成大学生诸多压力中最主要的压力源。

3.1.2家庭期望“家人对我的期望较高”排第2位。此条目得分在4以上的被调查者有494人,占70.6%。即70.6%的女大学生觉得承载家长高期望值是形成她们心理压力的主要来源之一。

3.1.3经济压力“每年要交纳的学费和住宿费较多”、“找不到合适的挣钱机会”、“家庭经济比较困难”分别排第3、7、10位。学生上学的费用一般来自家庭,由于近年来社会的发展和生活水平的变化,大学所需费用明显提高。特别是对于来自农村和城市低收入家庭的学生来说则影响更大,他们不仅要面对每年上万元的学费和生活费,而且她们都是女生,普遍具有爱美心理,要经受更多的物质上的诱惑,再加上部分同学间消费的相互攀比,也会使她们产生很大的压力。

3.1.4学习压力“上课时有的内容听不懂”、“学业任务繁重”、“想好好学但学不进去”分别排第4、6、9位。主要由于医学课程偏重理科,对于女生来说,若想学好,必须付出比男生更多的努力[5]。还有部分学生感到所学专业非所爱,使她们长期处于冲突与矛盾痛苦之中。

3.2护理系与临床医学系女生常见压力源差异性分析

3.2.1临床医学系女生在“毕业找工作很难”、“所学的专业就业前景不乐观”感受的压力比护理系女生要大。目前各高校毕业生就业压力都比较大,其中医学院校的临床医学系女生就业压力尤其显著。医科院校本科生的就业单位一般是基层一级医院、较偏远地区的二级医院、社区医院,内心期望值和现实有很大差距。要想分配到较大的二甲或三甲医院,必须要优秀硕士研究生毕业或博士毕业。而临床医学的学制是五年,女大学生本科毕业时平均年龄都要比其他专业的毕业生大1~2岁,再则有相当一部分学生家庭经济又比较困难,所以她们在就业与读研之间难以抉择。而护理专业的学生学制是四年,本科毕业基本都能在二甲或三甲医院就业。因此,临床医学系女生比护理系女生就业压力要大。

3.2.2临床医学系女生在“学业任务繁重”、“家人对我的期望较高”上感受的压力比护理系女生要大。临床医学系比护理系学生的学业任务繁重,这是客观存在的现象;“家人对我的期望较高”,这可能与社会对临床医学与护理这两个专业的职业认同不一样,一般观点认为临床医学的发展空间要比护理大有关。

3.2.3护理系女生在“不知道将来适合什么工作”上感受的压力比临床医学系女生要大。通过问卷以及与学生的交流表明,护理系的学生尽管在就业上存在的压力不大,但有相当一部分护理学生不热爱护理专业,对专业的认同感不强,毕业后不想从事护理专业,想改行,可又不知适合或能找到什么样的工作。这与我国现阶段本科毕业的护士与大专、中专毕业的护士所干工作一样,她们感到体现不出自我价值有关。这一点提示我们,在对学生的教学与管理中,要加强对学生的职业观教育。也希望有关部门尽早制定法律法规,使护士能按层次、按职称上岗。

3.2.4护理系女生在“家庭经济比较困难”上感受的压力比临床医学系女生要大。这与护理系女生贫困学生所占比例较大有关。由于本科护理学生与临床医学女生相比,学制短一年,毕业后较易找工作,在招生时就吸引了较多的贫困学生。我校临床医学系贫困生大约占到30%~40%,而护理系贫困生大约占到50%左右。

3.2.5护理系女生在“自己的外形不够理想”、“缺乏与异性同学交往的方法”方面感受的压力比临床医学系女生要大。这可能与护理学生为女性单一性别群体,在平时学习、集体活动中缺乏异性同学间的互动和交流,而她们正处于“青年期”[6]渴望与异往,因此对自己的外形和与异往的方法关注较多有关。觉得“自己的外形不够理想”还可能与护理系学生在求职应聘时,用人单位比较注重学生的身高,长相有关。

常见的统计学分析方法第5篇

摘 要:随着我国经济发展水平的不断提高,各行各业得到了显著发展,数据统计学方法也变得日趋多样,数据挖掘是建立在数据库与人工智能基础上发展起来的一种高新技术,其功能是从众多的数据当中挖掘到最有价值的信息,进而实现对数据资源的高效利用。聚类分析能够被当成一种数据分析工具,能真实反映出数据分布情况,本文主要对统计学在数据挖掘中的应用进行了探讨,从而表现统计学在数据挖掘应用中的重要性。

关键词:统计学方法;数据挖掘;应用分析

数据挖掘就是指从众多实际应用数据中获取批量大、有噪声、且随机性强的数据,将潜在的信息与数据提取出来,就是从数据中挖掘有价值的知识,而大多数原始数据具有一定的结构化特征,比如,关系数据库中的数据;也可以通过文本、图形、图像等半结构化发掘有用知识,这些知识可以是数学的也可以是非数学形式的;数据挖掘能以归纳形式存在,能够被广泛应用到信息查询、信息管理、信息决策控制中,方便数据的维护与管理。由此可见,数据挖掘是一门交叉性强的学科,加强对其的研究非常有意义,下面将对统计方法在数据挖掘中的具体应用进行分析。

一、数据挖掘与统计学的关系

(一)数据挖掘的内涵

通常来说,数据挖掘的定义较为模糊,没有明确界定,大部分对其的定义只是停留在其背景与观点的内容上。通过对不同观点的统一整理,人们最终将其描述为:从大量多样化的信息中发现隐晦性、规律性等潜在信息,并对这些信息进行创造、加工的过程。数据挖掘作为一门重要的交叉学科,能够将数据库、人工智能、机器学习、统计学等众多的科学融入到一起,从而实现技术与理论的创新与发展[1]。其中,数据库、人工智能与统计学是数据挖掘当中的三大支柱理论。数据挖掘的目的是从数据库当中发掘各种隐含的知识与信息,此过程的方法非常多,有统计学知识、遗传算法、粗集方法、决策法、模糊逻辑法等,还可以应用向邻近的可视技术、模式识别技术等,在以上所有技术的支持上能够使数据挖掘更为科学、有序。

(二)数据挖掘与统计学间的关系

通常来说,统计学的主要功能是对统计原理与统计方法进行研究的科学。具体来说就是指对数字资料进行的收集、整理、排序、分析、利用的过程,数字资料是各种信息的归纳与总结,可以将其作为特性原理的认知、推理方法[2]。而统计学则表示的是使用专业的统计学、概率理论原理等对各种属性关系的统计与分析过程,通过分析成功找到属性间的关联与发展的规律。在此过程中,统计分析方法是数据挖掘最为重要的手段之一。

在数据挖掘这一课题被提出来之前,统计分析技术对于人们来说更熟悉,也是人们日常开展工作、寻找数据间规律最常使用的方法。但是不能简单的将数据挖掘作为统计学的延伸与替代工具,而是要将两者的区别认识到位,再结合两者间的不同特点分析其应用特点[3]。大部分的统计学分析技术都是建立在数学理论与技巧上的,预测通常较为准确,效果能够让大部分人满意。数据挖掘能够充分借鉴并吸收统计学技术,在融入到自身特点以后成为一种数据挖掘技术。

统计学与数据挖掘存在的目标都是一致的,就是不断对数据结构进行发掘。鉴于统计学与数据挖掘在目标上的一致性,致使很多研究学者与专家将数据挖掘作为了统计学的一个分支机构[4]。但是这种认知非常不正确,因为数据挖掘不仅体现在与统计学的关系上还体现在思想、工具与方法上,尤其是在计算机科学领域对数据挖掘起到的作用非常大。比如,通过借助数据库技术与人工智能的学习,能够关注到更多统计学与数据挖掘上的共通点,但是两者存在的差异依然非常大。数据挖掘就是指对大量的数据信息不断挖掘的过程,DM能够对数据模式内的数据关系进行充分挖掘,并对观测到的数据库处理有着极高的关注度。

二、数据挖掘的主要过程

从数据本身出发探讨数据挖掘过程,数据挖掘的过程分为信息的收集、数据集成、数据处理、数据变换、数据挖掘实施等过程。

首先,要将业务对象确定下来,明确不同业务定义,并认清数据挖掘的目的,这是做好数据挖掘最关键的一步,也是最重要的一步,虽然挖掘的结果不能被准确预测到,但却需要对问题的可预见性进行探索[5]。其次,还要做好数据准备工作,包含数据清理、数据变换等工作,数据清理的实际意义是将噪声与空缺值补全,针对这一问题,可以使用平滑技术,而空缺值的处理则是属性中最常见的,可以将统计中最可能出现的值作为一个空缺值[6]。

信息收集指的是按照特定的数据分析对象,可以将分析中需要的特征信息抽象出来,并在此基础上选择出较为科学、适合的信息收集方法,将全部的信息全部录入到特定的数据库中。如果数据量较大,则可以选择一个专门的管理数据的仓库,实现对信息的有效保护与管理;数据集成就是指将来源不同、格式不同、性质不同、特点不同的数据集成到一起,进而为企业提供更为全面、系统的数据共享平台;数据变换就是通过聚集、概化、规范化等方式对数据进行挖掘,对于一些实用数据,则可以通过分层与分离方式实现对数据的转换;数据挖掘就是结合数据仓库中的数据信息点,并选择正确的分析方法实现对有价值数据的挖掘,事例推理、规则推理、遗传算法等都是应用较多的方法[7]。

三、统计学方法中的聚类分析

在统计学聚类方法基础上能够构建出潜在的概率分布假设,可以使用试图优化的方法构建数据与统计模型的拟合效果。基于统计学聚类方法当中,Cobweb方法是在1987年由Fisher提出的,能够以分类树作为层次聚类创建的方法,在分类树上,每一个节点都能代表着一个概念,该方法就是对节点概率描述的过程。Cobweb方法还使用了启发式估算方式,使用分类效用对分类树的构建进行指导,从而实现对最高分类的划分目的,能够将不同分类对象全部归类到一个类别中,并依据这些内容创建出一个新的类别。但是这种方法也存在一定局限性,局限性在于假设的属性概率分布都是独立的,并不能始终处于成立状态中。

只有在掌握了Cobweb算法以后才能对概念聚类算法的特点进行探究。Cobweb算法能够以分类树方式创建层次聚类,可以将概率表现为p(Ai=Vii/Ck)条件概率,其中,Ai=Vij是一个类别下的,同属于一个值对,Ck是概念类中的一种。在给出一个特定的对象以后,Cobweb能够将全部对象整合到一个节点上,从而计算出分类效应,分数最高的效用就是对象所在的节点位置[8]。如果对象构建失去节点,则Cobweb能够给出一个新的节点,并对其进行分类使用,这种节点计算方法起步较晚,能够对现有的节点与计算相互对比,从而划分出最高的分类指标,将全部对象统一到已有的分类中,从而构建出一个新的类别。

Classitci是Cobw eb方法的一种延伸与发展,能够使用其完成聚类数据的处理,在该方法下,节点中的每一个存储属性都是处于连续分布状态中,能够将其作为分类效果修正的方法,并以度量的形式表现出来,这种度量基础上能够实现连续性的积分,从而降低分散发生率,该方法是积分过程而不是对属性的求和过程。

Auto Class方法也是一种应用较为普遍的聚类方法,该方法主要采用统计分析对结果类的数目进行估算,还可以通过模型搜索方式分析空间中各种分类的可能性,还能够自动对模型数量与模型形态进行描述。在一定类别空间中,不同的类别内属性存在关联性,不同的类别间具有相互继承性,在层次结构当中,共享模型参数是非常重要的。

还有一种使用较为普遍的模型是混合模型,混合模型在统计学聚类方法上使用也非常普遍。该方法最为基本的思想就是概率分布决定着每一种聚类状态,并且模型中的每一个数据都是由多个概率在分布状态下产生的。混合模型还能够作为一种半参数密度评估方法,其能够将参数估计与非参数估计的优点全部集中到一起,并将参数估计法与非参数估价法的诸多优点融合到一起,因为模型具有一定复杂性,为此,不能将其限制在概率密度函数表达形式上,这种复杂性决定了模型与求解存在关联,与样本集合的联系非常少。通过以上的研究可以了解到,数据发掘中应用聚类方法非常有效,并且较为常见。比如,构建出Cobweb模型与混合模型,采用Clara与Clarans方法中的抽样技术,将Denclue方法用在概率密度函数中。

结束语

统计学方法自产生开始已经有非常久远的历史,将严谨的数学逻辑作为基础,将分类算法假定作为独立条件,属性值之前能够相互保持独立,对假定进行计算,当假定成立时,可以再与其他分类算法进行对比,这种分类算法准确性非常高。为此,其不仅能够对连续值进行预测,还可以通过线性回归方程对系数进行比较,从而归纳出结果。

(作者单位:中国人民大学)

参考文献:

[1] 张爱菊.基于数据挖掘技术的瓦斯气体红外光谱定量分析方法的研究[J].光谱学与光谱分析,2013,33(10):2646-2650.

[2] 许长福,李雄炎,谭锋奇等.任务驱动数据挖掘方法的提出及在低阻油层识别中的应用[J].吉林大学学报(地球科学版),2012,42(1):39-46.

[3] 郑晓峰,王曙.基于粗糙集与关联规则的道路运输管理信息数据挖掘方法[J].华南理工大学学报(自然科学版),2014(2):132-138.

[4] 周复之.固定收益决策支持系统机理建模与数据挖掘的协同研究[J].系统工程理论与实践,2010,29(12):38-45.

[5] 张继福,张素兰,蒋义勇等.基于约束概念格的天体光谱局部离群数据挖掘系统[J].光谱学与光谱分析,2011,29(2):551-555.

[6] 张欣欣,缪弈洲,张月红等.CrossRef文本和数据挖掘服务――《浙江大学学报(英文版)》的实践[J].中国科技期刊研究,2015,26(6):594-599.

常见的统计学分析方法第6篇

[关键词]淋证;中医传承辅助系统;组方规律;中医方剂大辞典

淋证是以小便频、急、涩、痛为特点的病证[1],多见于现代医学的尿路感染、泌尿系结石、肾盂肾炎、前列腺炎、膀胱炎、泌尿系结核等疾病,为临床常见、多发病证。目前临床尚没有统一的分类方法,为其临床诊断和治疗经验的总结带来了许多不便。我国历代中医药文献中记载了大量淋证治方,对这些文献资料进行挖掘并总结其用药规律、组方特点,不仅可以为淋证的临床治疗提供借鉴,而且可为淋证病机的认识提供重要数据信息。

“中医传承辅助系统”是中国中医科学院中药研究所与中国科学院自动化研究所联合开发的集数据录入、数据管理、数据查询、数据分析等为一体[2]的数据统计分析软件,可根据方剂数据集发现用药规律,确定用药模式和用药规则,采用聚类算法获取新方剂[3],为方剂组方规律分析及新药处方发现等提供了便捷快速的统计分析工具[4]。本文运用该软件对《中医方剂大辞典》治疗淋证的方剂用药规律进行系统分析。

1 材料与方法

1.1 处方筛选及录入

从《中医方剂大辞典》中筛选“主治”项中明确记载治疗淋证的方剂,剔除其中组成重复的方剂,得到673首,录入“中医传承辅助系统(V1.1)”。该系统软件由中国中医科学院中药研究所杨洪军研究员提供。

1.2 数据分析

通过“中医传承辅助系统”中“数据分析”模块中“方剂分析”功能,进行组方规律分析。首先在“中医疾病”项中输入“淋”,提取出治疗淋证的全部方剂;其次进行药物使用的频次统计,将所有方剂中每味药物的出现频次从大到小进行排序;再次进行方剂组方规律分析,将支持度个数设为35(支持度个数表示至少在35首方剂中出现,支持度为5.2%,即某2味药物A和B同时出现的概率),置信度设为0.6(表示A药物出现时B药物出现的概率,本参数越接近1,A出现后B出现的几率越高),按照药物组合出现频次从大到小的顺序进行排序;并进行“规则分析”,即分析所得组合的规则;最后利用聚类分析(核心算法包括改进的互信息法[5]、复杂系统熵聚类[6])进行新方分析,选择合适的相关系数(衡量强相关和弱相关,本文为8)和惩罚系数(指改进互信息用的惩罚因子,本文为5),然后点击“提取组合”按钮,发现新组方(核心算法是无监督的熵层次聚类[7])。

2 结果

2.1 用药频次

《中医方剂大辞典》中治疗淋证的673首方剂包含442味中药,进行频次统计得到治疗淋证使用频次在50以上的药物有22味,见表1。

统计结果显示,治疗淋证使用频次高的药物以利水通淋药为多,其中主要是清热利水通淋之品,表明热淋为淋证的主要类型,临床较常见,反映了湿热结聚膀胱为淋证的主要病因病机。从表1还看出,清热凉血药的使用频次也较高,表明血淋临床也常见。

《诸病源候论・淋病诸候》说:“血淋者,是热淋之甚者。”可见热淋可以发展成血淋。另外,使用频次较高的还有益气养阴药,提示淋证之邪易伤气、阴,常致气虚阴亏之证。

2.2 基于关联规则apriori算法组方规律分析

根据本文所筛选的治淋方剂数量和药味数,结合经验判断以及不同参数提取数据预读,以支持度个数35从组方中提取出34个常用药对,5个3味药物的核心组合,见表2。

从表2看出,使用频次较高的药物组合以清热利水通淋药为主,这与常用药物的统计结果一致。并体现出阴虚者配伍清热养阴药、血热者配伍清热凉血药、湿热较盛者配伍清热燥湿药的配伍特点。

2.3 基于熵方法的新方分析

根据所得治疗淋证方剂数目,并结合经验判断和不同参数提出数据的判读,选择相关系数为8,惩罚系数为5,进行熵方法聚类分析。

2.3.1 基于熵方法聚类的核心组合分析 按照上述相关系数和惩罚系数的约束,基于熵方法聚类,挖掘出可能为隐性规律的3~5味药的核心组合63组,见表3~4。该分析结果不仅体现了运用关联规则apriori算法而得到的组方规律,而且发现活血行气药的使用较为常见,提示气滞血瘀在淋证病机中占有重要地位。古人对淋证与气血运行阻滞有关已有阐述,刘河间云:“淋,小便涩痛也,热客膀胱,郁结不能渗泄故也……热客于肾部,干于足厥阴之经,廷孔郁结极甚,而气血不能宣通,则痿痹而神无所用。”(《素问玄机原病式・六气为病》)在治则上朱丹溪提出“流行滞气”(《丹溪心法・淋》),尤在泾认为“其膏沙石淋,必须开郁行气,破血滋阴方可”(《金匮翼・诸淋》)。关于淋证病机张景岳指出与“积蕴热毒”有关(《景岳全书・杂证谟・淋浊》),这在隐性规律核心组合中泻热解毒药的使用相吻合。

2.3.2 基于熵方法层次聚类的新处方分析 在以上核心组合提取的基础上,通过无监督的熵层次聚类算法,得到用于新方聚类的组合后,进一步组合得到13个新处方,见表5。

运用熵层次聚类算法得到的新处方所主证候较多,有气血阴阳之异、虚实寒热之别。其中1号方和11号方主要由清热利水通淋药组成,热淋、血淋及石淋之实证可选用之;13号方重在养血滋阴,用于膏淋、劳淋之虚证较为合拍;10号方重在温补,肾阳虚者可用;4号方能行滞气,2号方能活血,7号方功可解毒,临床可辨证使用;8号方则能安神,劳淋之心劳常伴见心神不宁之症,使用此方可谓对证。

3 讨论

淋证为临床常见的肾系病证之一,自《内经》首载淋之名称后,历代医家对其症状表现、证型分类、病因病机、诊断治疗作了深入研究和总结,积累了丰富经验,创制了大量有效方剂,为大家今天研究、开发治淋新法新药奠定了扎实的理论基础并提供了宝贵的临床资料。

《中医方剂大辞典》系统整理了我国上自秦、汉,下迄现代(1966年)具名方剂[8],对其中治淋方剂进行科学的统计分析,可以挖掘中医古今治疗淋证的用药经验。“中医传承辅助系统”软件一方面采用规则分析,可实现以频次为核心的显性经验分析,利用该软件分析得到治淋方剂中各味中药的使用频次,利用集成于系统中的apriori算法,选取合适的支持度,可提取出治疗淋证2~5味的常用药物组合。借此不仅可以了解治疗淋证的常用药物及其配伍特点,而且可以把握淋证的常见证候及辨证治疗规律。另一方面“中医传承辅助系统”软件中“新方分析”模块集成的熵方法,可提取低频次高相关的药物组合,实现对组方中隐性规律的发现,包括隐性药对、隐性核心组合药物之间关联性的定量描述、核心药物组合演化与提取、新处方发现等[2]。分析这类结果,笔者不仅可能得到对淋证病机的新认识,而且通过新方设计,可为淋证新药研发提供有益线索。

本文运用以上分析方法,发现古今临床治疗淋证使用频次最多的中药是清热利水之品,该结果说明热淋为临床常见证型。从清热凉血药的高频次使用看,淋证患者中血淋的发病率很高。另外,益气养阴药的使用频次也较高,说明淋证患者气阴易耗,正虚邪实病机多见。

从熵方法聚类挖掘出的可能为隐性规律的3~5味药的核心组合看,活血行气、化痰解毒药的使用也不容忽视,应当根据临床实际并结合不同淋证分型的病机特点加以合理运用。

通过无监督的熵层次聚类算法得到13个新处方,以方测证,这些新处方所主证候有虚实寒热之别、气血阴阳之异,与临床实际相吻合。这为新药研发提出了有益的启示。

[参考文献]

[1] 颜平.淋证的命名体系及分类模式[J].辽宁中医药大学学报,2007,9(5):25.

[2] 李健,卢朋,唐士欢,等.基于中医传承辅助系统的治疗肺痈方剂组方规律分析[J].中国实验方剂学杂志,2012,24(2):254.

[3] 卢朋,李健,唐仕欢,等.中医传承辅助系统软件开发与应用[J].中国实验方剂学杂志,2012,18(9):1.

[4] 唐仕欢,卢朋,李健,等.《中医方剂大辞典》中治疗哮病方剂组方规律分析[J].中医杂志,2012,53(14):1230.

[5] 杨洪军,赵亚丽,唐仕欢,等.基于熵方法分析中风病方剂中药物之间的关联度[J]. 中国中医基础医学杂志,2005,11(9):706.

[6] 唐仕欢,陈建新,杨洪军,等.基于复杂系统熵聚类方法的中药新药处方发现研究思路[J].世界科学技术――中医药现代化, 2009,11(2):1294.

[7] Yang Hongjun,Chen Jianxin,Tang Shihuan,et al.New drug R&D of traditional Chinese medicine――role of data mining approaches[J].J Biological Sys,2009, 17(3):1294.

[8] 彭怀仁.中医方剂大辞典. 第1册[M].北京:人民卫生出版社,1993.

Analysis on composition principles of prescriptions for stranguria

in dictionary of traditional Chinese medicine prescription

SUN Jing-chang*, WANG Miao-miao

(Shandong University of Traditional Chinese Medicine, Ji′nan 250355, China)

[Abstract] By using traditional Chinese medicine inheritance support system to analyze the dominant experience and recessive principles of the prescriptions for stranguria in the dictionary of traditional Chinese medicine prescription (DCMP), we aim to define the medication pattern and rule and to acquire new prescriptions. In dominant experience analysis, we were able to find 22 drugs used over 50 times, including drugs of clearing heat, diuresis and relieving stranguria which are the most used and drugs of clearing heat, cooling blood, benefiting Qi and nourishing Yin. In addition, drugs of activating Qi and Xue, eliminating phlegm and removing toxic are often used, including 34 herb pairs and 5 combinations of three-taste drugs are used more than 35 times. These results fully reflect the composition principles and compatibility characteristic of prescriptions for treating stranguria in DCMP. Thirteen new prescriptions by way of recessive principle excavating were acquired. These new prescriptions might be suitable to clinical treatments of variable syndromes. This article provides an useful clue to research and produce new drugs.

常见的统计学分析方法第7篇

[关键词] 糖尿病;血脂检验;临床意义

[中图分类号] R587.1 [文献标识码] A [文章编号] 1672-4062(2016)12(a)-0110-02

糖尿病是一种可由遗传、环境等因素影响而形成的代谢性疾病,患者在患病后会出现多饮、消瘦、多食、多尿或疲乏、肥胖等临床表现,以此对患者的正常工作、生活都会造成一定的负面影响[1]。而患者在糖尿病长期存在的影响下,还极有可能致使其心脏、肾脏、血管等都受到严重损害,并由此直接提高了心血管严重疾病的发生概率,及早发现与控制患者的血糖水平是治糖尿病的有效对策[2]。血脂检验是现阶段临床上较为关注的一项定量检验方法,其在针对糖尿病患者应用中可见存在着一定的应用价值。该次研究中通过对该院实施血脂检验的部分糖尿病患者进行观察,旨在以此探究血脂检验对糖尿病的临床应用意义,现于下文中详列观察过程与结果,现报道如下。

1 资料与方法

1.1 一般资料

该次研究以分组观察形式进行,其观察对象选择为2015年2月―2016年2月期间于该院进行血脂检验的45例糖尿病患者与45名健康志愿者,将其按照身体健康状况分为糖尿病组与志愿者组。在糖尿病组中有男性26例,女性19例;最低年龄为34岁,最高年龄为79岁,平均年龄为(56.13±5.64)岁。在志愿者组中有男性28名,女性17名;最低年龄为33岁,最高年龄为79岁,平均年龄为(57.04±5.32)岁。应用软件分析两组观察对象性别、年龄等一般资料,差异无统计学意义(P>0.05),组间可实施对比。

1.2 方法

该次研究中需采集两组检查者静脉血液作研究分析,其采集过程如下:血样采集前3周内需嘱咐观察对象停止使用降血脂血糖等影响血脂水平药物,并需维持正常饮食习惯。血样采集前1 d,需要求患者于检查前12 h内实施禁食,然后抽取检查者4 mL清晨空腹状态下的静脉血液置于干燥、清洁的试管当中,并对其血液作常规血清分离措施。之后通过生化分析仪与原装配套试剂对采集血清作检测与分析,测定指标需取3次计算平均后的计算值,以此确保以最大限度减少检测数据误差。

1.3 观察指标

该次研究需以观察对象血清水平检查中高密度脂蛋白(HDL-C)、低密度脂蛋白(LDL-C)、总胆固醇(TC)、三酰甘油(TG)、载脂蛋白A1(APoA1)、载脂蛋白B(APoB)作为观察比较指标。还要以《中国成人血脂异常防治指南》作为标准以判断观察对象是否存在血脂异常情况,当观察对象血清水平中分别出现TG含量>2.26 mmol/L、TC含量>6.22 mmol/L、LDL含量>4.14 mmol/L、HDL含量>1.55 mmol/L等情况或存在多项指标异常时,则可判定其存在血脂异常[3]。

1.4 统计方法

为保障该次研究的科学合理性,需将观察汇总数据录入SPSS 20.0统计学软件中实施统计学分析。其中可应用(x±s)对计量资料进行表示,并经t处理获取检验值,计数资料则需应用百分比(%)进行表示,并经χ2处理获取检验值。P

2 结果

2.1 两组血脂水平观察指标比较

经分析两组观察对象采集血清后可知,糖尿病组其HDL-C检验含量为(0.84±0.23)mmol/L、其LDL-C检验含量为(5.67±0.71)mmol/L、其TC检验含量为(5.85±0.82)mmol/L、其TG检验含量为(2.91±0.70)mmol/L;志愿者组其HDL-C检验含量为(1.87±1.19)mmol/L、其LDL-C检验含量为(2.39±0.59)mmol/L、其TC检验含量为(3.79±0.66)mmol/L、其TG检验含量为(1.87±0.81)mmol/L。经比较可见糖尿病组其LDL-C、TC、TG此3项检测指标含量明显高于志愿者组,而其HDL-C检测含量则明显低于志愿者组,其各项数据经软件处理后可见结果,差异有统计学意义(P

2.2 两组脂蛋白检验情况比较

汇总数据表明,该次研究中糖尿病组其APoA1检验含量为(0.80±0.24)mmol/L,其APoB检验含量为(1.84±0.22)mmol/L,志愿者组的APoA1检验含量为(1.25±0.19)mmol/L,其APoB检验含量为(1.23±0.17) mmol/L。对比可见两组对象检查指标数据存在较大差异,其处理获得结果,差异有统计学意义(P

常见的统计学分析方法第8篇

中图分类号:G71 文献标识码:A 文章编号:1672-3791(2016)10(c)-0000-00

医学统计学是运用概率论与数理统计的原理和方法研究医学科研中的有关数据的收集、整理、分析和推断应用性学科[1],也是提高医学高等院校学生水平的必修课程。为了了解本校此门课程的教与学的效果,给教学和制卷工作提供重要的反馈信息。本文通过对2013级选修此门课程学生的期末考试试卷进行分析,希望借此评价试卷质量,了解各专业学生知识的掌握程度,为进一步提高教学质量和制卷水平提供参考。

1. 材料和方法

1.1 材料

我校2013级本科生选修《医学统计学》的学生期末考试试卷,采用整群抽样的方法,从中选取了3个专业5个班级,共188分试卷。试卷严格遵守教学大纲和教材,注重对学生基本知识、基本理论、基本技能的考核,并注重对学生简单应用能力的考核。

1.2方法

试卷分析采用目前国内较为常用的指标,包括试卷信度、难度、区分度等指标[2-4]。

信度是指考试的可靠性或可信程度,它指的是采取同样的方法对同一对象重复进行测量时,其所得结果相一致的程度。从另一方面来说,信度就是指测量数据的可靠程度。信度高的试题很少受到外部因素的影响,对不同学生的多次测试都会产生相对稳定和一致的测试结果。

常用的信度指标为Cronbach’α系数,计算公式为。k为测试的题目个数, 为所有被试者在第i道题上的分数变异, 为测试总分的变异。

难度是指试题的难易程度,它作为衡量试题质量的主要指标之一,是衡量试题质量的一个重要指标参数,与区分度共同影响并决定试卷的鉴别性。难度的计算一般采用某试题的通过率或平均得分率。较好的测验大部分的难度P值应介于0.2~0.8之间。

难度的计算方法为:

客观题 (k为答对该题的人数,N为参加考试的总人数)

主观题 (x为试题的平均得分,M为该题的满分)

为进一步计算区分度采用极端分组法计算难度,其具体步骤为:1、将考生的总分由高到低排列;2、从高分开始向下取全部试卷的27%(即188*27%=50份)作为高分组;3、从最低开始向上取全部试卷的27%(即188*27%=50份)作为低分组;4、分别计算出高分组的难度PH及低分组的难度PL;5、最后计算出PH和PL的平均值

区分度是指一道题能多大程度上把不同水平的人区分开来,也即题目的鉴别力。区分度越高,越能把不同水平的受测者区分开来,该题目被采用的价值也就越大。区分度D的取值范围-1~1。一般要求试题的区分度在0.2以上。当D>0.4时,说明该题目能起到很好地区分作用;当D

1.3统计分析

利用SPSS 18.0统计软件和ExcelΤ杉ǖ姆植继卣骷笆跃淼男哦取⒛讯取⑶分度等指标进行统计分析。

2.结果

2.1 试卷内容与结构

本张试卷内容涵盖了医学统计学的基本概念、t检验、方差分析、卡方检验、秩和检验、相关和回归分析等。由选择题、名词解释、简答题、案例分析等部分组成,题量与分值设置见表1

2.2考试成绩的基本分布特征

用SPSS18.0统计软件对总分进行统计描述。结果显示考试成绩呈负偏态呈分布,参加考试188名学生中,最高分96分。最低分43份,平均分74.63分。各分数段人数见表2

2.3各专业成绩比较

本次调查共选出3个专业共5个班级,各专业考试成绩见表3

由表可见三个专业的学生考试成绩差别有统计学意义(F=25.87,P=0.000)。两两比较发现营养专业与护理专业分数有统计学意义(P=0.000)与中医班分数也有统计学意义(P=0.000)。

2.4试卷质量分析

2.4.1 信度分析利用Excel作信度分析,得到本卷的Cronbach’α系数为0.73。普通试卷要求α>0.5,标准试卷要求α>0.7,说明整体考试结果可以信赖,该试卷能够反映学生的真实能力。

2.4.2 难度与区分度分析 分别计算各种题型的难度系数和区分度,结果见表4。四种题型的难度均介于0.2~0.8之间,试卷整体难度为0.74,难度适中。其中案例分析题难度最大,名词解释难度最小。试卷总体区分度为0.31,其中简答题区分度为0.150.4,优秀,整体试卷质量较好。

2.4.3试卷质量分析运用教育测量学理论,计算所有试题的难度系数和区分度对试题质量进行综合分析,结果见表5。本试卷良好试题占比为66.6%,可以认为试卷质量比较令人满意。

3.讨论

由试卷质量的分析可见本套试卷信度指标Cronbach’α系数为0.74,可信度较高,试卷较真实地反应了学生的真实情况;难度系数0.74、区分度0.31。试卷难度设计适当、覆盖面广,试卷质量较高。但是在制卷过程中还有需要注意的地方。名词解释的题型对于学生考核的区分度不高,学生也较易得分。这由于部分学生在应试的过程中主要是通过死记硬背的方法,因此并不能很好的反应学生真实掌握的情况。需要在以后的制卷工作中加以调整。

此次考试学生发热平均成绩为74.63±12.20,成绩曲线成负偏态分布,从学生成绩看有接近40%的同学在80分以上,取得了较理想的分数,从中反映出这些同学对于基本知识、概念掌握较好并且能灵活应用解决实际问题。但也有部分同学成绩较差,主要原因是案例分析题失分较多,这反映出这部分同学虽然对基本概念和知识掌握较好,但是对统计分析方法的运用以及解决实际问题的能力还有待提高。通过不同专业学生成绩的比较,我们发现营养专业的学生获得了更加理想的成绩。这部分得益于我们新的教学尝试,对于营养专业的学生我们在讲授理论课的同时适时的增加了SPSS软件操作步骤和结果解读的讲解。更丰富也更接近实践的锻炼有效的提高了他们灵活运用统计知识解决实际问题的能力。

对于提高解决实际问题的能力,我们认为将理论课与SPSS实践相结合,教学过程中甄选案例,适时的补充SPSS软件的操作步骤和对结果的解读将会取得不错的教学效果。这样的方法可以帮助学生从繁杂的公式记忆和计算工作中解脱出来,从而使其注意力转移到对统计学方法的应用条件的理解和对统计结果的判断上,角色从计算的执行者转变成为对结果的决策者。让同学们充分体会到统计学解决问题后所带来的快乐和成就感,有助于提高学生对医学统计学的学习兴趣及动手能力、实际解决问题能力的提高。

参考文献

[1]孙振球.医学统计学[M].北京:人民卫生出版社,2010:1.

[2]许志强,周华东,李静等.试卷分析系统在神经病学教学中的应用[J].重庆医学,2010(10):1311-1312.