文档库

最新最全的文档下载
当前位置:文档库 > 实验数据的SPSS分析

实验数据的SPSS分析

实验数据的统计处理

学院:生命科学与技术学院 专业班级:生物医学工程200605班 学生姓名:徐健 指导老师:万影 教授

U

n R

e g

i s

t e

r e

d

摘要

本文综述了统计学的发展史以及统计软件的发展史及其现状,重点介绍了现代统计学的发展历程。然后详细介绍了本文所使用的统计软件Statistical Product and Service Solutions(SPSS),又简要介绍了其他几种国际上比较常用的统计学软件,并将SPSS 与这几种软件进行了简要的对比,突出SPSS 的优越性:SPSS 具有良好的界面,不需要太多的编程,只需要通过简单的菜单操作即可完成复杂的统计任务。它的结果输出直观,对于各类统计问题处理具有较高的应用价值。另外,学术论文中出现的数据和图表,如果是经由SPSS 分析得出的,可以不给出算法,由此可见SPSS 的权威性。

本文以无机/有机叠层复合支架的体外降解行为实验为例,详细介绍了如何

用SPSS 统计软件对其实验结果数据进行Analysis of variance (ANOV A)分析。由

于实验中同组实验都做了4次,所以在进行方差分析之前先进行了描述性统计分

析,再利用描述性统计分析的数据进行方差分析,可以减少实验误差。在此实验

中,由于人工制备支架为3层结构,在不同的层使用不同含量的PLGA 和

Nano-HA ,多项参数会影响支架的最后的性能。利用本实验所得到的支架失重比及pH 值变化的等数据,在SPSS 中进行ANOV A 分析所得到的结果显示第2层

中PLGA 用量和Nano-HA 用量的变化对支架失重比的增加起主要作用的几率为95 %;第3层PLGA 用量和Nano-HA 用量的变化对支架体外降解的pH 下降起主要作用。

关键词:SPSS; 方差分析; 数据处理; 复合支架

U

n R

e g

i s

t e

r e

d

This paper basically documented the development and status of the statistics and statistical software, focusing on the development history of modern statistics. The software SPSS that used in the paper were introduced in detail, several other statistical software also introduced in brief. Contrast was made between SPSS software and other statistical software, highlighting the advantages of SPSS: SPSS was particularly selected based on its several favorable characteristics such as well-defined human-computer interface, very less amounts of programming, easy menu operation and intuitionistic and organized output results. SPSS is quite functional and can be used in many different fields where general or special statistical analysis is required. SPSS is so powerful and reputable that it is not necessary to give the algorithm for

those tables and figures in the academic reports if the corresponding data have been already analyzed by using SPSS.

In vitro degradation behaviors of PLGA/nano-HA scaffolds were selected for optimal analysis in the present study. As every experiment was done for four times, so

before the analysis of variance carried out, the descriptive statistical analysis is essential, it can reduce the experimental error. Many different scaffolds were fabricated with a three-layer structure by using various amounts of PLGA and Nano-HA components in each layer. The effect of PLGA or Nano-HA on the

weigh-loss ratio and changes in pH values was analyzed via Analysis of variance (ANOVA). The results suggest that the amount of PLGA or Nano-HA in the second layer would significantly influence the weight loss of the scaffolds and the composition proportions of PLGA and Nano-HA in the third layer would dominate the changes in pH value in the degradation media.

Key words: SPSS; Analysis of variance; data processing; composite scaffolds U

n R

e g

i s

t e

r e

d

摘要...............................................................................................................................1 ABSTRACT.................................................................................错误!未定义书签。 1 选题背景.................................................................................................................1 1.1 前言...................................................................................................................1 1.2 国际上常用的统计软件.. (5)

2 实验原理 (10)

2.1 描述统计基本原理.........................................................................................10 2.2 方差分析基本原理.........................................................................................13 3 处理过程...............................................................................................................15 3.1 数据来源及实验方法.....................................................................................15 3.2 描述性统计分析过程.....................................................................................17 3.3 方差分析过程. (20)

4 结果与讨论 (26)

4.1 支架失重的描述性统计分析结果与分析 (26)

4.2 支架失重的方差分析结果与分析.................................................................27 4.1 pH 变化的描述性统计分析结果与分析.......................................................27 4.1 pH 变化的方差分析结果与分析...................................................................28 5 总结.. (35)

致谢 (35)

参考文献 (36)

U

n R

e g

i s

t e

r e

d

1 选题背景

1.1 前言

统计学是应用数学的一个分支,主要是利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。它被广泛的应用在各门学科之上,从物理和社会科学到人文科学,甚至被用于工商业及政府的情报决策之上。在科研工作中,尤其是在细胞培养方面的科研实验中,实验的结果往往是大量的数据资料,这就对从事细胞实验方面的科研人员提出了需要对统计学知识有一定了解的要求。由于统计学的理论知识需要对数学有深层次的了解,而且在统计的方法上出现很多不同的方法,并且操作过程也不是很简单。但是随着科技的发展以及技术的进步,现在对与科研人员而言,出现了更便于操作处理的统计学软件。这些软件包含有常用的甚至是所有人类已知的各种统计学的处理方法,而且过程简便,速度奇快[1]。 1.1.1 统计学简介

统计学是在统计实践的基础上,自17世纪中叶产生并逐步发展起来的一门社会学科。它是研究如何测定、收集、整理、归纳和分析反映客观现象总体数量

的规律,以便给出正确认识的方法论科学,应用广泛。譬如自一组数据中,可以

摘要并且描述这份数据的集中和离散情形,这个用法称作为描述统计学。另外,观察者以数据的形态,建立出一个用以解释其随机性和不确定性的数学模型,以之来推论研究中的步骤及母体,这种用法被称未推论统计学。这两种用法都可以被称作为应用统计学。数理统计学则是讨论背后的理论基础的学科。

1.1.2 统计学发展史

统计学的英语单词statistics 是源于现代拉丁语statisticum collegium (国会)以及意大利语 statista 。严格地讲,“statist”起初的意思是“politician”或者“stateman”,它的词根来自于拉丁语“state”(状态),而状态的描述是近现代统计学的重要根源之一[2]。一般认为统计学的历史可以追溯到迄今两千三百多年的亚里士多德时代。Aristotle(384.BC-322.BC)在他的著作《政治学》中描述了158个国家包括各城市的历史、行政、科学、艺术、人口、资源和财富等社会及经济情况的比较、分析。这种比较性描述的初步尝试后来由意大利和德国学者发展为很接近近代统计学的一门学科,称为统计学,德文译为“Staatenkunde”,意思是指国情学[3]。德语Statistik ,最早是由Gottfried Achenwall(1749)所使用,代表对国家的资料进

U

n R

e g

i s

t e

r e

d

行分析的学问,也就是“研究国家的科学”。在十九世纪统计学在广泛的数据以及资料中探究其意义,并且由John Sinclair 引进到英语世界。

因此,统计学的初衷是作为政府(通常是中央政府)以及管理阶层的工具。它大量透过国家以及国际统计服务搜集国家以及本土的资料。统计背后牵涉到更多数学导向的领域,如机率,或是从经验科学(特别在天文学)中获得的经验证据设定估计参数。在今天的世界里,统计已经被使用在不仅仅是国家或政府的事务中,更延伸到商业,自然以及社会科学,医疗等甚至更多方面。因为统计学拥有深厚的历史以及广泛的应用性,统计学通常不仅被认为是数学所处理的对象,而是与数学本身的哲学定义与意义有密切的关联。许多知名的大学拥有独立的数理统计学系。统计学也在如心理学、教育以及公共卫生学系中被视为是一门主科。

统计学是在统计实践的基础上发展而来的。最初的统计实践只是简单的计数而已。在17世纪以前,人们对记述社会生活方面数据的兴趣纯粹只是实践上的,直到17世纪中叶,人们才开始对统计材料产生科学兴趣,即形成了萌芽状态的统计学。因此,在统计学史上,一般将17世纪中叶到18世纪中叶这一百多年的统计学称为古典统计学。古典统计学的两个来源是德国的国势学派和英国的政治算术学派。以康令(H·Conring )及其学生阿亨瓦尔(G·Achenwall )为代表的国势学派认为:统计学是研究国家显著性事项的学问,其研究方法是采用文字

记述和形式逻辑的比较法。从今天的眼光看,国势学派所谓的“统计学”距离真正

意义上的统计学还相差甚远,缺乏数字内容,是其主要缺陷。但它对统计学的最大贡献是给了统计学一个沿用至今的称谓。产生于英国的政治算术学派继承并发展了国势学派的思想,同时又从会计核算中汲取了营养,其创始人和代表人物是约翰·格朗特(J·Graunt )和威廉·配第(W·Petty )。自学成才的格朗特于1662年

出版了《对死亡表的自然观察和政治考察》一书,在这本书中,他通过客观现象

的数量关系,揭示出一系列统计规律,如男婴出生高于女生,男性死亡高于女性等,同时他还用最新颖的方法编制出了死亡率表。这本书所阐述的理论和方法都是首创性的,因此被许多统计学家誉为“真正统计学的肇端”。

统计学的发展过程可以分为三个主要的阶段。 第一阶段称之为“城邦政情”(Matters of state)阶段。 第二阶段称之为“政治算数”(Political arithmetic)阶段。

第三阶段称之为“统计分析科学”(Science of statistical analysis)阶段。 “政治算数”阶段出现的统计与数学的结合趋势逐渐发展形成了“统计分析科学”。“统计分析科学”课程的出现是现代统计发展阶段的开端。

U

n R

e g

i s

t e

r e

d

1.1.3 现代统计学

19世纪中叶之后,国际政治经济形势风云变幻,科学技术发展迅速,统计学也相应的得到了很大发展,同时也孕育出许多争议和分歧,产生了众多流派,其中尤以社会统计学和数理统计学为代表。社会统计学是在国势学和政治算术的基础上发展起来的,以简单的数学方法来研究社会现象的数量特征;而数理统计学则是在概率论的基础上形成的统计学的数学性原理。统计可以按照不同的研究对象来分类,如生物统计、经济金融统计和人文社会统计等;而这些统计应用体系所共有的数学模型的产生和研究则往往被称为数理统计。而数理统计的分支则不一定按照对象,而往往按照理论和方法来归类,如多元分析,时间序列,贝叶斯统计,非参数统计等等。这些都是对近代统计学的继承和批判的发展,因此,

19世纪中叶之后的统计学被称为“现代统计学”。

20世纪中期以来,随着计算机技术的迅猛发展,现代统计学表现出了一些

新的特点。归纳起来有以下几个方面[4]:

一是统计信息的社会化、网络化。由于计算机技术、现代通信技术、多媒体

技术、遥感技术、办公自动化技术等在统计活动中的推广和应用,从而实现了统

计信息的社会化、网络化和知识化.特别是现代计算机具有在短时间内处理大量

数据的能力,因此,产生了“数据分析”等学科,它加速了统计中理论与应用分家的趋势,在一定程度上降低了理论的作用.

二是统计方法的多样化。现代统计中除了广泛应用数列分析、多元统计、综

合评价等方法外,还引入了定性资料量化的方法,如Delphi 调查法、层次分析法

(AHP)等大大丰富了统计方法的内容.

三是统计理论知识的综合化。统计理论中逐步吸收和运用系统论、控制论、信息论、管理理论等,革新了传统统计理论,为统计信息地采集、加工、分析和应用提供了理论支持.

正因为如此,现代统计学在现代化管理和社会生活中的地位日益重要。随着社会、经济和科学技术的发展,统计在现代化国家管理和企业管理中的地位,在社会生活中的地位,越来越重要了。人们的日常生活和一切社会生活都离不开统计。英国统计学家哈斯利特说:“统计方法的应用是这样普遍,在我们的生活和习惯中,统计的影响是这样巨大,以致统计的重要性无论怎样强调也不过分。”甚至有的科学有还把我们的时代叫做“统计时代”。

在科学技术飞速发展的今天,统计学广泛吸收和融合相关学科的新理论,不断开发应用新技术和新方法,深化和丰富了统计学传统领域的理论与方法,并拓

U

n R

e g

i s

t e

r e

d

展了新的领域。今天的统计学已展现出强有力的生命力,在我国,社会主义市场经济体制的逐步建立,实践发展的需要对统计学提出了新的更多、更高的要求。随着我国社会主义市场经济的成长和不断完善,统计学的潜在功能将得到更充分更完满的开掘[1]。

首先是复杂数据和复杂模型的统计推断问题的地位在统计学中显得更加的突出。复杂数据主要表现在其维数高、相依、非线性与不完全观测等,如遥感观测的图像数据、文字语音记录数据。DNA 和蛋白质结构的实验数据、股市数据,以及在工业、国防、医学和社会经济等领域中存在的大量结构复杂的不完全数据等。传统的数理统计学方法在处理低维、独立、线性与完全数据时有效,但面对如此复杂的数据,传统的方法已不够使用。目前,这个领域尚处在探索阶段,未建立系统的方法和相应的统计理论。这个领域是今后若干年内统计学中最具挑战性的任务,也是有希望取得突破性成果的研究领域。统计模型的复杂性是数据复杂性的结果,以回归分析为例,由长期占统治地位的线性——正态模型到非线性、半线性、非参数、误差相依、PP 回归等,其他领域也有类似情况。需要针对实际中存在的复杂数据,寻找并建立适当的、可以处理的( Tractable) 模型,并针对不同的模型建立可使用的统计分析方法。

其次是新的统计推断方法和原理的研究日新月异。20世纪的统计推断方法和

原理,基本上是由Fisher ,Neyman 等所制定,到如今这一体系已趋于成熟,为了更

充分地运用样本中的信息,为了对付一些复杂的问题并提高精度,近年来统计学家提出了一系列的新的方法,如条件推断(Conditional inference) 法,Fisher 在1930 年已提出这种思想,近年来取得较大进展。又如似然法,经验似然法,鞍点方法等等,也是在研究上取得一定进展并有发展前途的方法,另外如Fisher 的信任推断法,近

年来重新引起人们的重视,认为是21世纪统计学发展一个可能的热点。Bayes 统计

学也提出了一些新的课题,特别是非参数Bayes 统计,被认为是一个重要的努力向。

再次是空间统计学的研究与应用。我国利用遥感和地理信息系统技术和传统统计学理论相结合,目前已形成了一套较为完整的空间信息采样方法,针对我国土地资源遥感调查中的精度提高和耕地等年度动态变化采样监测等具体应用目标,发展形成了较为成熟的空间信息采样技术路线和方法,如何进一步完善有关的理论和方法,如何控制误差、如何建立模型、如何处理并充分转换和利用有关的资料信息,是一项重大的研究课题[5]。

统计学产生于应用,在应用过程中发展壮大。随着经济社会的发展、各学科相互融合趋势的发展和计算机技术的迅速发展,统计学的应用领域、统计理论与分析方法也将不断发展,在所有领域展现它的生命力和重要作用。

U

n R

e g

i s

t e

r e

d

统计对于商业以、工业以及科研是一个基本的关键。他被用来了解与测量系统变异性,程序控制,对资料作出结论,并且完成资料取向的决策。在这些领域统计扮演了一个重要的角色[1]。

1.2 国际上常用的统计软件

计算机和软件在数量上和质量上的迅速进展使得用户眼花缭乱。在统计软件之间由于其侧重点的不同出现了通用的统计软件或者专门精通于某一类或者某几类的分析方法的统计软件,一时之间统计软件界出现了百花齐放的局面。根据各自应用的不同, 在挑选或评价统计软件时, 可从如下几个方面考虑。

1. 可用性 一个软件如果能为用户提供良好的用户界面, 灵活的处理方式和简明的语句或命令, 我们称这种软件“可用性”强。近十年来, 各种商业化的统

计软件在可用性上有飞跃发展。很多统计软件的语法规则简明、灵活, 学用方便, 使得编程序不再是软件人员的专利。

2. 数据管理 数据录入、核查、修改、转换和选择, 统称为数据管理。好的

软件如SAS 、SPSS 等的数据管理功能已近似大众化的数据库(popular database) 软

件。统计软件与数据库软件之间建立接口,使数据管理不断深入,用起来非常方便。

3. 文件管理 数据文件、程序文件、结果文件等其它一些文件的建立、存取、修改、合并等,统称为文件管理。它的功能越强, 操作就越简单、越方便。由于操作系统本身的文件管理功能较强,因此从统计软件直接调用操作系统的命令

可大大增强其文件管理功能。现在很多统计软件已设计了这类调用指令。

4. 统计分析 统计分析是统计软件的核心。统计分析方法的计算机程序的数量和种类,决定了数据处理的深度。有些软件(如SAS 、BMDP 等)所包括的分析过程, 足够科研与管理之需。由于统计量的选择、参数估计的方法等是多种多样的,用户往往希望统计分析过程尽可能多地提供可选项(option),这样可以提高统计分析的灵活性和深度。

5. 容量 尽管处理的数据量与计算机硬件有直接关系, 然而软件的设计和程序编写技巧仍起很大作用。软件好在一定程度上可弥补硬件的不足, 而低水平的软件会浪费很好的硬件配置。在生物医学数据处理范围内, 应要求统计软件至少能同时进行含8~10个变量的上千个个体的分析、综合、对比和预测。

另外, 在配置统计软件时应考虑所在单位的条件和实际需要。在教学部门、科研机构或计算机中心应尽可能多配置一些统计软件。对有条件的单位来说, 在计算机上配置5~10种软件并不算多。下面我就介绍一下目前国际上比较流行的

U

n R

e g

i s

t e

r e

d

几种统计软件,并做相应的对比[6]。

1.2.1 SPSS 统计软件

SPSS 是世界上通用的统计软件包之一,它不仅适用于社会科学,同样也应用于医学、经济学、心理学等领域。该软件由美国斯坦福大学研制,采用C 语言写成。1977年经美国软件公司实现商品化,早期的版本是DOS 环境支持的SPSS/PC+4.0及其低版本,随着Windows 操作平台的面世,SPSS 从1992年开始由DOS 版本升级为Windows 版本,即最初的4.0版本。之后,相继由Windows 3.0平台下的SPSS6.0和SPSS6.1版本,以及基于Windows95或以上平台的SPSS7.0、SPSS7.5 SPSS8.0,1999年又推出了SPSS9.0版本,后来又相继推出新版本SPSS10.0、SPSS11.03,目前版本仍在不断升级和更新。

与其他国际权威软件,如SAS 、STATA 、BMDP 等相比,SPSS 除了提供能满足

不同领域、不同层次的统计分析人员所需的基础统计、专业统计及高级统计等几

十种统计方法外,它最显著的特点是不需编程,完全采用菜单和对话框的操作方式,

绝大多数操作过程仅靠鼠标点击即可完成,简便易学,易于操作。目前是非统计专

业人员应用最多的统计软件,也是国际医学期刊引用最多的统计软件。SPSS 提供

用户图形界面窗口环境,在屏幕上清晰显示各类分析选项,并具备完整的下拉式菜单及对话框,用户界面非常友好,其操作具有和其他Windows 应用软件相同的特点。之所以如此方便,实际上是SPSS 软件设计人员将数据分析过程中的数据管理

和统计方法等过程通过菜单的形式来实现,而这在其他软件中往往要通过编程来

完成,这样使医学研究人员省去了记忆大量的命令和编写复杂程序,从而使非专业人员使用起来相当方便。除了具有以上特点外,SPSS 的另一显著特点是具备完备的统计图表制作功能,能绘制精美的统计图表,并可以极其方便地对其编辑和修饰。当然,SPSS 还是一个开放的统计软件,其主窗口是一个类似于Excel 的二维表,研究人员可以极其方便地创建SPSS 本身的数据文件,同时它还能够读取文件或纯文本文件、数据库文件、电子表格等多种软件生成的数据文件类型。对于初学者,该软件还拥有全面生动的联机帮助功能。以上的特点都是基于SPSS 的设计理念,使其大众化。当然对于高级用户,同样可以进行各种编程功能,使其统计分析更加灵活,同时菜单操作也可配合编程使用。

SPSS 提供的功能很多,但对于数据分析人员来说,其主要功能可分为两个方面,一个是数据文件的建立和管理,另一个是提供了各种统计分析方法。前者主要可以对数据进行修改编辑、查找、排序、合并、分割、抽样、加权、重新编码、

U

n R

e g

i s

t e

r e

d

编秩、设定种子数及计算或转换新的变量等多种功能。后者则可以对数据集进行一般统计分析,如描述性统计、探索性分析、检验、单因素和多因素方差分析、协方差分析、四格表和列联表卡方检验、相关分析、线性回归分析、非参数检验、生存分析等,同时也提供了多种高级统计方法,如非线性回归、多元线性回归、Logistic 回归、Cox 回归、典型相关分析、因子分析、聚类分析、判别分析、对应分析、对数线性模型等,完全能满足医学研究人员的需要。当然还提供了多种精美图表绘制功能,主要通过Graph 菜单实现[7]。

SPSS 最突出的特点就是操作界面极为友好,输出结果美观漂亮,他使用Windows 的窗口方式展示各种管理和分析数据方法的功能,使用对话框展示出各种功能选择项,只要掌握一定的Windows 操作技能,粗通统计分析原理,就可以使用该软件为特定的科研工作服务,是非专业统计人员的首选统计软件。本课程设计选用的是SPSS13.0软件。

1.2.2 与SPSS 功能相关的其他软件介绍 国际上通用的统计分析软件很多,下面简单介绍一下和SPSS 功能相关的其

它几种软件。

首先是SAS (Statistics Analysis System )软件。美国的SAS 软件以其强大的

数据管理能力,全面的统计方法,高精度的计算以及独特的多平台自适应技术,使

其成为统计软件包的标准,被许多学者誉为最具权威性的优秀统计软件包。在80年代进入中国后,占据了许多大型部门的统计室,目前SAS 对Windows 和Unix 两种平台都提供支持,最新版本有和8.1和6.12。SAS 提供“数据步”和“过程步”两种数据处理方式,可进行复杂而灵活的统计分析。但这种方式操作复杂,不能为广大普通

用户所接受,仅适合那些专家统计人员使用,这也在很大程度上限制了其市场的

表现[8]。

其次是Stata 软件。由Stata 公司开发的,Stata 完全安装后只有6M 。但就是这样小的一个统计软件,其统计分析能力在许多方面却远远超过了SPSS ,在某些方面甚至也超过了SAS 。由于Stata 在分析时是将数据全部读入内存!在计算全部完成后才和磁盘交换数据,因此计算速度极快。Stata 也是采用命令行方式来操作,但使用上远比SAS 简单。其生存数据分析、纵向数据(重复测量数据)分析等模块的功能甚至超过了SAS 。Stata 的许多高级统计模块均是编程人员用其宏语言写成的程序文件(ADO 文件),这些文件可以自行修改、添加和下载。用户可随时到Stata 网站寻找并下载最新的升级文件。事实上,Stata 的这一特点使其成为了几大统计软件中升级最多、最频繁的一个。Stata 最大的缺点是数据接口太简单,只能

U

n R

e g

i s

t e

r e

d

读入文本格式的数据文件,其数据管理界面也过于单调。

第三是S—PLUS 软件。由Mathsoft 公司出品的S—PLUS 是从AT&T 的S 语言(Statistical Language ,即统计语言)发展而来的,其语法和使用方式充满着数理统计的特点(比如说,向量、矩阵、数组等就是其最基本的元素),非常适合有数理统计背景的研究人员使用。其最大特点就是只要有新统计方法就纳入,让这些统计方法在使用中得到检验,如果确有缺陷再修改或取消。比如说树型回归和分类(Tree-based model )在约十几年前出现,很快就被纳入了S—PLUS 。这一特色使S—PLUS 近年来得到了飞速的发展,也使得它得到了一大批拥护者。

第四是MiniTab 软件。MiniTab 也是国际上非常流行的一个统计分析软件包,其特点是简单易懂因而普遍认为该软件更适合学生使用。在国外大学统计学系开设的统计软件课程中,MiniTab 与SAS 、BMDP 并列,而没有SPSS 的份。MiniTab (for Windows )比SAS 、SPSS 等小得多,但其功能并不弱,特别是它的试验设计及质量控制等功能甚至更胜一筹。

第五是Statistica 软件。由Stat SoftInc 开发的Statistica 也是一个国际著名的统计分析软件,它在操作方式上和SPSS 非常类似,但运算速度极快,几乎是全工具栏操作,鼠标右键菜单真正可以做到一键启动,操作灵活简单,易学易用。它具有数理管理软件、统计分析软件、绘图软件和矩阵计算软件的功能,又在许多方

面别具一格,尤其是做出的统计图美观[9]。

最后介绍的是BMDP (Biomedical Computer Programs )软件。该软件由加州大学于1961年研制,1968年BMDP 公司发行。该软件包和SAS,SPSS 共称为三大统计软件包,在国际上影响很大,客户达一万户以上,国外许多大学的统计学网站均对其关照有加。它方法全面、灵活,早期曾有很多独具特色的分析方法。不过其

发展道路不畅,从1991年的7.0版以后就没有新版本,最后被SPSS 公司收购[8]。

1.2.3 SPSS 和其它几种统计软件的比较

尽管统计软件种类繁多, 但常用的也就是六七种。在生物医学界, SAS 、 BM DP 、SPSS 、GLIM 、Genstat 、epilog 和Minitab 用得较多。这几种软件或具有上节所述的全部性能, 或在某一方面有独到之处。另外, 这几种软件配有详细而容易检索的说明书, 遇到问题可查阅一下基本上就能解决。特别值得一提的是,这几种软件经过十来年众多用户在不同机型上使用的考验,在用户之间建立了广泛的交流, 开发者投入大量人力与物力进行维护和更新, 使它们的功能越来越强, 使用越来越方便, 性能趋于完善。

U

n R

e g

i s

t e

r e

d

SAS 为经济管理、社会科学、生物医学、质量控制等领域的众多用户所采用, 是公认的较完善、全面的软件包。除统计分析外, 还有制图、计量经济分析和预测、矩阵运算、质量控制、线性规划、决策和新药的临床试验等功能。从SAS 现有的功能模块及发展趋势看, 把它说成综合性的信息处理系统并不过分。BMDP 可算得上是统计软件包的“元老”。它有40多个相互独立的程序模块, 统计分析功能非常强, 在生物医学界和研究部门应用很广。因模块之间相互独立, 增加新的模块较容易。与SAS 、BMDP 齐名的是SPSS , 在行政管理和社会科学领域有众多的用户。它的数据管理和描述性统计分析功能很强,但其多元统计分析功能还不够强。

同SAS 、BMDP 和SPSS 相比, GLIM 、Genstat 、epilog 和Minitab 等的应用面相对窄得多。GLIM 主要用于一般线性模型的分析与拟合; 而Genstat 实质上是统计计算的编程语言,是最难学的统计软件。GLIM 和Genstat 适合数理统计基础较好的人员使用。epilog 是处理流行病学调查资料的专门软件,绝大多数流行病学统计方法均可在其中找到。Minitab 是个统计分析方法较完全的“小软件”。它适合于教学, 但对于规模较大的研究项目, 就不宜用它来处理[6]。

关于各软件的综合对比,请参照表1:

表1 常用统计软件包的综合对比。其中3 表示功能强, 调用方便; 2 为较好; 1 表示具有该功能, 但不能直接调用; 0 表示无该功能。

Table 1 Comprehensive Comparison of commonly used statistical packages. 3 represents the strongest function and easy to use; 2 represents ok; 1 represents that has this fuction, but cannot use it directly; 0 represents no this function.

U

n R

e g

i s

t e

r e

d

2 实验原理

本毕业设计主要用到的是SPSS 的方差分析功能,而SPSS 软件将方差分析法直接内化为程序,故在此简单介绍一下方差分析的统计学原理。

方差分析的英文缩写为ANOV A ,是经典数理统计学的重要统计分析方法之一,由于有关ANOV A 的理论与方法最早是由英国著名统计学家Fisher 在1928年提出,故又称F 检验[17]。

方差分析是一套通过试验获得数据并进行分析的统计学方法。通过对实验进行精心的设计,使得在有限的物质条件(时间、金钱、人力等)下,所得到的试验数据能在够尽可能少的试验中最大限度的包含有用的信息;有方差分析就是相应的从实验数据中提取这种有用信息的统计分析方法。在科学试验和现代工业质量控制中,这套方法得到了广泛的应用,并产生了巨大影响。

严格的讲,方差分析分析的并非方差,而是研究数据间的“变异”,是在可比较的群组中,把总的变异按各指定的变异来源进行分解的一种技巧。对变异的度量,可以说唯一有效的方法就是离差平方和。方差分析就是从总的离差平方和中分解出可以追溯到指定来源的部分的离差平方和,这是方差分析的一个很重要的

基本思想。但是,应用方差分析对资料进行统计推断之前必须注意其使用条件,

包括: 1、可比性。若资料中各组均数本身不具可比性则不适用方差分析;2、正态性。即偏态分布资料不适用方差分析。对偏态分布的资料应考虑用对数变换、平方根变换、倒数变换、平方根反正弦变换等变量变换方法变为正态或接近正态后再进行方差分析; 3、方差齐性。即若组间方差不齐则不适用方差分析。多个

方差的齐性检验可用Bartlett 法,它用卡方值作为检验统计量,结果判断需查阅

卡方界值表。

在医学科研中方差分析常用于以下几个方面:①单因素多水平定量测定结果平均值的差异比较;②多因素多水平组间效应差异和彼此之间交互作用的分析;③自变量与因变量之间回归关系的检验和评断;④二个随机样本的方差齐性检验。

2.1 统计描述基本原理

描述性统计分析是统计分析的第一步,做好这第一步是下面进行正确统计推断的先决条件。统计分析主要分为两个方面,一个是统计描述,一个是统计推断,

U

n R

e g

i s

t e

r e

d

二者一个是定性的分析,一个是定量的分析。

实验数据的SPSS分析

图1 统计分析的分类

Figure 1 The classification of Statistical Analysis

下面就来介绍统计描述中的一些专业名词:

频数表(frequency table ):当变量值或观测值较多时,将变量值分为适当的组段,统计各组段中相应的频数(或者人数),以描述数值变量资料的分布特征和分布类型。频数表一方面不但可以描述数值变量资料的分布特征(集中趋势或

离散趋势),还可以描述数值变量资料的分布类型(正太分布或偏态分布)。

算数均数(均数mean ):适用于正态分布或者近似正态分布。总体均数:μ;样本均数。计算公式为:

几何均数(geometric mean,G ):适用于一种特殊的偏态分布资料:等比资料(常见于抗体滴度)。此资料的原始数据为正偏态分布,取对数后,对数值为正态分布,所以又称为对数正态分布。计算公式为

:

实验数据的SPSS分析

中位数(median,M ):适用于偏态分布资料,或者分布类型未知,或者有不确定数据时。中位数是指将一组变量值从小到大排列,位次居中的变量值。

U

n R

e g

i s

t e

r e

d

实验数据的SPSS分析

极差或者全距(range ,R ):表示一组变量值中最大值和最小值之差。适合任何分布类型的资料。计算简单,但是不能反映所有变量值的变异程度,易受最大值和最小值的影响,不稳定。

R =最大值-最小值

方差(variance ):表示一组变量值的平均离散程度。方差越大,离散或者变异程度越大。适合描述近似正态分布资料的离散趋势。

标准差(standard deviation ):是方差的开方,和均数的单位一致,也表示一

组变量值的平均离散程度。适合描述近似正态分布资料的离散趋势。

SPSS 的许多模块均可完成描述性分析,但专门为该目的而设计的几个模块则集中在Descriptive Statistics 菜单中,最常用的是列在最前面的四个过程:Frequencies 过程的特色是产生频数表;Descriptives 过程则进行一般性的统计描述;Explore 过程用于对数据概况不清时的探索性分析;Crosstabs 过程则完成计数资料和等级资料的统计描述和一般的统计检验,常用的X 2 检验也在其中完成。

U

n R

e g

i s

t e

r e

d

2.2 方差分析基本原理

方差分析的基本思想:根据研究设计的类型及研究目的,将总变异分解成两个或多个部分。除随机误差外,其余部分的变异可由某因素的作用来解释,通过比较可能由某因素所致的变异与随机误差的均方,从而了解该因素有无作用。

方差分析的适用条件有三个:一是各处理组样本来自正态总体,二是各样本是相互独立的随机样本,三是各处理组的总体方差相等,即方差齐性。

2.2.1 完全随机设计的单因素方差分析

总变异可以分解为两个部分:组间变异和组内变异。

SS 总=SS 组间+SS 组内 V 总=V 组间+V 组内

查相应的F 界值表,若F≥F α/2(ν组间,ν组内),P≤α时,拒绝H0,接受H1,认为各组总体均数不等或不全相等;若Fα时,不拒

绝H0,各组总体均数相等。

2.2.2随机区组设计的两因素方差分析

总变异可以分解为三个部分:处理组间变异、配伍组间变异和误差。

U

n R e g

i s t e

r e

d

实验数据的SPSS分析

查相应的F 界值表,若F≥F α/2(ν组间,ν组内),P≤α时,拒绝H0,接受H1,认为各组总体均数不等或不全相等;若Fα

时,不拒绝H0,各组总体均数相等。

方差分析注意事项:

1.方差分析的结果解释:方差分析的F 检验,当P ≤ 0.05,按α=0.05,拒绝 H0,接受H1,故可以认为各组总体均数不等或不全相等。即总的说来各组总体

均数有差别,但并不意味着任何两组总体均数都有差别:可能是任何两者间都有差别,也可能其中某两者间有差别,而其它组间无差别。要想确定哪些组间有差

别,必要时应该进一步作两两比教。

2.多个样本均数间的两两比较:多个样本均数间的两两比较,在处理组数大于2时,若仍用t 检验对任意两两均数之间进行比较,则会增大犯第一类错误的概率,即可能会错误得出两个总体均数有差别的结论。因此,多个样本均数间的两

两比较时不宜再用前述t 检验方法分别作两两比较。 3.方差分析与t 检验的联系:两个样本均数比较可以看作为多个样本均数比较的特例,因此完全随机设计的两个独立样本均数t 检验,可以用完全随机设计的单因素方差分析代替;配对设计的t 检验,可以用随机区组设计的两因素方差

分析代替。两者的计算结果有如下关系:F = t[14]。

U

n R

e g

i s

t e

r e

d

3处理过程

3.1 数据来源及实验方法

由于本次课题的所有数据均由实验室提供。故再此先将本课题所用到的数据及其实验方法简要叙述如下: 3.1.1 支架材料制备方案及步骤

主要材料准备如表2所示

名称 分子式 来源

PLGA PLA-PGA 中科院有机化学研究所

nano-HA Ca 10(PO 4)6(OH)2 实验室制取 β-TCP

β-Ca 3(PO4)2

实验室制取

二氯甲烷 CH 2Cl 2 天津市化学试剂三厂 PEG400

HO(CH 2CH 2O)Nh

中国医药上海化学试剂公司

表2 主要材料

Table 2 Primary materials

配料方案如表3所示

样品

A 组

B 组

C 组

第1层

0.15gPLGA+1.8g NaCl

0.15gPLGA+1.8g

NaCl

0.15gPLGA+1.8g NaCl

第2层

0.12gPLGA+0.03g Nano-HA+1.8gNaCl 0.09gPLGA+0.06g

Nano-HA+1.8gNaCl 0.12gPLGA+0.03g

Nano-HA+1.8gNaCl 第3层

0.12gPLGA+0.03g

Nano-HA+1.8gNaCl 0.09GPLGA+0.06g

Nano-HA+1.8gNaCl 0.09gPLGA+0.06g

Nano-HA+1.8gNaCl

表3 实验配料方案 Table 3 Experiment ingredient plan

支架C 为实验要研究的支架,另做A ,B 两种不同支架作为对比实验组。每种支架做4个进行,最后求其平均数据以减少误差。

首先根据配料方案中的含量制备叠层支架第一层。待第一层冷却后制备支架

U

n R

e g

i s

t e

r e

d