spss心得体会5篇最新汇总
SPSS是统计产品与服务解决方案的简称,为IBM公司的一系列用于统计学分析运算、数据挖掘、预测分析和决策支持任务的软件产品及相关服务的总称。下面给大家带来一些关于spss心得 ,希望对大家有所帮助。
spss心得1
spss的许多菜单均可进行描述性统计分析,许多统计过程也都提供描述性统计指标的输出。
在独特样本T检验、方差分析、因子分析等许多分析过程中。
spss自定义表模块也可以产生大部分的描述性统计指标。
1.频率:该过程将产生频数表,也可以输出频数分布的条形图、饼图或者直方图。
2.描述:该过程进行一般性的统计描述。它可以输出均值、均值的标准误、方差、标准差、范围、最大值、最小值、峰度和偏度。
3.探索:该过程用于对数据的探索性分析。
4.交叉表:该过程完成分类数据的统计描述和一般的统计检验。
5.比率:输出两个尺度变量比率的描述性统计量。
6.pp图:用于绘制尺度变量的pp图。
7.QQ图:用于绘制尺度变量的QQ图,以判断该变量是否服从正态分布。
在spss中选择【分析】—【描述统计】—【频率】
在spss中选择【分析】—【描述统计】—【描述】
在spss中选择【分析】—【描述统计】—【探索】
在spss【设定表】菜单中也可以输出大部分的描述性统计分析指标。选择【分析】—【表】—【设定表】。
描述性统计分析除了应用数量指标外,还可以应用条形图、饼图、帕累托图、直方图、箱图、茎叶图等统计图形。
在【分析】—【描述统计】—【频率】子菜单下的“图表”选项,可以选择绘制条形图、饼图和直方图。
(1)条形图给出相应每一类的频率,长方形的高度,与类的频率或者相对频率成比例。
(2)帕累托图是按照从高到底顺序排列条形图的长方形条后形成的一种特殊条形图,最高的长方形在左边。
(3)饼图把一个整圆分成几份,每一份代表一个类,每份中心角与类相对频率成比例。
直方图
直方图和条形图十分类似,应用于连续型数据,表现在图形上直方图的各个正方形条之间没有任何间隔。直方图可以直观地观测数据的分布情况。
茎叶图
茎叶图是描述定量变量的一种图形方式,他除了能够给出直方图所给出的分布的信息以外,还能够还原大部分原始数据的信息。
箱图
箱图是总结五数呢图形表现。数据标准化处理主要包括数据同趋化处理和无量纲化处理两个方面。数据同趋化处理主要解决不同性质数据问题;保证数据服从标准正态分布
spss心得2
选择[转换]—[随机数字生成器],勾选“设置起点”,并在“固定值”下的“值”中输入一个用户给定的数值。
选择[转换]—计算变量,在目标变量框中输入变量名“Spinn”,在“数字表达式”框中输入“trunc(rv.uniform(1,5))”,然后单击(确定)按钮,
(1)选择(分析)—描述统计—频率,然后把变量“spinn”选入“变量”框中,
(2)单击(图表(C))按钮,“频率:图表”对话框,勾选“直方图(h)”选项。
(3)单击(继续)按钮,返回“频率”对话框,然后单击(确定)按钮。以上过程也可以通过在语法编辑器中运行如下的语法程序实现。
并且要打开本章的数据文件“sim.sav”。
然后选择“转换”—计算变量,
保存该文件为“sim norm.sav”。
从该组随机数的分布能否确定该样本数据的确是从正态分布的总体中随机抽取的呢?
如果随机试验只有两个可能的结果,不妨称为成功和失败,设该试验中成功的概率为p(0
选择“条形图”。然后在右侧的示例图预览中双击第一个图标。预览图将出现在右上角的画布中。用鼠标把“变量”中的变量x拖放到“是否x轴”虚线框中,把变量prob25拖放到“计数”虚线框中,。该条形图可以编辑修改。
(3)得到随机变量x的条形图,该条形图可以编辑修改
(4)双击该图,得到“图形编辑器”窗口。
(5)双击图形编辑器窗口中的图形,即可出现属性窗口,在属性窗口中,可以设置条形图的各种属性,如宽度,填充颜色,边框,图形大小等。
(6)改变条形图的填充颜色和条子的宽度,修改后的条形图。
选择文件——新建——数据,在数据编辑器中打开一个空的数据文件,在数据视图的第一例分别输入0,1,2,3,···,10,即随机变量x的所有可能的取值。
单击变量视图,把变量名称“var00001”改为“x”,小数位数设为0;建立另外两个新的变量,分别命名为“c25”和“c40,小数位数都设为4。”
设置随机数种子为“123456”。然后选择(t)——计算变量(c),在“计算变量”对话框中的“目标”变量t框中输入“c25”,在“数字表达式”框中输入“cdf.binom(x,10,0.25)”。然后单击确定按钮。因为计算变量对话框中的目标变量的名称c25和我们已经定义的变量c25重名,已经在变量视图中定义的c25没有任何内容,因此这里我们单击确定按钮。在变量视图中就生成了服从二项分布的随机变量c25。
spss心得3
SPSS课程学习心得体会
应用统计分析学习报告 本科的时候有概率统计和数理分析的基础,但是从来没有接触过应用统计分析的东西,
spss也只是听说过,从来没有学过。一直以为这一块儿会比较难,这学期最初学的时候,因
为没有认真看老师给的英文教材,课下也没有认真搜集相关资料,所以学起来有些吃力,总
感觉听起来一头雾水。老师说最后的考核是通过提交学习报告,然后我从图书馆里借了些教
材查了些资料,发现很多问题都弄清楚了。结合软件和书上的例子,实战一下,发现spss
的功能相当强大。最后总结出这篇报告,以巩固所学。 spss,全称是statistical product and service solutions,即“统计产品与服务解
决方案”软件,是ibm公司推出的一系列用于统计学分析运算、数据挖掘、预测分析和决策
支持任务的软件产品及相关服务的总称,也是世界上公认的三大数据分析软件之一。spss具
有统计分析功能强大、操作界面友好、与其他软件交互性好等特点,被广泛应用于经济管理、
医疗卫生、自然科学等各个领域。具体到管理方面,spss也是一个进行数据分析和预测的强
大工具。这门课中也会用到amos软件。 关于spss的书,很多都是首先介绍软件的。这个软件易于安装,我装的是19.0的,虽
然20.0有一些改变和优化,但是主体都是一样的,而且都是可视化界面,用起来很方面且容
易上手。所以,我学习的重点是卡方检验和t检验、方差分析、相关分析、回归分析、因子
分析、结构方程模型等方法的适用范围、应用价值、计算方式、结果的解释和表述。 首先是t检验这一部分。由于参数检验的基础不牢固,这部分也是最初开始接触应用统
计的东西,学起来很多东西拿不准,比如说原假设默认的是什么。结果出来后依然分不清楚
是接受原假设还是拒绝原假设。不过现在弄懂了。这部分很有用的是t检验。t检验应用于
当样本数较小时,且样本取自正态总体同时做两样本均数比较时,还要求两样本的总体方差
相等时,已知一个总体均数u,可得到一个样本均数及该样本标准差,样本来自正态或近似
正态总体。t检验分为单样本t检验、独立样本t检验、配对样本t检验。其中,单样本t 检
验是样本均数与总体均数的比较的t检验,用于推断样本所代表的未知总体 均数μ与已知的总体均数uo有无差别;独立样本t检验主要用于检验两个样本是否来自
具有相同均值的总体,即比较两个样本的均值是否相同,要求两个样本是相互独立的;配对
样本t检验中,要正确理解“配对”的含义,主要用于检验两个有联系的正态总体的均值是
否有显著差异,跟独立检验的区别就是样本是否是配对样本。这几个方法用软件操作起来都
是相对简单的,关键是分清楚什么时候用这个什么时候用那个。 然后是方差分析。方差分析就是将索要处理的观测值作为一个整体,按照变异的不同来
源把观测值总变异的平方和以及自由度分解为两个或多个部分,获得不同变异来源的均值与{spss实验心得体会}.
误差均方,通过比较不同变异来源的均方与误差均方,判断各样本所属总体方差是否相等。
方差分析主要包括单因素方差分析、多因素方差分析和协方差分析等。这一部分在学习的过
程中出现一些问题,就是用spss来操作的时候分不清观测变量和控制变量,如果反了的话会
导致结果的不准确。其次,对bonferroni、tukey、scheffe等方法的使用目的不清楚,现在
基本掌握了多重比较方法选择:一般如果存在明确的对照组,要进行的是验证性研究,即计
划好的某两个或几个组间(和对照组)的比较。宜用bonferroni(lsd)法;若需要进行多个
均数间的两两比较,且各组个案数相等,适宜用tukey法;其他情况宜用scheffe法。最后,
对方差齐性检验、多重比较检验、趋势检验理解不够透彻,在方差检验中,post hoc键有lsd
的选项:当方差分析f检验否定了原假设,即认为至少有两个总体的均值存在显著性差异时,
须进一步确定是哪两个或哪几个均值显著地不同,则需要进行多重比较来检验。lsd即是一
种多因变量的三个或三个以上水平下均值之间进行的两两比较检验。 相关分析是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨(转载
于:spss课程学习心得体会)其相关方向以及相关程度,是研究随机变量之间的相关关系的一
种统计方法。相关分析研究现象之间是否相关、相关的方向和密切程度,一般不区别自变量
或因变量。主要有双变量相关分析、偏相关、距离相关几个方法。双变量相关分析是相关分
析中最常使用的分析过程,主要用于分析两个变量之间的线性相关分析,可以根据不同的数
据类型和条件,选用pearson积差相关、spearman等级相关和kendall的tau-b等级相关。
当数据文件包括多个变量时, 直接对两个变量进行相关分析往往不能真实反映二者之间的关系,此时就需要用到偏相
关分析,从中剔除其他变量的线性影响。距离相关分析是对观测变量之间差异度或相似程度
进行的测量,其中距离需要弄清楚,距离分析是对观测量之间相似或不相似程度的一种测度,
是计算一对观测量之间的广义距离。这些相似性或距离测度可以用于其他分析过程,例如因
子分析、聚类分析或多维定标分析,有助于分析复杂的数据集。 接着是回归分析。相关分析研究的是现象之间是否相关、相关的方向和密切程度,一般
不区别自变量或因变量。而回归分析则要分析现象之间相关的具体形式,确定其因果关系,
并用数学模型来表现其具体关系。比如说,从相关分析中我们可以得知“质量”和“用户满
意度”变量密切相关,但是这两个变量之间到底是哪个变量受哪个变量的影响,影响程度如
何,则需要通过回归分析方法来确定。回归分析的目的在于了解两个或多个变量间是否相关、
相关方向与强度,并建立数学模型以便观察特定变量来预测研究者感兴趣的变量。运用十分
广泛,回归分析按照涉及的自变量的多少,可分为一元回归分析和多元回归分析;按照自变
量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。如果在回归分析中,
只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为
一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间
是线性关系,则称为多元线性回归分析。应用回归分析时应首先确定变量之间是否存在相关
关系,如果变量之间不存在相关关系,对这些变量应用回归预测法就会得出错误的结果。正
确应用回归分析预测时应注意:①用定性分析判断现象之间的依存关系;②避免回归预测的
任意外推;③应用合适的数据资料; 接下来是因子分析。因子分析是指研究从变量群中提取共性因子的统计技术。最早由英
国心理学家c.e.斯皮尔曼提出。他发现学生的各科成绩之间存在着一定的相关性,一科成绩
好的学生,往往其他各科成绩也比较好,从而推想是否存在某些潜在的共性因子,或称某些
一般智力条件影响着学生的学习成绩。因子分析可在许多变量中找出隐藏的具有代表性的因
子。将相同本质的变量归入一个因子,可减少变量的数目,还可检验变量间关系的假设。因
子分析的主要目的是用来描述隐藏在一组测量到的变量中的一些更基本的,但又无法直接 测量到的隐性变量。从显性的变量中得到因子的方法有两类。一类是探索性因子分析,
另一类是验证性因子分析。探索性因子分析不事先假定因子与测度项之间的关系,而让数据
“自己说话”。而验证性因子分析假定因子与测度项的关系是部分知道的,即哪个测度项对应
于哪个因子,虽然我们尚且不知道具体的系数。这一部分不能用spss来操作,要用amos,
用起来也很方便。
最后一部分学习的是结构方程模型。结构方程模型是一种融合了因素分析和路径分析的
多元统计技术。它的强势在于对多变量间交互关系的定量研究。在近三十年内,其大量应用
于社会科学及行为科学的领域里,并在近几年开始逐渐应用于市场研究中。结构方程模型是
对顾客满意度的研究采用的模型方法之一。其目的在于探索事物间的因果关系,并将这种关
系用因果模型、路径图等形式加以表述。结构方程模型与传统的回归分析不同,结构方程分
析能同时处理多个因变量,并可比较及评价不同的理论模型。与传统的探索性因子分析不同,
在结构方程模型中,我们可以提出一个特定的因子结构,并检验它是否吻合数据。通过结构
方程多组分析,我们可以了解不同组别内各变量的关系是否保持不变,各因子的均值是否有
显著差异。
这门课要学习完了,整个学习的过程是充满曲折和挑战的,我见证了自己从一无所知到
困惑迷茫再到略懂再到会用的过程。甚至学完之后有些问题还没有彻底搞清楚,自己接下来
还会不断的探索的。spss是个很神奇的工具,结合amos和excel更是如虎添翼,相信学习
了spss在以后的论文和数据分析中很有用。这门课给我的感觉是看起来很难,但是实际学起
来就好很多,因为当我结合具体实例和软件的时候,很多抽象的问题就豁然开朗了。但是想
给老师一个建议,这门课需要很强的统计和概率论的基础,要不然就会很难听懂或者听得半
懂。然后这门课的很多方法的相关资料都是用在医疗卫生、自然科学领域的,在管理中的应
用的资料不怎么多。老师希望我们上课的时候结合在管理中的应用来学习,但是资料有限,
希望老师在这个方面多给学生一些引导。篇二:spss心得体会 学习spss在教育统计中的应用心得体会
一、什么是spss?为什么要学习spss? 新学期开始时,在信息化教育测量与评价的课程中第一次接触 到spss这个软件,作为本科是计算机专业出身的我,当时只知道spss是一套统计软件,
就是一套根据统计学原理所编写出来的统计分析软件,至于统计什么?分析什么?我一无所
知,尤其是看到老师推荐的《spss在教育统计中的应用》这本书的时候,就简单的把它理解
为用spss软件来统计、分析与教育相关的数据,最终得出想要的结论而已,而现在看来,我
当初的想法未免有点简单与无知。下面就来让我们了解一下spss。spss软件是一组专业的、
通用的统计软件包,同时它也是一个组合式软件包,兼有数据管理、统计分析、统计绘图和{spss实验心得体会}.
统计报表功能。它广泛用于教育、心理、医学、市场、人口、保险等研究领域,也用于产品
质量控制、人事档案管理和日常统计报表等。spss软件对计算机硬件系统的要求较低;对运
行的软件环境要求宽松,有各种版本可运行在windows xp、win7系统环境下, spss统计软
件采用电子表格的方式输入与管理数据,能方便地从其他数据库中读入数据(如dbase,excel,
lotus等)。
我为什么要学习spss呢?其实很简单,一方面,做为一名 研究生,要具备一定的科研能力,如今量化研究的方法大行其道,一切要以事实说话、
要以数据说话,有了数据支持的研究才能更容易被认可、被推论。另一方面,根据对aect94
定义的理解,教育技术 学研究的对象是学习过程和学习资源,包含大量的偶然现象和非精确现象。因此,要深
入研究教育技术现象及其规律,必须运用统计描述、统计分析方法和模糊数学分析方法,才
可能使这门学科达到真正完善的地步。教育技术学研究的现象多数是偶然的现象,其变化发
展往往具有几种不同的可能性,究竟出现哪一种结果,那是带有偶然性的,是随机的。这类
偶然现象是遵循统计规律的,当随机现象是由大量的成份组成,或者随机现象出现大量的次
数时,就能体现统计平均规律。我们只有对数据资料作统计处理,才可能可以发现它们的内
在规律,掌握现象的特征,检验研究的假设,才能得出准确的、可靠的研究结果。
二、对本spss各章节学习的心得 新课程老师带领下,采取一种新的学习方式,老师讲解了基础部分后,全班同学采取小
组分工、协作学习,然后对全班同学进行讲解学习内容,教师进行当堂指导,这种方法改变
了同学们的学习态度,同学们不再是课前不预习,课下不复习的状态,每组都有自己的任务,
课前有一定的压力,同学间的讨论也明显的增多,例如:一次课下同学们在一起吃饭,有几
位同学还在调侃说“两个菜之间用spss进行分析后得出的结果不接受h0假设,也就是两个
菜之间不相关”,虽然这只是一个课下的玩笑,但是这也可以体现出对学习的态度的转变。下
面就本学期的所学spss的各章节做一下归纳,这些归纳也是基于本人平时在课前预习,课上
及课后的一些所思所想,也许会有一些理解上的偏颇在内,但这仅限于心得而已。本学期学
习各个章节
及分工如下表:
章节名称
1.spss的认识
及数据文件的
处理
2.数据清理与
基本统计及测
量质量分析
3.t检验
4.方差分析
1、 2人 3人 7.聚类分析 8.统计图形 2人 1人 2人 6.卡方检验 3人 2人 5.相关分
析 3人 分工人数 章节名称 分工人数 spss的认识及数据文件的处理心得体会 可能是由于是同学们第一次讲,万事开头难,压力很大,在大家认为最为简单的内容讲
解上,两位同学并没有完全展现出二人实际水平,大家在这一节课上都感觉到很压抑,总的
感觉是这节内容很简单,但是内容又很松散,可讲的东西太多,讲的东西多就没有突出重点
和难点,所以听过之后就有种无数的碎片漂浮在脑海中一样,很难将知识系统化,课后总结
一下无非就是两块,一块是了解spss软件的历史及基本功能,还有一块就是spss软件当中
一个模块叫做数据文件的处理,在认识spss软件当中了解到它是一组社会科学统计软件包,
诞生于1968年,当时美国的3位大学生开发出了它,经过这么多年的后续开发,spss已经
有了很多的版本,具有了更的兼容性、和更友好的操作界面,也在很多的学科领域得到了应
用,而在教育中的应用 只是它的一个分支。此外它对硬件的要求也很低,当前一般的电脑都能安装它,安装的
过程中也没有什么特殊的方法,傻瓜式的安装方式完全就可以满足。在数据文件的处理方面,
主要是要学会定义变量、处理变量两方面;定义变量是要注意根据自己实际采集的数据来定
义变量,例如是数值型的变量还是文本型的变量及变量的长度,小数点保留尾数等,总之就
是一句话,根据实际调查的数据要求来定义相应变量。变量定义只有只要细心的将实际调查
的数据录入到spss当中即可,当然也可以在spss软件之外进行数据编制,可以通过execel
等编辑后可以直接导入到spss中。在处理变量模块当中,可以对变量进行添加、删除、拆分
与合并等操作,只要根据实际调查数据,细心调整变量,使操作更加简便和明了。
2、 数据清理与基本统计及测量质量分析的心得体会 数据的清理与基本统计及测量质量分析由两名同学进行讲解,由于吸取了上节课两名同
学的经验,本节讲授的明显好于上节课,这里我也是把它分为两块进行学习,一块是数据的
清理,另一块是相关统计理论的学习。在数据清理方面主要学习了奇异数据的检查与清理,
在这里本人觉得非常有必要进行数据清理,在实际的调查数据时难免会出现错误或者碰到极
为特殊的典型案例,所以这些数据很难符合大众规律,在统计、分析过程中可能会造成分析
结果异常,从而直接影响最终的结论。所以觉得非常有必要进行数据检查与清理。而我认为
本节的难点不是怎样熟练运用spss软件,而是在第二块中的,相关统计理论的学习,学习这
些理论需要一定的数学基础,只有明确这些 理(论如均值、标准误差、中数、众数、全距、四分位等)原理,知其然,知其所以然,
这才是关键,在spss中想要实现对数据进行以上分析只需要轻轻点击一下按钮就可以是轻松
实现,但是如果不清楚到底用它们来做什么就无从谈起做数据分析了,所以本节内容知道分
析原理的重要性要远远大用spss对数据做出相关分析的重要性。总结为一句话“知道它们是
做什么的后才会让它们去做该做的工作”。
3、 t检验的心得体会
t检验由两名同学讲解,在学习t检验时,首先要明确什么样的数据适合t检验,t检验
的结果要说明什么问题?经过学习可以知道,t检验是对两组数据间的平均水平或均数的比
较,通过比较可以得出两组数据间的显著性水平,而这两组数据都要符合正态分布,方差具
有齐同性,t检验由两种情况,一种配对提检验,要求两组数据不可以独立颠倒顺序,如果
颠倒顺序就会改变问题的性质,这种t检验称为配对t检验;另一种情况下的t检验是两组
数据可以任意颠倒顺的检验称为独立样本的t检验。但是这两种情况都必须符合最先的要求,
即都是符合正态分布,方差都具有齐同性。通过spss的相关操作可以轻松完成检验,但是在
检验的过程中必须设置置信区间,一般设置为95%,在设置置信区间时必须要考虑到所做分
析的数据,如果像要得到显著性差异的结果则可尽量将置信区间设置小些,如果想要得到不
显著差异就要将置信区间甚至大些,本人的理解为若置信区间小,则可以理解为在小范围内
是可以相信的,但如果将分析结果的置信区间值调大则说明在很大的范围内这个结果可信,
反之则不可信,篇三:spss课程学习感悟(交) spss学习总结与反思 财管132 1330443233 王天茜 在这学期以前我并没有学过统计学,甚至没有接触过它,
因此对它的认识可谓是从零开始的,但经过这一段的学习,也算是受益良多,下面我就简单
说下感想吧。
第一节课老师简单讲述了下这门课的概况,当时只觉得毫无头绪,对于没接触过的事物
人总有莫名的恐惧,这门课看似还很难,就比较担忧。 接着说说学习过后对spss的整体认识吧,我专门去百度了下它的全称,定义为spss是
“社会科学统计软件包”(statistical package for the social science)的简称,是一种
集成化的计算机数据处理应用软件。之前看论文的时候会经常看到各种表格图形,各种结果
输出,当时并不明白,以前也没见过,因此总会跳过实验整个设计直接看结果。在学了这门
课后总算对其有了初步的认识。
1、spss的认识及数据文件的处理心得体会 一块是了解spss软件的历史及基本功能,还有一块就是spss软件当中一个模块叫做数
据文件的处理,在认识spss软件当中了解到它是一组社会科学统计软件包,诞生于1968年,
当时美国的3位大学生开发出了它,经过这么多年的后续开发,spss已经有了很多的版本,
具有了更的兼容性、和更友好的操作界面,也在很多的学科领域得到了应用,而在教育中的
应用只是它的一个分支。此外它对硬件的要求也很低,当前一般的电脑 都能安装它,安装的过程中也没有什么特殊的方法,傻瓜式的安装方式完全就可以满足。
在数据文件的处理方面,主要是要学会定义变量、处理变量两方面;定义变量是要注意根据
自己实际采集的数据来定义变量,例如是数值型的变量还是文本型的变量及变量的长度,小
数点保留尾数等,总之就是一句话,根据实际调查的数据要求来定义相应变量。变量定义只
有只要细心的将实际调查的数据录入到spss当中即可,当然也可以在spss软件之外进行数
据编制,可以通过execel等编辑后可以直接导入到spss中。在处理变量模块当中,可以对
变量进行添加、删除、拆分与合并等操作,只要根据实际调查数据,细心调整变量,使操作
更加简便和明了。
2、 数据清理与基本统计及测量质量分析的心得体会 这里我也是把它分为两块进行学习,一块是数据的清理,另一块是相关统计理论的学习。
在数据清理方面主要学习了奇异数据的检查与清理,在这里我觉得非常有必要进行数据清理,
在实际的调查数据时难免会出现错误或者碰到极为特殊的典型案例,所以这些数据很难符合
大众规律,在统计、分析过程中可能会造成分析结果异常,从而直接影响最终的结论。所以
觉得非常有必要进行数据检查与清理。而我认为本节的难点不是怎样熟练运用spss软件,而
是在第二块中的,相关统计理论的学习,学习这些理论需要一定的数学基础,只有明确这些
spss心得4
摘要:SPSS统计分析方法及应用课程的开设给我们打开了一扇全新知识的门窗,它通向的是一个崭新的领域。这门课程的学习经历可谓波澜起伏,中间有苦有甜,但是不管过程多么艰难,幸运的是,我们学到了很多,收获了很多。通过老师的讲解,我们对它的使用方法、结果分析和应用范围都有了非常细致的了解。 关键词:学习经历 收获 方法 应用范围
距SPSS统计分析方法及应用课程结束已经过去好几天了,偶尔还是会想起那段兵荒马乱,洪荒滔天的日子。开学伊始,很多课程还必须靠课程表才知道星期几在哪里上课,但是SPSS则不同,一天四节课连着上的重大任务让我们不得不去正视它、重视它。
初识SPSS统计分析方法及应用是在一个傍晚。彼时,地上余热尚未完全散尽,暮色即将席卷最后一抹晚霞。坐在机器嗡嗡运转的机房里,抚摸手中那一厚重书本的扉页,心里是一丝说不清道不明的复杂情绪,对未知的好奇掺杂着对已知的不确定。周围同学都在讨论,统计学都没有学好,这门课程学起来会不会过于吃力,如此一想,几分恐惧感又蹭蹭地上升。就这样,怀着五味杂陈的心情开始了SPSS的第一堂课。
一天课下来,却发现它学起来并没有想象中那么艰难,可能是刚接触的基础知识比较易懂,也可能是老师讲解的很生动透彻。总之,我的兴趣被调动起来了,甚至在心里雀跃,期待第二天的SPSS课早点到来。但是渐渐的,学习开始有点力不从心了,课堂上会有片刻的走神,反应过来后便在书上匆忙翻找老师讲解的内容自己慢慢的边看边理解,然而结果还是一知半解,于是悔不当初统计学的基础打得不够牢固。不过,不幸中的万幸是老师非常的好,对我们这些上课不太认真的同学还是耐心的给予指导并且不厌其烦。课堂上师生之间互动的很好,充分调动了大家的积极性,要求我们自己动手去找答案、自己去操作而不是一味地跟着老师盲目地进行着机械运动,老师也非常反对以往那种“填鸭式”教育,积极鼓励、督促我们去思考答案的由来,去解释所以然与之所以然,同时老师生动的讲解把枯燥的内容形象化,更方便我们的理解。当习惯了老师这种教学模式后,我们学习起来虽不能说得心应手,举一反三,但也渐入佳境,步入正轨,没有了当初的手足无措,没有了那时的茫然若失,像初长成的少年一般,拥有的是岁月
洗礼后的纯粹明媚与获得真知的满足感。
现在回想一下,学习其实还是一个循环往复的过程,讲究的是一个方法和技巧,即使每个人都在抱怨SPSS难学,听不到看不明白,但是班上还是有人学的很轻松,学的很扎实。好像那些在我们看来既枯燥又难以理解的术语和定义解释在她们眼里就是一副活动的画面,她们沉浸于其中,遨游在其中,享受在其中。仿佛那些知识早已扎根在她们充满智慧的脑袋里,而不同于我们,需要从书本的文字上去吸收,从老师那里获取知识的核心和真正内涵。这样的对比让我折服却又向往,认真观察了她们学习动态后,我发现像我们这种每天上课才翻书下课书本直接扔一边的人即使在某一时期了解了这门课程,等到若干时间以后,当遗忘功能发挥作用时我们还是一无所知,怎样把它们植根于脑袋,关键在于自己的努力和钻研。课前好好预习,尝试自己去理解那些不算深奥的文字,遇到不懂的标记一下,上课认真听或者课后积极向老师请教,课堂的效果也是不容忽视的,老师讲的都是书本浓缩的精华,一个不留神,可能就导致后面的全盘崩溃,然后兴趣丧失,课后更是需要好好复习加强记忆力,SPSS需要的是多操作多熟悉,空闲时间多加自我练习才会做到熟能生巧。其实很多课程都是互通的,这些方法对其他课程而言也是非常实用的。还有最重要的一个资源库,就是学校的图书馆,多看看有关书本触类旁通更容易理解。
现在一本书已经学完了,不敢说对它的领会有多深,只能说从中的确学到了不少的东西,更准确的是学到一种技能和方法,即怎样处理数据的方法。SPSS是“社会科学统计软件包”(Statistical Package for the Social Science)的简称,是一种集成化的计算机数据处理应用软件。它是世界上公认的三大数据分析软件之一,由于操作简便,好学易懂,简单实用,因而很受非专业人士的青睐。最重要的是,对我们经济管理专业的学生来说,以后从事的行业大部分都是要和统计分析以及决策打交道,因此掌握好数据分析方法和数据分析软件工具则是非常有必要的。
其次纵观中国经济发展历程,改革开放已逾三十多年,我国的经济体制由计划经济步入了社会主义市场经济的运行空间,这一客观现实要求企业必须提高独立面对市场经济中大风大浪的能力,也就是自身的硬件素质。在加入WTO后,中国企业搭上全球化的班车,跨入与国际接轨的高速轨道,在获得更广泛的市场资
源的同时,也面对着更强大对手的竞争,在这种趋势下,增强软实力,打造自身独一无二的个性特质更是迫在眉睫。面对着强化自身的双重挑战,要求企业承担起信息化和定量分析的重任,只有信息化才能够迅速全面的感知市场和消费群体的要求,只有定量分析才能对感知信息做出科学分析和正确决策。而当今社会发展日益迅猛,数据量快速膨胀,数据关系复杂性大大提高,企业怎样快速得出分析结果,怎样从效率和质量方面占有优势对数据分析软件的性能有着严格的的要求。而SPSS因操作简单,结果明了,很受企业欢迎,已广泛应用于各大领域。我们从课程学习上所采用的例子就可得出,SPSS不仅在经济学、生物学、心理学、医疗卫生、体育等方面作用广大,在农业、林业、商业、金融等行业也有着不可小觑的影响力。应着这些因素,掌握好这一技能就显得势在必行了。
通过老师细心的讲解,我们知道了SPSS分析的正确步骤,即懂得了如何正确组织数据、如何利用SPSS对数据进行基本加工和整理,明白了应从何处入手分析、应采用SPSS中的哪些分析方法和功能实现对各类数据由浅入深的分析,清楚了怎样理解和解释分析结果。在此之前,我们所了解的关于数据的计算机应用软件仅局限于Excel,而如今,我们不但掌握了SPSS,还能够在两者之间进行数据的转换。这一课程的学习可谓是受益匪浅,对于一组数据我们不再被表面现象和其中的干扰因素所蒙蔽,而是能够剖开现象看本质,这使我们对真实的理解更加贴近更加透彻。
spss心得5
分开画Y与每个X散点图,即矩阵散点图,只要关注对角线上方的图即可。因为画图依据是重要的变量放在Y轴,即因变量或待分析变量;非重要的变量放在X轴,即自变量;= ,SPSS中是标准化系数beta, (i≠j)可以分析主次因子,说明 变量更重要,一般主因子占20%,次因子占80%. 强调模型整体情况,观测是否线性相关,为0图形为圆,为1图形为线;一般地通过画椭圆来分辨。一般解决内生性方法:小数据分析,对y取ln或找稳健模型或用ZSLS;大数据分析直接寻找那个确定因素。小数据分析一定是找归因;大数据分析无归因,找的是工具归因。在[0.35,0.5)范围,拟合度比较好;在[0.5,0.7)范围,拟合度很好;在[0.7,0.96)范围,拟合度非常好;在[0.9,1]范围,可能过拟合,这个时候需要好好注意模型。
一、数据分析归类
结构化数据分析和测量数据分析
二、数据分析应用领域归类
小样本:小数据分析,用加号连接,市场调查,用SPSS工具
大样本:大数据分析,用乘除连接,银行或投行(SAS),电商(python)
三、数据分析类型
1、流程化分析
1.1 明确需求,搭建业务框架
报告(运营报告,财报),痛点研究,研究未来
1.2 建立统计关系,即Y的量化
精确Y,确定测量问题,转化为统计问题
1.3 变量X的选择
寻找归因问题,记住一个真理(所有数据分析适用):跟业务相关的是重要的X,非业务的变量是不重要的X
1.4 做描述
大样本:研究行,即行分析
小样本:研究列,列分析
1.5 预分析
为建模做准备
1.6 建模
确定随机因素和确定因素
1.7 修正模型
为建模做准备
注:1.5、1.6、1.7三个步骤都是建模过程反复来回调优,大概调校十几层次
1.8 评估模型
小样本是用 衡量(表示大约有百分之多少的数据在模型上),大数据需要老板认可
需要把模型转化为领导能理解的信息,比如用钱来形容、用百分比形容、用图表达、用表表达(看起来像图)
价格心目表 是把信息转化为钱的表达形式清单
1.9 应用
归因(分清主次因子,规则归因)和预测(老样本是內衍,新样本是外推)
1.10 可视化
把模型通过图或表的形式展现给其他人,特别是老板,让其能看明白
2、模块化分析
四、数据分析两大需求问题
客户型问题(PM数据挖掘)、优化问题(机器学习)
五、描述指标的解读
中位数/平均值:是大众表现
方差/标准差:是小众表现,数据分析重要关注指标
异常值:是小众中的小众表现,最大值和最小值
小数据分析建模依据是 标准差和异常值;大数据分析关注指标是平均值和异常值
六、SPSS建立线性回归(LR)模型过程(图形-r-回归分析-ε -应用)
菜单中,上侧和左侧为最重要的信息
pre_1→ (y的预测值)
ZPRED→ (y预测值的标准化)
DEPENDNT→y
res_1→ε
ZRESID→ε(ε标准化)
ANOVA→方差分析(显著性<0.05,表示y与X存在相关)
ANOV→均值分析
1、看图形——散点图,分析相关性、线性趋势、异常值
分开画Y与每个X散点图,即矩阵散点图,只要关注对角线上方的图即可。因为画图依据是重要的变量放在Y轴,即因变量或待分析变量;非重要的变量放在X轴,即自变量;
2、统计指标——r系数
(Cov(Y,X) 是协方差,Cov(X,X)=X的方差)
r=
∈[0,1](测量模型:T=R+ε;结构模型:y= ;相当于R为 )
~F分布,由P值判断是否可行
r系数作用:删除不相关变量(按delete快捷键),X变量一般允许15个范围内,反映紧凑程度
3、回归分析
β值:SPSS中是未标准化系数B
= ,SPSS中是标准化系数beta, (i≠j)可以分析主次因子,说明 变量更重要,一般主因子占20%(主要给老板看的),次因子占80%
强调模型整体情况,观测是否线性相关,为0图形为圆,为1图形为线;一般地通过画椭圆来分辨。 会随着变量数的增多,而单调递增;而调整 不会这样,而是变量数达到一定数后会递减。所以,一般地,变量数小于6时,看下 值;变量数大于8时,看调整 。另看Δ = ,小于5%,拟合度可行,大于10%变量数出现冗余情况,需要删除部分变量。
4、ε 随机误分析,值最小为好,必须要检查
若确定因素与不确定因素相当时,说明模型不可用
ε 出现的情形:
①、+,-,+,-,...,+,-;均值为0 → 横截面数据会出现
②、+,+,+...,+;均值为+ → 时间序列数据会出现
③、-,-,-...,-;均值为- → 时间序列数据会出现
④、0,0,0...,0;均值为0 →不允许出现这种情形
因误差是永远存在,所以①、 ②、③三种情况是正常现象。
好的 ε 满足两个条件:
ε ~N(0, ),来判断随机性,通过画直方图观测
Cov( , ε )=0,来判断ε 中是否存在确定性,即发生内生性,通过画 ε- 散点图观测,一般是Y轴为 ZRESID,X轴为 ZPRED。画出X轴和Y轴的平均值辅助线,同时画一条y=2或y=3的直线,用于分割出异常值,然后圈住异常值的点,点击转至个案进入数据视图模块并选中所有异常值所在行。一般解决内生性方法:小数据分析(即小样本),对y取ln或找稳健模型或用ZSLS(两阶段最小二乘);大数据分析直接寻找那个确定因素。
注:当残差出现各种问题时,优先处理主要问题,即消除最根本原因;然后处理优先级是内生性问题>异常值>其他问题。
另:广义线性回归 logy=
5、归因及因果
因果满足必须存在时间先后性、必须存在相关性、必须存在因果论三个条件。
小数据分析一定是找归因;大数据分析无归因,找的是工具归因。规则归因主要强调最好或最差情况的条件是哪些,小数据用聚合分析和对应分析判断,大数据用贝叶斯和决策树判断
6、相关分析
小数据,关注相关性,判断因果;大数据寻找工具归因。相关分析工具:皮尔逊系数分析连续型数据的相关性、肯德尔系数分析有序数据的相关性、斯皮尔曼系数分析各种数据的相关性(含有缺失值会很方便)、卡方分析分类数据的相关性。大数据常用斯皮尔曼系数和卡方分析
7、SPSS描述信息查看
首先,看方差分析(ANOVA),是否存在相关性;
然后,看系数a,看哪些X与Y显著性相关; =y的未标准化系数B+x1的未标准化系数B·x1+x12的未标准化系数B·x2+...; ==y的标准化系数beta+x1的标准化系数beta·x1+x12的标准化系数beta·x2+...
再看模型摘要,寻找拟合度最佳的。 在[0.35,0.5)范围,拟合度比较好;在[0.5,0.7)范围,拟合度很好;在[0.7,0.96)范围,拟合度非常好;在[0.9,1]范围,可能过拟合,这个时候需要好好注意模型。