商务服务
SPSS+Excel统计分析技巧篇——数据的描述性统计分析
2024-11-01 23:26


SPSS+Excel统计分析技巧篇——数据的描述性统计分析


    描述性统计,是指运用制表和分类,图形以及计算概括性数据来描述数据特征的各项活动。描述性统计分析是医学统计非常基础且重要的一类分析。


    我们进行描述性统计分析主要运用的软件是SPSS,但是SPSS对数据的要求比较高,必须为数字类型的数据,那么我们在使用SPSS之前,必须对原始数据进行格式化的整理,如果这个工作没做好,将会直接导致后续的工作都白费。对原始数据进行格式化整理需要使用到Excel,如下图:





    医学原始数据的搜集过程中,研究者为了直观、方便而录入一些汉字、符号类型的数据,这些数据都是不能直接用SPSS进行统计分析的,如下图:



    以上数据是观察者使用Eexcel记录的,虽然看上去比较直观,但是对于统计分析来说,这份数据是没有任何意义的,因为SPSS软件只能识别数字,对于以上这份数据,我们要使用SPSS进行统计分析的话,必须做到以下几点:


①变量数据只能是阿拉伯数字,一定不能是汉字、英文或者符号等其他字符。以上数据中“吸烟”变量的数据是“是”和“否”这样的汉字,统计软件没法识别,必须将其转换为数字;


②“吸烟”变量中,对于“是”这一类患者,还录入了患者的烟龄,那么“是”+“烟龄”就是两个属性了,而数据分析的时候不允许把两个属性录入进同一个单元格,这样也会导致统计软件无法识别。两个属性,应该生成2个变量录入数据;


③“吸烟”变量下的“烟龄”数据,单位不统一,有些患者的“烟龄”是以“年”为单位,而有些患者则是以“月”为单位,必须将单位进行统一。


以上数据使用Excel进行整理的方法:



Step1:“烟龄”数据在“,”后面,所以利用Excel中的find函数先查找“,”的位置,函数为:=FIND(",",B2,1),如下图所示:



Step2:计算单元格总长度,利用Excel中的len函数先计算,函数为:=len(B2),如下图所示:



Step3:计算“烟龄”的长度,“烟龄”长度=单元格长度-“,”位置,如下图所示:



Step4:提取“烟龄”字符串,利用Excel中的right函数,函数为:=RIGHt(B2,E2),如下图所示:



Step5: 提取“吸烟”状况,函数为:=LEFt(B2,1),



按照以上5个步骤,成功拆分了“吸烟状况”和“烟龄”这两个属性,转换成了了两个变量,如下图所示:



2、将“汉字”“英文”转换成阿拉伯数字


Step1:“烟龄”和“吸烟”两个变量复制,并以数值形式粘贴,具体操作视频演示。


Step2:同时按住键盘上的“shift”和“F”,将“#VALUE!”替换成“0”



Step3:按照step2中的步骤把“是”替换成1,“否”替换成0(医学统计中默认“阳性”、“有”、“是”等用阿拉伯数字1编码,反之用0)


替换后的数据如下:



Step4:制作数据标签。



3、统一单位


医学研究,时间数据的计算单位一般是“月”,需要把单位统一成“月”


Step1:“升序排列”


选中全部数据:


点击“排序”→“自定义排序”:


排序后:



提取数值,选择的函数:=LEFt(B17,(LEN(B17)-(LENB(B17)-LEN(B17))))


提取后如下:


“年”为单位的,乘以12,“月”为单位则保持原样,“半年”则手动转换成6月。如下图所示:



将转换后的数据粘贴成数值格式到“烟龄”变量中,得到最终的正确数据形式:



    以上的数据就完全满足数据分析的格式了,任何统计软件都可以识别,后续的数据分析也可以顺利进行。以上的操作,对于大样本、大数量的Excel数据整理非常方便,省很多时间!



对于上述整理好的数据,可以直接粘贴进SPSS,也可以导入。制作好的SPSS数据如下(具体操作见视频):



对于以上数据,可以对“吸烟”进行频率分析,操作如下:




点击“继续”再点击“确定”,得出如下结果:



注:SPSS自动输出的图不太美观,分辨率不高,且编辑功能不强大,建议大家使用GraphPad Prism软件绘图。


对于“烟龄”可以进行描述性统计分析:




点击“确定”,得到如下结果:



以上结果中,平均值为58.68,意味着对于“吸烟”的人而言,平均吸烟年龄为58.68个月。值得注意的是,烟龄一般不服从正态分布,“中位数”可能更合适。


    本期课程就到这里,我们将每周推出更多、更实用的医学统计教程,提供医学统计相关服务。涵盖医学科研设计、数据统计分析、SPSS、meta、GraphPad、SAS、R、Eexel等,欢迎大家关注!感谢大家的观看,下期再见!


    以上就是本篇文章【SPSS+Excel统计分析技巧篇——数据的描述性统计分析】的全部内容了,欢迎阅览 ! 文章地址:http://yy520w.xhstdz.com/news/74.html 
     资讯      企业新闻      行情      企业黄页      同类资讯      首页      网站地图      返回首页 物流园资讯移动站 http://gzhdwind.xhstdz.com/ , 查看更多   
最新新闻
免费无广告的统计工具TalKingData
给大家介绍一个移动端、网站的无广告统计工具 通过研究友盟、百度统计发现在底层的js中存在广告,而且上线使用的时候时不
list、set、map 之间的区别是什么?_网站SEO和SEM之间到底有什么区别?
今天来给大家谈下网站SEO和SEM之间到底有什么区别?很多做互联网的朋友都傻傻分不清,SEO和SEM虽然只相差一个字
2024年6月大学英语六级翻译必背词汇:中国特色词汇
2024年6月英语六级考试将在6月15日举行,大家准备的如何?今天为大家带来的是2024年6月大学英语六级翻译必背词汇:中国特色词汇
2024年B2B营销趋势:高质量内容全链路数字化AI渗透短视频
随着科技的不断发展和市场的日益竞争,2024年B2B营销将迎来一系列新的趋势和亮点。在这篇文章中,我们将聚焦于关注高质量内容营
十大有效B2B网站推广平台
1、在众多的B2B平台中,哪些平台的人气高、推广效果好,有效果呢在此推荐十大有效网站推广平台供大家参考。1、阿里巴巴中国最大
公历2024年比农历甲辰年多12天,为啥?
大家有没有发现,2024甲辰年(龙年)只有354天,而且只有23个节气。有人可能就比较疑惑了,一年不是有365天,24个节气吗?那么,
2018年8月全球批准新药概况
来源:雪球App,作者: 药渡,(https://xueqiu.com/3989972570/113958030)作者: 药渡数据王雨福2018年8月,美国食品药品监督管
分析10个垂直行业:大数据应用面临哪些挑战
分析10个垂直行业:大数据应用面临哪些挑战大数据已经成为过去几年中大部分行业的游戏规则,行业领袖,学者和其他知名的利益相关
《大数据时代,你应该借用黑科技来采集BS网页、CS软件数据?》
大数据处理关键技术一般包括:大数据采集、大数据预处理、大数据存储及管理、大数据分析及挖掘、大数据展现和应用(大数据检索、
百度发现搜索结果中有涉及个人隐私或者企业机密的网页,该如何删除
  百度与这些网页所在的网站无关,百度无权删除他人网站上的网页。  如果您是这些网站的管理员,您可以:  删除这些页面。
本企业新闻