计数资料 (Count Data), 顾名思义,是一个一个计数清点而得到的资料,这种清点得到的数值是有单位的。例如,发病次数这一变量,其值可能是1 ,2,3, …次,这里的1,2,3, …是有单位的,即“次“。
严格定义属于分类资料? ,书中定义属于分类资料。
计数资料其实最重要的是具有单位。
分类资料是没有单位的。例如,性别这一变量,其值为男和女,为了分析方便,我们通常习惯用1和0表示。这里的男和女(1和0)是没有任何单位的。至于"男性100人,女性120人"中的100和120,并不是性别变量的值,只是变量值的频数,变量值本身是没有单位的。
假定有4 人, 3 男1女,统计他们的咳嗽次数,分别为2 、3 、0 、2 (图4.4 中“咳"的数目)。那么性别和咳嗽次数这两个变量分别是什么类型呢?
在这种清况下,“是否咳嗽“是分类资料,其值只能是“是"或"否",没有单位,但可以统计出“是"的频数和"否"的频数。此时可采用卡方检验进行比较( 为什么要用卡方检验? )。但真正分析的变量是“药物”(自变量)和“是否咳嗽"(因变量),至于咳嗽的例数只是作为频数,而不是作为变量值。如果自变量除药物之外,还有其他性别、年龄等因素需要校正,则可以考虑采用Logistic 回归分析。
卡方检验: 卡方检验就是统计样本的实际观测值与理论推断值之间的偏离程度,实际观测值与理论推断值之间的偏离程度就决定卡方值的大小,如果卡方值越大,二者偏差程度越大;反之,二者偏差越小;若两个值完全相等时,卡方值就为0,表明理论值完全符合。
特别特别注意的是:卡方检验针对分类变量。
现在的资料由分类(咳或者不咳)变为了计数(咳嗽次数)。这时结局是计数资料,不能用卡方检验。此时可以药物作为自变蜇,以咳嗽次数作为因变量,考虑采用Poisson回归或负二项回归。
Poisson回归一般用于个体之间独立的情形,负二项回归则可用于个体之间不独立的情形(如在同一个家庭中,如果父亲因感冒而咳嗽,则很可能传染家中其他人也咳嗽,此时就认为家中的几个人咳嗽是非独立的)。
本文地址: http://www.goggeous.com/20250104/1/1172578
文章来源:天狐定制
版权声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。
2025-01-08职业培训
2025-01-08职业培训
2025-01-08职业培训
2025-01-08职业培训
2025-01-08职业培训
2025-01-08职业培训
2025-01-08职业培训
2025-01-08职业培训
2025-01-08职业培训
2025-01-08职业培训
2025-01-04 18:29:32职业培训
2025-01-04 18:29:31职业培训
2025-01-04 18:29:31职业培训
2025-01-04 18:29:30职业培训
2025-01-04 18:29:29职业培训
2025-01-04 18:29:29职业培训
2025-01-04 18:29:28职业培训
2025-01-04 18:29:20职业培训
2025-01-04 18:29:19职业培训
2025-01-04 18:29:18职业培训
2024-12-15 02:54职业培训
2024-12-03 12:37职业培训
2024-12-17 10:54职业培训
2024-11-28 22:58职业培训
2025-01-04 20:18职业培训
2024-11-29 16:14职业培训
2025-01-07 20:51职业培训
2024-12-15 23:00职业培训
2024-12-21 22:04职业培训
2024-12-15 03:32职业培训
扫码二维码
获取最新动态