2020年9月14日 星期一

19_用R寫論文_信度分析

 上一篇是論文的基本分析就是將問卷發放後,觀察填寫問卷者的背景,而本篇介紹的為問卷的信度,也就是這一份問卷經多人填寫完後,問卷的結果可信度是如何?而信度分析若發放問卷,都一定會做,像我們的總統大選都會做問卷調查,調查完後一定做信度分析。

而甚麼是信度分析所謂信度是衡量沒有誤差的程度,也是測驗結果的一致性(consistency)程度,信度是以衡量的變異理論為基礎。

為什麼會有誤差,因為發放問卷填寫者會受到以下影響,第3項和第4項是可控制,而第一項和第二項是較難控制,因此需進行信度分析,以了解此份問卷的結果是否可相信。

1.由回應者(respondent)產生的誤差

2.由情境因素產生的誤差

3.由衡量者產生的誤差

4.由衡量工具產生的誤差

信度分析衡量包含了再測信度、折半信度、複本信度、庫李信度等,一般問卷都會採用庫李信度,也就是內部一致性,每一個問項的可信度。

上面概略解釋所謂的信度分析,看起來似乎有點複雜,但在R做信度分析尤其是內部一致性是很簡單,甚至比在做探索性分析還簡單。

首先我依然採用網路的資料集來,而這次下載資料集的方法有點不一樣,先建立暫存變數(存放),使用download.file()下載,在將資料讀進R,程式法如下

temp <- tempfile()
download.file("http://personality-testing.info/_rawdata/BIG5.zip", temp, mode="wb")
d <- read.table(unz(temp, "BIG5/data.csv"), header = TRUE, sep="\t")
unlink(temp); rm(temp)

str(d)
View(d)

該資料集共有19719筆資料換言之有19719人填寫問卷,共有57個變數,在看該資料集的內容如下

每筆資料就是一位填寫問卷的人,變數就是問題本身,跟前面的問卷基本分析紀錄資料的方式一樣,但對於本次57個變數太多了,我們只要E1-E10的變數,及前500名的參與者,而這份問卷主要調查個性是否外向,問項列表如下

這是人們對等級從1 =不同意到5 =同意的外向性項目的列表:

  • E1我是聚會的一生。
  • E2我沒說很多。
  • E3我周圍的人感覺很舒服。
  • E4我一直在後台。
  • E5我開始對話。
  • E6我無話可說。
  • E7我在聚會上與許多不同的人交談。
  • E8我不喜歡引起我的注意。
  • E9我不介意成為關注的焦點。
  • E10我在陌生人周圍安靜。
取前500名參與者以及E1-E10變數,程式如下
d <- d[1:500, paste0("E", 1:10)]
str(d)

由於(E2,E4,E6,E8,E10)為測謊題,需進行以下操作(測謊題的計算可上網了解),程式如下

d[, paste0("E", c(2, 4, 6, 8, 10))] <- 6 - d[, paste0("E", c(2, 4, 6, 8, 10))]

首先將套件載入,扣除套件的程式只需兩行,其嚴格來說只需第三行即可算出,如下

library(psych)
library(dplyr)

psych::alpha(d,check.keys = TRUE)
psych::alpha(d,check.keys = TRUE)$total$std.alpha

在Console會跑出一堆資料,其時只需看紅框的部分,內部一致性的值要大於0.7,由上至下來看,第一個紅框告你10個變數均有0.9,第二個紅框是每個問項的內部一致性大部分為0.89,所以從檢定的數值來看該份問卷的信度分析總體檢訂為0.9,每個問項均有0.89其中E6為9.0,因此該份問卷可信度符合內部一致性檢定。

當然在此份問卷內部一致性設為0.7,而在一些論文中也看過設0.5是最低,而你要設多少可能要跟你的指導教授討論,但最低值就是0.5,若是一般商業問卷依據自行的情況設定,相對標準值設愈高,問卷的可信度就愈高。


沒有留言:

張貼留言

無現金支付的反思!

  **購物經歷** - 作者花費大量時間尋找立燈,最終在IKEA購買了一個649元的立燈 - 在IKEA附近停車場遇到只接受無現金支付的情況,被迫註冊並使用Line Pay **無現金支付的觀察** - 作者認為Line Pay作為前端介面,有助於提高停車場付費效率 - 作者預...