上一篇是論文的基本分析就是將問卷發放後,觀察填寫問卷者的背景,而本篇介紹的為問卷的信度,也就是這一份問卷經多人填寫完後,問卷的結果可信度是如何?而信度分析若發放問卷,都一定會做,像我們的總統大選都會做問卷調查,調查完後一定做信度分析。
而甚麼是信度分析所謂信度是衡量沒有誤差的程度,也是測驗結果的一致性(consistency)程度,信度是以衡量的變異理論為基礎。
為什麼會有誤差,因為發放問卷填寫者會受到以下影響,第3項和第4項是可控制,而第一項和第二項是較難控制,因此需進行信度分析,以了解此份問卷的結果是否可相信。
1.由回應者(respondent)產生的誤差
2.由情境因素產生的誤差
3.由衡量者產生的誤差
4.由衡量工具產生的誤差
信度分析衡量包含了再測信度、折半信度、複本信度、庫李信度等,一般問卷都會採用庫李信度,也就是內部一致性,每一個問項的可信度。
上面概略解釋所謂的信度分析,看起來似乎有點複雜,但在R做信度分析尤其是內部一致性是很簡單,甚至比在做探索性分析還簡單。
首先我依然採用網路的資料集來,而這次下載資料集的方法有點不一樣,先建立暫存變數(存放),使用download.file()下載,在將資料讀進R,程式法如下
temp <- tempfile()
download.file("http://personality-testing.info/_rawdata/BIG5.zip", temp, mode="wb")
d <- read.table(unz(temp, "BIG5/data.csv"), header = TRUE, sep="\t")
unlink(temp); rm(temp)
download.file("http://personality-testing.info/_rawdata/BIG5.zip", temp, mode="wb")
d <- read.table(unz(temp, "BIG5/data.csv"), header = TRUE, sep="\t")
unlink(temp); rm(temp)
str(d)
View(d)
該資料集共有19719筆資料換言之有19719人填寫問卷,共有57個變數,在看該資料集的內容如下
每筆資料就是一位填寫問卷的人,變數就是問題本身,跟前面的問卷基本分析紀錄資料的方式一樣,但對於本次57個變數太多了,我們只要E1-E10的變數,及前500名的參與者,而這份問卷主要調查個性是否外向,問項列表如下
這是人們對等級從1 =不同意到5 =同意的外向性項目的列表:
- E1我是聚會的一生。
- E2我沒說很多。
- E3我周圍的人感覺很舒服。
- E4我一直在後台。
- E5我開始對話。
- E6我無話可說。
- E7我在聚會上與許多不同的人交談。
- E8我不喜歡引起我的注意。
- E9我不介意成為關注的焦點。
- E10我在陌生人周圍安靜。
取前500名參與者以及E1-E10變數,程式如下
d <- d[1:500, paste0("E", 1:10)]
str(d)
由於(E2,E4,E6,E8,E10)為測謊題,需進行以下操作(測謊題的計算可上網了解),程式如下
d[, paste0("E", c(2, 4, 6, 8, 10))] <- 6 - d[, paste0("E", c(2, 4, 6, 8, 10))]
首先將套件載入,扣除套件的程式只需兩行,其嚴格來說只需第三行即可算出,如下
library(psych)
library(dplyr)
psych::alpha(d,check.keys = TRUE)
psych::alpha(d,check.keys = TRUE)$total$std.alpha
在Console會跑出一堆資料,其時只需看紅框的部分,內部一致性的值要大於0.7,由上至下來看,第一個紅框告你10個變數均有0.9,第二個紅框是每個問項的內部一致性大部分為0.89,所以從檢定的數值來看該份問卷的信度分析總體檢訂為0.9,每個問項均有0.89其中E6為9.0,因此該份問卷可信度符合內部一致性檢定。
當然在此份問卷內部一致性設為0.7,而在一些論文中也看過設0.5是最低,而你要設多少可能要跟你的指導教授討論,但最低值就是0.5,若是一般商業問卷依據自行的情況設定,相對標準值設愈高,問卷的可信度就愈高。
沒有留言:
張貼留言