LIFE: 19_用R寫論文

2020年9月14日星期一

19_用R寫論文_信度分析

上一篇是論文的基本分析就是將問卷發放後，觀察填寫問卷者的背景，而本篇介紹的為問卷的信度，也就是這一份問卷經多人填寫完後，問卷的結果可信度是如何?而信度分析若發放問卷，都一定會做，像我們的總統大選都會做問卷調查，調查完後一定做信度分析。

而甚麼是信度分析所謂信度是衡量沒有誤差的程度，也是測驗結果的一致性(consistency)程度，信度是以衡量的變異理論為基礎。

為什麼會有誤差，因為發放問卷填寫者會受到以下影響，第3項和第4項是可控制，而第一項和第二項是較難控制，因此需進行信度分析，以了解此份問卷的結果是否可相信。

1.由回應者(respondent)產生的誤差

2.由情境因素產生的誤差

3.由衡量者產生的誤差

4.由衡量工具產生的誤差

信度分析衡量包含了再測信度、折半信度、複本信度、庫李信度等，一般問卷都會採用庫李信度，也就是內部一致性，每一個問項的可信度。

上面概略解釋所謂的信度分析，看起來似乎有點複雜，但在R做信度分析尤其是內部一致性是很簡單，甚至比在做探索性分析還簡單。

首先我依然採用網路的資料集來，而這次下載資料集的方法有點不一樣，先建立暫存變數(存放)，使用download.file()下載，在將資料讀進R，程式法如下

temp <- tempfile()
download.file("http://personality-testing.info/_rawdata/BIG5.zip", temp, mode="wb")
d <- read.table(unz(temp, "BIG5/data.csv"), header = TRUE, sep="\t")
unlink(temp); rm(temp)

str(d)
View(d)

該資料集共有19719筆資料換言之有19719人填寫問卷，共有57個變數，在看該資料集的內容如下

每筆資料就是一位填寫問卷的人，變數就是問題本身，跟前面的問卷基本分析紀錄資料的方式一樣，但對於本次57個變數太多了，我們只要E1-E10的變數，及前500名的參與者，而這份問卷主要調查個性是否外向，問項列表如下

這是人們對等級從1 =不同意到5 =同意的外向性項目的列表：

E1我是聚會的一生。
E2我沒說很多。
E3我周圍的人感覺很舒服。
E4我一直在後台。
E5我開始對話。
E6我無話可說。
E7我在聚會上與許多不同的人交談。
E8我不喜歡引起我的注意。
E9我不介意成為關注的焦點。
E10我在陌生人周圍安靜。

取前500名參與者以及E1-E10變數，程式如下

d <- d[1:500, paste0("E", 1:10)]

str(d)

由於（E2，E4，E6，E8，E10）為測謊題，需進行以下操作(測謊題的計算可上網了解)，程式如下

d[, paste0("E", c(2, 4, 6, 8, 10))] <- 6 - d[, paste0("E", c(2, 4, 6, 8, 10))]

首先將套件載入，扣除套件的程式只需兩行，其嚴格來說只需第三行即可算出，如下

library(psych)

library(dplyr)

psych::alpha(d,check.keys = TRUE)

psych::alpha(d,check.keys = TRUE)$total$std.alpha

在Console會跑出一堆資料，其時只需看紅框的部分，內部一致性的值要大於0.7，由上至下來看，第一個紅框告你10個變數均有0.9，第二個紅框是每個問項的內部一致性大部分為0.89，所以從檢定的數值來看該份問卷的信度分析總體檢訂為0.9，每個問項均有0.89其中E6為9.0，因此該份問卷可信度符合內部一致性檢定。

當然在此份問卷內部一致性設為0.7，而在一些論文中也看過設0.5是最低，而你要設多少可能要跟你的指導教授討論，但最低值就是0.5，若是一般商業問卷依據自行的情況設定，相對標準值設愈高，問卷的可信度就愈高。

LIFE

2020年9月14日星期一

19_用R寫論文_信度分析

沒有留言:

張貼留言

無現金支付的反思!

檢舉濫用情形

標籤

2020年9月14日 星期一

19_用R寫論文_信度分析

沒有留言:

張貼留言

無現金支付的反思!

2020年9月14日星期一