arrange()函數一句話講完就式對資料做排序,老實說,以前在寫一些程式不是很注重因為都很簡單,所以都不太在意,而當我接觸大數據時發現一個排序竟然在龐大的資料中是多麼重要。
舉例來說長官要知道飛機遲到時間最多的航班,由大排到小
arrange(flights,desc(dep_delay))
簡單吧!換一個方式將資料表的缺失值,在表格中前面顯示
arrange(flights,desc(is.na(dep_delay)))
換一個場景,交通部長說ㄟ...那個誰啊....幫我查一下以下資料,若不看程式碼答案的前題下,你能完成嗎?
一、幫我查最延誤的航班以及最早離開的航班
View(arrange(flights,desc(arr_delay)))
View(arrange(flights,dep_delay))
二、哪些航班旅行最遠?哪個旅行最短?
View(arrange(flights,desc(distance)))
View(arrange(flights,distance))
--------------------------------------------------------------------------------------------------------------------------
select()函式剛開始也認為跟排序一樣就是這樣,有甚麼好討論!但是當你的資料集變數很多,select可以縮減你的變數讓你可以跟專注於資料分析上,以flights有19個變數,其實在看時就有點吃力,曾經遇過有30個變數時...那真的是...,select()允許您使用基於變量名稱的操作來快速放大有用的子集。
所以先來一點開胃菜,執行以下程式碼,而成果我就不貼了!
select(flights,year,month,day)
select(flights,year:day)
select(flights,-(year:day))
開胃菜吃完場景拉到美國交通運輸局會議現場,長官要知道航班資料以下資訊
航班欄位太多了,我要看實際的起飛和到達時間、出發和到達的延遲
select(flights,dep_time,dep_delay,arr_time,arr_delay,everything())
沒有留言:
張貼留言