R통계 : Theme #4. Dplyr package

R studios

R통계 : Theme #4. Dplyr package

Frisbeen 2024. 5. 27. 16:59

filter() - 조건식으로 필터링

and, or, ≥ < 와 %in% 집합 내부에 있는지 검사

exam %>% filter(class %in% c(1,3,5))

exam안에 class 열 안에 1,3,5가 있는 녀석들만 필터링 하겠다는것

그 외에도 
^ 제곱
%/% 나눗셈의 몫
%% 나눗셈의 나머지
이런 녀석들도 연산에 활용가능

select() - 필요한 데이터 선택

df <- df %>% select(-columnName)
##columnName을 제외한 모든 열을 선택하는 데 사용됩니다.

arrange() - 정렬

##arrange()의 기준이 하나만 있어야하는건 아니다.
exam %>% arrange(class, desc(math))

>> 이렇게 두개 이상의 기준을 넣어버리면 먼저 class로 정렬 후, 그 다음 math의 내림차순으로..

mutate() - 파생변수 추가

exam이라는 데이터에는 english 열, math열, id열 ,class열 있다고 가정.

##함수 내에서 $표기 쓰지 않는다
exam %>% mutate(total = english + math, test = ifelse(science>60,"pass","fail"))
##이런식으로 콤마를 활용해 여러가지 열을 한번에 추가할 수도 있다.

이렇게 mutate를 활용해서 만든 열의 값을 활용하여  뒤에다가 %>% arrange(total) 해줘도 괜찮아용

group_by(), summarize()

같이 쓸때 매우 유용. mutate랑 비슷하게 열을 추가하는 기능도 존재.

exam %>% group_by(class) %>% summarise(mean_math= mean(math)
##summarise(sum(), median(), n() ) 와 같은 다양한 함수를 서머라이즈 안에 넣어서 사용
## min(), max() 이런 최대최소값도 넣어줄수도 있거덩!
## 빈도보는 n()를 기억하자.

left_join(data1, data2 by=”공통된 열”) -”가로로 합치기”

##두개의 데이터에 공통된 열 값이 존재할때,

data1

id mid

1 5

2 4

data2

id final

1 4

2 3

total12 = left_join(data1,data2,by="id")
이렇게하면
	id mid final값이 한번에 total12에 담길 것.

bind_rows(data1,data2)

##얘는 좀 더 엄격하다.

열의 이름이 다 같아야함

따라서 변수명이 다르다면 rename을 활용하여 다 동일하게 맞춰서 사용해야한다.

'R studios' 카테고리의 다른 글

R통계 : Theme #6. Tidy. (0)	2024.05.27
R통계 : Theme#5. 데이터 정제 (결측치와 이상치) 다루기 (0)	2024.05.27
R 통계 : Theme #3 : 데이터 조작 ( 기본 함수) (1)	2024.05.27
R 통계 : Theme #2. 데이터 저장 및 불러오기 (0)	2024.05.27
R통계 : Theme #1. 기본적인 데이터 타입 (0)	2024.05.27

현재글R통계 : Theme #4. Dplyr package

Algorithm Cinema

영화광 프론트엔드 개발자

R, 11478, 일본 경제성장과 문화, Comparator, 모던 자바스크립트, 자료구조, Access Token, localStorage, React, 자바, java, 해석, 일본의 세대, 백준, useEffect, 카운팅정렬, API, JSON, 리뷰, 평론,

Today :
Yesterday :

일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

Algorithm Cinema

R통계 : Theme #4. Dplyr package

'R studios' 카테고리의 다른 글

'R studios'의 다른글

티스토리툴바

R통계 : Theme #4. Dplyr package

'R studios' 카테고리의 다른 글

'R studios'의 다른글

관련글

티스토리툴바