R을 이용한 통계분석 - R의 데이터 유형
R의 데이터의 유형
- 변수형 : 숫자형, 문자형, 논리형
- 구조형 : 벡터, 스칼라, 행렬, 배열, 리스트, 데이터프레임
1. 변수형 데이터의 할당
# a 변수에 숫자 3을 할당
a <- 3
2. 데이터의 사칙연산
사칙연산 종류 : +, -, x, ÷
3. 데이터의 비교연산
>, >=, <, <=
R 구조형 데이터
자료구조인 벡터 (Vector), 스칼라(Scalar), 리스트(List), 행렬(Matrix), 데이터프레임(Data Frame), 데이터테이블(Data Table)을 지원한다.
1. 벡터 (Vector)
벡터는 배열의 개념으로 한가지 타입의 데이터를 저장할 수 있다.
숫자형 배열 (1,2,3,4, ….), 문자형 배열 (“a”,”b”,”c”,”d”,…) 등이 벡터에 해당한다.
# 벡터 사용법
vc <- c(1,2,3,4,5)
2. 스칼라 (Scalar)
스칼라는 단일 차원의 데이터 구조로 길이가 1인 벡터와 동일한 개념으로 볼 수 있다.
# 스칼라 사용법
sc <- c("Hello")
3. 행렬 (Matrix)
행렬은 동일한 타입의 데이터로 행(Row)과 열(Column)을 가지는 2차원 데이터 구조이다.
# 행렬 사용법
mt <- matrix(1:12, nrow=3)
4. 배열 (Array)
배열은 동일한 타입의 데이터로 행(Row)과 열(Column)을 가지는 2차원 행렬을 여러층으로 쌓은 것과 같은 다차원 데이터 구조이다.
# 배열 사용법 : c(행,열,차원)
arr <- array(1,18, dim = c(3,3,2))
5. 리스트 (List)
리스트는 서로 다른 타입의 데이터를 여러 개 저장할 수 있는 데이터 구조로 (키, 값) 형태의 데이터를 담는 배열 데이터이다.
# 리스트 사용법1
list1 <- list(order=1:4, value=c("a","b","c","d"))
# 리스트 사용법2
list2 <- list(name="apple", price=500, amount=3)
RStudio 환경창에서 데이터 값 확인
5. 데이터프레임 (DataFrame)
데이터 타입에 상관없이 2차원으로 구성할 수 있는 데이터 구조로 엑셀의 시트와 같이 표 형태로 정리한 데이타의 개념으로 볼 수 있다.
# 데이터프레임 사용법1
df1 <- data.frame(order=1:4, value=c("a","b","c","d"))
# 데이터프레임 사용법2
df2 <- data.frame(order=1:4,
name=c("kim","park","lee","song"),
score=c(95,89,80,75))
RStudio 환경창에서 데이터 값 확인
Tips
지금까지 사용한 명령문을 다음에 다시 실행하려면
File > Save as > filename.R
파일로 저장한다.
메모리에 할당 된 객체를 지우려면
rm()
명령어를 사용한다.
#모든 변수와 데이타를 모두 지울 때
rm(list=ls())
#특정 변수나 데이타를 지울 때
rm(변수명)
댓글남기기