R 프로그램을 설치하면 base, datasets, graphics 등 기본 패키지가 자동 설치되고, 메모리에 로딩되어 별도의 작업 없이 바로 사용할 수 있다.
이외에 필요한 함수는 패키지 단위로 직접 설치하여 사용할 수 있도록 설치 및 삭제 기능을 제공한다.

1. R에 설치된 패키지 확인

RStudio 오른쪽 하단창의 패키지창에서 설치 된 패키지 목록을 확인할 수 있다.

R의 설치 패키지

R에서 기본으로 제공하는 패키지외에 다른 패키지를 사용하려면 직접 패키지를 R에 설치해야 하는데, 패키지는 최초 1회만 설치하고, 패키지 로드(메모리에 패키지를 적재하는 작업)는 패키지를 사용할 때마다 수행해야 한다. 대신 한번 메모리에 로드된 패키지는 R프로그램이 종료되기 전까지 유지된다.

2. R에 설치할 수 있는 패키지

https://cloud.r-project.org/

R의 설치 패키지

R은 2024/02/17일 기준 약 20,000개의 패키지가 있고, 오픈 프로젝트로 패키지의 제작과 배포가 자유롭기에 앞으로도 계속 증가할 것으로 보이므로 모든 패키지를 파악하고, 사용하기는 불가능해 보인다.

따라서 데이터 분석의 목적에 맞는 패키지를 찾아 효과적으로 활용하는 것도 프로그램 분석 능력이라고 볼 수 있다.

R의 주요 패키지

  • 텍스트, csv 파일 처리 : readr readr
  • 엑셀파일 처리 : readxl readxl
  • 데이터 정렬, 집계, 필터 : dplyr dplyr
  • 문자열 처리 : stringr stringr
  • 그래프 : ggplot2 ggplot2
  • 웹 대시보드 : shiny shiny
  • 지리 지도 : maps maps
  • 구글 지도 : ggmap ggmap
  • 구글 차트 : googleVis googleVis
  • JSON 데이타 : jsonlite jsonlite

3. 패키지 설치와 로드

R은 필요한 함수를 패키지 단위로 직접 설치하여 사용할 수 있도록 기능을 제공한다.

# ggplots : 데이터 시각화 패키지
# ggplots 설치
install.packages("ggplot2")

# ggplots 로드
library(ggplot2)

설치된 패키지는 RStudio의 패키지창에서 사용법을 확인 할 수 있다.

패키지 사용법

4. 기본 제공 패키지 사용법

R의 base, datasets, graphics 등 기본 패키지에서 제공하는 데이터 및 함수는 별도의 작업 없이 바로 호출하여 사용할 수 있다.

R 기본제공 데이터 및 함수

  • cars, trees : R(datasets)에서 기본 제공하는 데이터
  • summary() : R(base)에서 기본 제공하는 결과 요약 함수
  • plot() : R(base)에서 기본 제공하는 시각화 함수
  • abline() : R(graphics)에서 기본 제공하는 라인 시각화 함수

4-1. 데이터 사용하기

# 데이터 확인
cars
trees

cars 데이타와 데이타 설명

4-2. 함수 사용하기

# summary() 사용법 : summary(object, ...)
summary(cars)
summary(trees)

summary

4-3. 산점도 그리기

# 산점도 plot() 사용법 : plot(data, pch=(점모양:1~25), cex=(점크기배수), col=(색상:RGB값))
plot(cars)
plot(cars, pch=20, cex=0.5)

plot plot

4-4. 산점도 내 라인 추가해서 그리기

# lm() : 선형회귀분석 함수
# lm() 사용법 : lm(formula, data) = lm(종속변수~독립변수, data)
lm.cars <- lm(dist~speed, cars)
lm.cars
abline(lm.cars, col="blue")

abline

댓글남기기