데이터란 ?

이론을 수립하는데 기초가 되는 사실 또는 바탕이 되는 자료이다.

데이터는 관찰, 실험, 조사로 얻은 객관적인 사실이나 자료를 의미하며 컴퓨터에서는 컴퓨터가 처리할 수 있는 문자, 숫자, 소리, 이미지의 형태로 된 자료를 의미한다. 데이터는 ‘정보’가 아닌 ‘자료’ 이며, 석유를 가공하여 일상생활에서 다양한 형태로 사용하듯 데이터 역시 적절하게 가공되어 정보로서 역할을 한다.

데이터는 가공 및 처리 절차를 거쳐 정보로 변환되며, 가공된 데이터 즉 정보는 다양한 분야에서 목적에 맞게 활용될 수 있으며 정보를 변환하는 것을 넘어 지식과 지혜를 얻는 단계 또한 존재한다.

데이터 가공 및 처리과정 예시

  • 데이터 : 일별 강수량
  • 정보 : 지역별 연간 최대 강수량
  • 지식 : 특정 지역의 연간 최대 강수량과 지형, 배수 시설 등의 기존 정보와 결합하여 도출한 수해 대책 매뉴얼
  • 지혜 : 특정 지역의 수해 피해를 최소화하기 위한 배수시설 개선안

DIKW 피라미드

  • 데이터 (Data) -> 정보 (Information) -> 지식(Knowledge) -> 지혜 (Wisdom) DIKW 피라미드

데이터 분석을 위한 필요 능력

  • 데이터 추출 능력 : SQL, JSON, NoSQL
  • 통계 및 분석 능력 : 통계 및 분석기법
  • 분석 프로그램 활용 : R, 파이썬
  • 다양한 분야의 의사소통 능력 : 비즈니스 문제 정의, 방법론, 시각화 도구

데이터 분석을 위한 프로그램

1. FineReport

https://www.finereport.com/

FineReport FineReport

장점 단점
• 풍부한 시각화
• 간단한 조작성
• Low Coding
• 엑셀과 유사한 인터페이스
• 개인체험판 제공되지만 유료 프로그램

2. R

https://storm.apache.org/

장점 단점
• 오픈소스 무료
• 동적 환경
• 다양한 그래픽과 차트
• 데이터 분석, 조작, 계산에 특화
• 범용 프로그램 언어로는 제한적
• 데이타가 너무 큰 경우 속도 저하

3. Python

https://www.python.org/

장점 단점
• 빅데이터 분석, 기계학습에 이용
• 다양한 차트 라이브러리
• 다양한 분야에서 사용되는 유연성
• 쉬운 사용법
• RStudio와 같은 IDE 제공
• R에 비해 통계 분석에 미흡

데이터 분석 프로그램 선택

결론적으로 분석 프로그램은 각각의 장단점을 가지고 있으며 R은 통계 및 데이터 분석에 특화되어 있고, 파이썬은 범용성이 높다. 따라서 분석 작업의 목적에 맞게 분석프로그램을 선택하면 된다.


Reference

  • 빅데이터분석기사 (주)도서출판 성안당

댓글남기기