데이타와 데이타 분석 프로그램
데이터란 ?
이론을 수립하는데 기초가 되는 사실 또는 바탕이 되는 자료이다.
데이터는 관찰, 실험, 조사로 얻은 객관적인 사실이나 자료를 의미하며 컴퓨터에서는 컴퓨터가 처리할 수 있는 문자, 숫자, 소리, 이미지의 형태로 된 자료를 의미한다. 데이터는 ‘정보’가 아닌 ‘자료’ 이며, 석유를 가공하여 일상생활에서 다양한 형태로 사용하듯 데이터 역시 적절하게 가공되어 정보로서 역할을 한다.
데이터는 가공 및 처리 절차를 거쳐 정보로 변환되며, 가공된 데이터 즉 정보는 다양한 분야에서 목적에 맞게 활용될 수 있으며 정보를 변환하는 것을 넘어 지식과 지혜를 얻는 단계 또한 존재한다.
데이터 가공 및 처리과정 예시
- 데이터 : 일별 강수량
- 정보 : 지역별 연간 최대 강수량
- 지식 : 특정 지역의 연간 최대 강수량과 지형, 배수 시설 등의 기존 정보와 결합하여 도출한 수해 대책 매뉴얼
- 지혜 : 특정 지역의 수해 피해를 최소화하기 위한 배수시설 개선안
DIKW 피라미드
- 데이터 (Data) -> 정보 (Information) -> 지식(Knowledge) -> 지혜 (Wisdom)
데이터 분석을 위한 필요 능력
- 데이터 추출 능력 : SQL, JSON, NoSQL
- 통계 및 분석 능력 : 통계 및 분석기법
- 분석 프로그램 활용 : R, 파이썬
- 다양한 분야의 의사소통 능력 : 비즈니스 문제 정의, 방법론, 시각화 도구
데이터 분석을 위한 프로그램
1. FineReport
장점 | 단점 |
---|---|
• 풍부한 시각화 • 간단한 조작성 • Low Coding • 엑셀과 유사한 인터페이스 |
• 개인체험판 제공되지만 유료 프로그램 |
2. R
장점 | 단점 |
---|---|
• 오픈소스 무료 • 동적 환경 • 다양한 그래픽과 차트 • 데이터 분석, 조작, 계산에 특화 |
• 범용 프로그램 언어로는 제한적 • 데이타가 너무 큰 경우 속도 저하 |
3. Python
장점 | 단점 |
---|---|
• 빅데이터 분석, 기계학습에 이용 • 다양한 차트 라이브러리 • 다양한 분야에서 사용되는 유연성 • 쉬운 사용법 • RStudio와 같은 IDE 제공 |
• R에 비해 통계 분석에 미흡 |
데이터 분석 프로그램 선택
결론적으로 분석 프로그램은 각각의 장단점을 가지고 있으며 R은 통계 및 데이터 분석에 특화되어 있고, 파이썬은 범용성이 높다. 따라서 분석 작업의 목적에 맞게 분석프로그램을 선택하면 된다.
Reference
- 빅데이터분석기사 (주)도서출판 성안당
댓글남기기