데이타와 데이타 분석 프로그램
데이터란 ?
이론을 수립하는데 기초가 되는 사실 또는 바탕이 되는 자료이다.
데이터는 관찰, 실험, 조사로 얻은 객관적인 사실이나 자료를 의미하며 컴퓨터에서는 컴퓨터가 처리할 수 있는 문자, 숫자, 소리, 이미지의 형태로 된 자료를 의미한다. 데이터는 ‘정보’가 아닌 ‘자료’ 이며, 석유를 가공하여 일상생활에서 다양한 형태로 사용하듯 데이터 역시 적절하게 가공되어 정보로서 역할을 한다.
데이터는 가공 및 처리 절차를 거쳐 정보로 변환되며, 가공된 데이터 즉 정보는 다양한 분야에서 목적에 맞게 활용될 수 있으며 정보를 변환하는 것을 넘어 지식과 지혜를 얻는 단계 또한 존재한다.
데이터 가공 및 처리과정 예시
- 데이터 : 일별 강수량
 - 정보 : 지역별 연간 최대 강수량
 - 지식 : 특정 지역의 연간 최대 강수량과 지형, 배수 시설 등의 기존 정보와 결합하여 도출한 수해 대책 매뉴얼
 - 지혜 : 특정 지역의 수해 피해를 최소화하기 위한 배수시설 개선안
 
DIKW 피라미드
- 데이터 (Data) -> 정보 (Information) -> 지식(Knowledge) -> 지혜 (Wisdom)
 
데이터 분석을 위한 필요 능력
- 데이터 추출 능력 : SQL, JSON, NoSQL
 - 통계 및 분석 능력 : 통계 및 분석기법
 - 분석 프로그램 활용 : R, 파이썬
 - 다양한 분야의 의사소통 능력 : 비즈니스 문제 정의, 방법론, 시각화 도구
 
데이터 분석을 위한 프로그램
1. FineReport
 

| 장점 | 단점 | 
|---|---|
| • 풍부한 시각화   • 간단한 조작성 • Low Coding • 엑셀과 유사한 인터페이스  | 
      • 개인체험판 제공되지만 유료 프로그램 | 
2. R

| 장점 | 단점 | 
|---|---|
| • 오픈소스 무료  • 동적 환경 • 다양한 그래픽과 차트 • 데이터 분석, 조작, 계산에 특화  | 
      • 범용 프로그램 언어로는 제한적  • 데이타가 너무 큰 경우 속도 저하  | 
    
3. Python

| 장점 | 단점 | 
|---|---|
| • 빅데이터 분석, 기계학습에 이용  • 다양한 차트 라이브러리 • 다양한 분야에서 사용되는 유연성 • 쉬운 사용법 • RStudio와 같은 IDE 제공  | 
      • R에 비해 통계 분석에 미흡 | 
데이터 분석 프로그램 선택
결론적으로 분석 프로그램은 각각의 장단점을 가지고 있으며 R은 통계 및 데이터 분석에 특화되어 있고, 파이썬은 범용성이 높다. 따라서 분석 작업의 목적에 맞게 분석프로그램을 선택하면 된다.

Reference
- 빅데이터분석기사 (주)도서출판 성안당
 
      
      
      
      
댓글남기기