데이터사이언스란
데이터 사이언스(Data Science)란?
다양한 형태(정형, 비정형 등)의 데이터를 정제, 준비, 분석하는 활동(방법론, 프로세스, 알고리즘, 시스템)
데이터 사이언스 작업
- 데이터 수집 (Data Collection)
- 데이터 탐색 & 시각화 (EDA & Visualization)
- 실험 & 예측 (Experimentation & prediction)
- 보고서 & 대쉬보드 (Report & Dashboard)
- API & Code
빅데이터(Big Data)란?
엄청난 양의 데이터, 다양한 형태의 정보 자산
데이터 분석(Data Analytics)란?
의사결정을 위한 데이터를 모으고 변환, 분류하고 특징을 찾아내 한눈에 파악할 수 있도록 시각적인 표현을 해주는 행위
데이터 관리
데이터 처리 기술
- 수집 : ETL, 크롤링, 로그 수집, OPEN API
- 공유 : 멀티 테넌트 데이터 공유
- 저장 : 병렬 DBMS, Hadoop, NoSQL
- 처리 : 실시간 처리, 분산 병렬 처리, 인-메모리 처리, 인-데이터베이스 처리
- 분석 : 통계분석, 데이터 마이닝, 텍스트 마이닝, 예측분석, 최적화
- 시각화 : 분포, 관계, 공간, 비교, 인포그래픽