데이터사이언스란

데이터 사이언스(Data Science)란?

다양한 형태(정형, 비정형 등)의 데이터를 정제, 준비, 분석하는 활동(방법론, 프로세스, 알고리즘, 시스템)

데이터 사이언스 작업

  • 데이터 수집 (Data Collection)
  • 데이터 탐색 & 시각화 (EDA & Visualization)
  • 실험 & 예측 (Experimentation & prediction)
  • 보고서 & 대쉬보드 (Report & Dashboard)
  • API & Code

빅데이터(Big Data)란?

엄청난 양의 데이터, 다양한 형태의 정보 자산

데이터 분석(Data Analytics)란?

의사결정을 위한 데이터를 모으고 변환, 분류하고 특징을 찾아내 한눈에 파악할 수 있도록 시각적인 표현을 해주는 행위

데이터 관리

데이터 처리 기술

  • 수집 : ETL, 크롤링, 로그 수집, OPEN API
  • 공유 : 멀티 테넌트 데이터 공유
  • 저장 : 병렬 DBMS, Hadoop, NoSQL
  • 처리 : 실시간 처리, 분산 병렬 처리, 인-메모리 처리, 인-데이터베이스 처리
  • 분석 : 통계분석, 데이터 마이닝, 텍스트 마이닝, 예측분석, 최적화
  • 시각화 : 분포, 관계, 공간, 비교, 인포그래픽