테키테크 TEKITECH

비즈니스 데이터 과학 - 비즈니스 의사결정을 위한 통계학, 경제학, 인공지능의 만남 본문

그리고/책

비즈니스 데이터 과학 - 비즈니스 의사결정을 위한 통계학, 경제학, 인공지능의 만남

TEKI 2022. 12. 30. 17:33

비즈니스 데이터 과학 비즈니스 의사결정을 위한 통계학, 경제학, 인공지능의 만남
맷 태디 지음 | 이준용 옮김 | 한빛미디어 | 2022년 06월 29일 출간


이 책은

✔️ 예제에서 모든 분석은 R로 수행한다.
R뿐만 아니라 모든 목적에 있어 최적인 언어는 없다고 한다. 프로그래밍 언어를 하나만 배워서 컴퓨팅 기술을 온전히 사용할 수는 없다. 단, 저자는 데이터 과학을 배우는 데 가장 좋은 언어는 R이라고 한다. 분산 컴퓨팅 환경이나 구조화되지 않은 데이터 등에 접근하려면 파이썬, SQL 등 다른 언어가 필요하다는 한계는 있지만 그래도 R은 거의 모든 데이터 형식을 읽을 수 있다는 점에서 그렇다.

✔️ 수학, 프로그래밍, 비즈니스를 배운 다음 데이터 과학에서 필요한 내용을 가르쳐준다.
과학자, 비즈니스 전문가, 엔지니어 등 데이터 과학 기술을 습득하려는 사람들은 각자의 영역에서 수학, 프로그래밍, 비즈니스 등을 이미 배웠다. 이 책에서는 그다음 필요한 데이터 과학 기술을 가르쳐준다. 여기에는 다음의 개념들이 포함된다.

  • 이미 알고 있는 것을 확률이라는 도구로 표현할 때 사용하는 불확실성
  • 입력 또는 공변량 벡터(x)에 대한 함수로 반응 변수(y)를 모델링하거나 예측하는 회귀 모델링
  • 표본 내(IS) 편차보다 중요한 표본 외(OOS) 편차를 고려한, 즉 모델이 새로운 데이터에 얼마나 맞는가를 고려한 고차원 모델 정규화
  • 좋은 확률 모델을 통한 좋은 분류
  • 현실에서 미래 예측을 위한 반사실적 분석과 실험 및 관찰 연구
  • 지도 학습과 비지도 학습에서 차원 축소 방법과 효과 및 해석 방법
  • 언어 토큰(문법적으로 의미 있는 최소 단위) 기반 텍스트 회귀, 텍스트의 주제 기반 토픽 모델링 등 NLP
  • 선형 모델과 같이 모수(parameter)가 있고, 이 모수를 최적화하여 데이터에 모델을 적합하는 모수 분석과 회귀 알고리즘과 같이 x와 y의 관계에 대한 가정이 더 적은 비모수 분석, 그리고 가장 순수한 형태에서 더 많은 데이터를 관찰함으로써 x와 y의 진정한 관계를 학습하는 완전 비모수적 기술


✔️ 수학적이고 조금 어려운 내용이지만 실제 데이터 분석에 필요한 핵심 개념을 공부하고 싶다면 추천한다.
데이터 분석을 전공하지 않으면서 이를 공부하려면 편파적으로만 알기 쉽고, 또 깊이가 부족하다고 느껴지기도 한다. 사실 이 책은 디자인도, 책의 내용도 전공 도서 같은 느낌이어서 거부감이 들었었다. 하지만 하나하나 공부할수록 대충 이해만 하고 넘어갔거나 구글에서 얕게 공부했던 개념들이 새롭게 이해되는 느낌이 들어서 앞으로도 좀 더 이 책을 공부해보려고 한다.

반응형
Comments