테키테크 TEKITECH
비즈니스 데이터 과학 - 비즈니스 의사결정을 위한 통계학, 경제학, 인공지능의 만남 본문
비즈니스 데이터 과학 비즈니스 의사결정을 위한 통계학, 경제학, 인공지능의 만남
맷 태디 지음 | 이준용 옮김 | 한빛미디어 | 2022년 06월 29일 출간
이 책은
✔️ 예제에서 모든 분석은 R로 수행한다.
R뿐만 아니라 모든 목적에 있어 최적인 언어는 없다고 한다. 프로그래밍 언어를 하나만 배워서 컴퓨팅 기술을 온전히 사용할 수는 없다. 단, 저자는 데이터 과학을 배우는 데 가장 좋은 언어는 R이라고 한다. 분산 컴퓨팅 환경이나 구조화되지 않은 데이터 등에 접근하려면 파이썬, SQL 등 다른 언어가 필요하다는 한계는 있지만 그래도 R은 거의 모든 데이터 형식을 읽을 수 있다는 점에서 그렇다.
✔️ 수학, 프로그래밍, 비즈니스를 배운 다음 데이터 과학에서 필요한 내용을 가르쳐준다.
과학자, 비즈니스 전문가, 엔지니어 등 데이터 과학 기술을 습득하려는 사람들은 각자의 영역에서 수학, 프로그래밍, 비즈니스 등을 이미 배웠다. 이 책에서는 그다음 필요한 데이터 과학 기술을 가르쳐준다. 여기에는 다음의 개념들이 포함된다.
- 이미 알고 있는 것을 확률이라는 도구로 표현할 때 사용하는 불확실성
- 입력 또는 공변량 벡터(x)에 대한 함수로 반응 변수(y)를 모델링하거나 예측하는 회귀 모델링
- 표본 내(IS) 편차보다 중요한 표본 외(OOS) 편차를 고려한, 즉 모델이 새로운 데이터에 얼마나 맞는가를 고려한 고차원 모델 정규화
- 좋은 확률 모델을 통한 좋은 분류
- 현실에서 미래 예측을 위한 반사실적 분석과 실험 및 관찰 연구
- 지도 학습과 비지도 학습에서 차원 축소 방법과 효과 및 해석 방법
- 언어 토큰(문법적으로 의미 있는 최소 단위) 기반 텍스트 회귀, 텍스트의 주제 기반 토픽 모델링 등 NLP
- 선형 모델과 같이 모수(parameter)가 있고, 이 모수를 최적화하여 데이터에 모델을 적합하는 모수 분석과 회귀 알고리즘과 같이 x와 y의 관계에 대한 가정이 더 적은 비모수 분석, 그리고 가장 순수한 형태에서 더 많은 데이터를 관찰함으로써 x와 y의 진정한 관계를 학습하는 완전 비모수적 기술
✔️ 수학적이고 조금 어려운 내용이지만 실제 데이터 분석에 필요한 핵심 개념을 공부하고 싶다면 추천한다.
데이터 분석을 전공하지 않으면서 이를 공부하려면 편파적으로만 알기 쉽고, 또 깊이가 부족하다고 느껴지기도 한다. 사실 이 책은 디자인도, 책의 내용도 전공 도서 같은 느낌이어서 거부감이 들었었다. 하지만 하나하나 공부할수록 대충 이해만 하고 넘어갔거나 구글에서 얕게 공부했던 개념들이 새롭게 이해되는 느낌이 들어서 앞으로도 좀 더 이 책을 공부해보려고 한다.
'그리고 > 책' 카테고리의 다른 글
오라일리 개발자를 위한 머신러닝&딥러닝 / 한빛미디어 (0) | 2023.04.23 |
---|---|
혼자 공부하는 데이터 분석 with 파이썬 / 한빛미디어 (0) | 2023.02.09 |
이모티콘 만들기 (0) | 2022.11.27 |
데이터로 전문가처럼 말하기 - 칼 올친 (0) | 2022.10.02 |
오늘부터 IT를 시작합니다 / 고코더 지음 / 한빛미디어 출판 / 2022년 출간 (0) | 2022.08.24 |