목록그리고/책 (23)
테키테크 TEKITECH
이 책을 보자마자 데이터 엔지니어 필독서로 유명한 「빅데이터를 지탱하는 기술」이라는 책이 떠올랐다. 아직 두 책 모두를 완벽하게 소화하지는 못했지만 그래도 비교해 보니 몇 가지 차이점이 보였다. 1. 「견고한 데이터 엔지니어링」은 「빅데이터를 지탱하는 기술」 보다 더 최신 데이터 엔지니어링에 대한 정보를 담고 있다. 「빅데이터를 지탱하는 기술」의 원서는 2017년에 최초로 발행되었고, 「견고한 데이터 엔지니어링」의 원서는 2022년에 최초로 발행되었다. 2. 「견고한 데이터 엔지니어링」은 「빅데이터를 지탱하는 기술」 보다 두껍다. 「빅데이터를 지탱하는 기술」은 312쪽, 「견고한 데이터 엔지니어링」은 552쪽이다. 3. 「빅데이터를 지탱하는 기술」은 빅데이터를 다루는 특별한 방법에 대한 내용이고, 「견고..
서비스를 구축하고 운영하는 실무자라면 대부분 마이크로서비스를 구현하고 운영하는 전반에 대한 여러 가지 고민을 하고 있을 것 같다. 지금 속해있는 팀에서도 니즈를 빠르게 반영해 서비스를 수정하고 확장해 나갈 수 있도록 안정적이고 효율적으로 MSA를 도입하는 일에 관심이 있다. MSA는 장단점이 명확하다. 즉, MSA의 도입으로 얻을 수 있는 것과 감수해야 할 것이 명확하다는 뜻이다. 마틴 파울러가 "마이크로서비스의 특징을 이해하고 특정한 상황에 적용하는 것이 현명하다"라고 언급[1][2]하기도 했고, 실제로 MSA의 실패 사례도 적지 않은 만큼 이러한 내용을 충분히 이해할 필요가 있는데, 이 책의 저자가 중립적인 입장에서 필요한 내용을 설명해 주고 있어 MSA의 도입을 고민하는 과정에서 도움을 얻을 수 있..
넷플릭스 홈페이지 중 일부를 캡처해 보았다. 이를 들여다보면 가장 윗줄에는 넷플릭스 로고와 '시리즈', '영화', '최신 등록 콘텐츠', '내가 찜한 콘텐츠'라는 메뉴가 있고, 그 아래로는 '한국 드라마', '새로 올라온 콘텐츠', 'Teki 님의 취향저격 베스트 콘텐츠'와 같은 제목과 제목에 따라 선별된 작품들의 이미지가 나열되어 있다. 여기에는 넷플릭스만의 추천 알고리즘이 녹아있다. 위와 같이 제목과 작품이 함께 나열된 ’프레임‘은 넷플릭스 홈페이지에서 사용자에게 작품 목록을 보여주는 방식으로, 제목을 붙여 구분하고 그 성격에 맞게 선별한 작품을 사용자에게 선택적으로 보여준다. 사용자는 흥미가 생기는 프레임에 주목하여 해당 프레임의 작품만 살펴보면 시청할 작품을 빠르게 선택할 수 있다. 이 구조를 달..
"여러분은 그림 속 의류 아이템을 종류별로 알아볼 수 있습니다. 어떤 것이 셔츠, 코트, 드레스인지 구별할 수 있습니다. 하지만 옷을 한 번도 본 적 없는 사람에게 이를 어떻게 설명할 수 있을까요? 신발은 어떻게 설명할까요? 그림에는 종류가 다른 신발 두 개가 있는데 어떻게 설명해야 할까요? 이는 1장에서 이야기한 규칙 기반 프로그래밍이 실패하는 또 다른 영역입니다. 이따금 규칙으로 무언가를 설명하기가 불가능한 경우가 있습니다. 컴퓨터 비전도 예외가 아닙니다. 하지만 여러분이 이런 아이템을 인식하는 방법을 생각해보죠. 여러 가지 샘플을 보고 사용 방법을 경험하고, 이를 기반으로 사물을 구별합니다. 그렇다면 컴퓨터로 이 과정을 똑같이 해낼 수 있을까요? 네, 할 수 있습니다. (...중략...) 의류 아이..
데이터 과학은 데이터 세계와 비즈니스 세계를 잇는 다리입니다. - Ji Li 위 문장은 책에서 데이터 과학자 Ji Li가 Quora에 올린 글을 번역한 내용 중 일부이다. 이 문장은 '데이터 분석'과 '데이터 과학'의 차이점을 잘 드러낸다. 글의 다음 내용을 더 읽어보면 "데이터 과학을 하려면 프로그래밍, 통계학, 시각화와 더불어 비즈니스 감각을 갖추어야 합니다."라고 말한다. 즉, 데이터 과학은 아주 넓은 범위를 아우른다는 말이다. 반면 데이터 분석은 데이터 과학의 한 부분에 해당한다. '결과물'을 중점으로 이해해 보면 데이터 과학은 문제 해결을 위한 최선의 솔루션을 만드는 데 초점을 맞춘다면, 데이터 분석은 올바른 의사 결정을 돕기 위한 통찰을 제공하는 데 초점을 맞추고 있다. 이 책에서는 데이터 분..
비즈니스 데이터 과학 비즈니스 의사결정을 위한 통계학, 경제학, 인공지능의 만남 맷 태디 지음 | 이준용 옮김 | 한빛미디어 | 2022년 06월 29일 출간 이 책은 ✔️ 예제에서 모든 분석은 R로 수행한다. R뿐만 아니라 모든 목적에 있어 최적인 언어는 없다고 한다. 프로그래밍 언어를 하나만 배워서 컴퓨팅 기술을 온전히 사용할 수는 없다. 단, 저자는 데이터 과학을 배우는 데 가장 좋은 언어는 R이라고 한다. 분산 컴퓨팅 환경이나 구조화되지 않은 데이터 등에 접근하려면 파이썬, SQL 등 다른 언어가 필요하다는 한계는 있지만 그래도 R은 거의 모든 데이터 형식을 읽을 수 있다는 점에서 그렇다. ✔️ 수학, 프로그래밍, 비즈니스를 배운 다음 데이터 과학에서 필요한 내용을 가르쳐준다. 과학자, 비즈니스 ..
이모티콘은 아주 흔하고, 언제든 손이 닿을 듯 가까운 곳에 있다. 그래서 이모티콘으로 수익을 내보는 일 정도는 나도 해볼 만하다는 생각이 든다. 모두 같은 마음인지 지난해만 해도 이모티콘 제작 관련 도서가 매달 몇 권씩 나오고, 관련 강좌는 수십 개씩 쏟아져 나왔다. 쉽게 버는 돈은 없다. 쉬워 보이는 만큼 빠르게 레드오션이 된 이모티콘 시장에서 이모티콘 등록 승인받는 건 하늘의 별따기고, 등록 후에도 대중의 눈에 띄어 인기를 얻지 못하면 수익률이 이모티콘 제작에 들인 노력에 비해 턱없이 모자란다고 한다. 이런저런 말이 들려오지만 '그래도 나는 이모티콘을 만들고 싶어'라고 생각이 든다면 이미 수많은 자료를 찾아보고 있을 거라고 예상한다. 어느 정도 정보를 수집했다면, 롤모델을 정해 공부하는 것이 필요할 ..
데이터로 전문가처럼 말하기 효율적 의사 전달을 위한 데이터 시각화와 비즈니스 스토리텔링의 기술 칼 올친 지음 / 이한호 옮김 / 한빛미디어 / 2022년 8월 30일 출간 인턴 시절, 존경하던 사수는 수십 장 문서보다도 잘 그린 그림 하나가 중요하다고 가르쳐주셨었다. 엔지니어에게 글 쓰는 능력이 필요한 줄도 모르던 때였다. 그게 커뮤니케이션 스킬이고, 그 중에서도 아주 효율적인 방식을 알려주셨다는건 시간이 좀 더 지나서야 이해할 수 있었다. 이 책은 데이터 기반 커뮤니케이션에 대해 다루고 있다. 그렇기 때문에 이 책이 엔지니어를 위한 책이 아님에도 실무에 도움이 되었던 것 같다. 커뮤니케이션이 필요한 조직에 있다면, 정도는 달라도 분명 이 책에서 얻어가는 것이 있을 거라는 생각이 든다. 책의 뒷부분에서도..