티스토리 뷰

728x90
반응형

기간 : 20230820 ~ 20230918
 

기억하고 싶은 문장

"측정할 수 없으면 관리할 수 없다"
 

내용 정리

데이터 과학의 2가지 요소
- 1) 데이터, 2) 합리적 의사결정
- 의사결정에서 탐욕을 배제하기 어려움
- 데이터과학으로 무장한 전문자에 의한 관리, 감독 필수

평가 방법을 잘 알면 허점을 이용하여 평가도를 높일 수 있다
ex) 금융회사는 신용평가기관의 평가 기법을 잘 알고 있음

우리가 관심을 두는 사건은 어떨 때는 발생하고 어떨 때는 발생하지 않는 사건
- 20세기까지는 확실한 사건만 연구함 (해가 뜨고 지는 것, 개나리가 피는 것 등)
- 21세기 현재는 아님 (내일 비가 내리는 사건, 주가가 올라가는 사건 등)

요약은 성공에 중요한 열쇠 (ex. 선생님, 참고서, 학생 등)
- 평균 등 요약 지표에만 집중하면 안 됨
- 변동을 알고 변동의 원인을 파악하여 변동을 줄여야 함

폭력 영화와 폭력성의 연관성
- 연구 결과 오히려 반비례 관계
- 영화 관람보다는 폭력적인 친구들과 술을 마실 때 폭력성이 쉽게 발현

차원의 저주
- 데이터 분석 시 고려되는 조건의 수
- 배우자를 찾을 때 많은 것을 요구하면 만나기 어려운 것과 같은 이치

앙상블 방법론
- 성능은 좀 떨어지지만 다양한 답을 제공하는 여러 개의 예측 방법을 결합하는 방식
- 우수한 인재 10명보다 다양한 의견을 내는 10명의 의견이 훨씬 유용할 수 있음

로또 숫자 조합
- 6개 숫자의 합은 106~170이 많음 -> 해당 숫자 사이이면 당첨될 가능성이 높다? X
- 가능한 조합이 많기 때문에 당첨될 확률은 전혀 오르지 않음

조사 데이터는 설문지를 작성하는 조사전문가의 지식을 넘어서는 정보를 얻을 수 없다

기계 학습
- 컴퓨터가 데이터로부터 스스로 알고리즘을 찾아낼 수 있는 알고리즘을 개발하는 것
- 즉, 알고리즘의 알고리즘을 만드는 것

데이터과학자는 요리사이다
- 요리의 4요소 : 데이터(재료), 서버(조리도구), 알고리즘(조리법), 분석가(요리사)
- 데이터 분석가의 역량이 중요함 (요리를 맛있게 만드는 데 가장 중요한 요소)
- 데이터과학은 통계와 컴퓨터로 무장한 조화의 예술
 

새로 배운 단어

  • 역학(epidemiology)
    • 효율적인 예방법을 탐색하는 예방의학의 한 분야
    • 인구 집단 안에서 발생하는 생리 및 이상 상태의 빈도와 분포 기술 및 원인 분석을 통해 이뤄짐
  • 검약의 원리(Principle of Parsimony)
    • 불필요한 가정이 없는 가장 단순한 설명을 선택하는 방법
    • 오컴의 면도날, 경제성의 원리 등으로도 불림
  • 연합학습(Federated Learning)
    • 기기나 기관이 여러 위치에 분산 저장된 데이터를 통해 학습하게 하는 방법
    • 데이터 프라이버시 향상과 커뮤니케이션 효율성을 위해 사용

 

느낀 점

Data Scientist 양성 과정에서 만난 김용대 교수님이 직접 본인이 쓴 책을 나눠주셔서 읽어보았다.

책의 전체적인 구성과 논리, 그리고 포함된 예시들이 적절했고 어느정도 배경지식이 있어서 그런지 모르겠지만 쉽고 수월하게 읽을 수 있었다. 다만, 교수님의 강의를 들은지 얼마 되지 않아서 그런지.. 이 책을 통해 데이터과학과 관련하여 얻은 것은 없었다. 책이 별로라는 뜻은 절대 아니고 책의 거의 모든 내용이 수업 중에 설명했던 것들로 구성되어 있기 때문인 것 같다.

대신 교수님의 통찰이 담긴 생각을 글로 읽으며 곱씹어볼 수 있던 것은 상당히 유익한 경험이었다. 본인도 공대 출신이고 완전한 T 성향이라 딱 맞아떨어지는 논리적인 수식과 이론을 좋아하지만 아이러니하게도 인간과 사회에 대한 통찰을 철학적인 비유로 표현한 문장에 더 크게 반응하는 것 같다. 책에 그러한 표현이 상당히 많이 있는데, 이를 내가 알던 지식과 연결하며 깨닫는 과정이 꽤나 재미있었다.


책의 내용과는 약간 결이 다른 얘기지만 개인적으로 사람은 동질감이 아닌 이질감을 즐겨야 한다고 생각한다. 그래야 다양성을 받아들이고 관대해지며 많은 것을 수용할 수 있는, 다시 말해 그릇이 큰 사람이 될 수 있기 때문이다. 또 그런 태도를 가져야만 새로운 것을 지속적으로 배우며 성장할 수 있게 되고 그 결과로 스스로 유능감을 느끼며 행복하게 살아갈 수 있다고 생각한다.

어린 시절부터 분야를 넘나드는 폴리매스 or 제너럴리스트가 되고 싶다는 생각을 쭉 해왔었다. SW 개발자 특성 상 업무적으로 둘러 쌓인 것이 이과적 지식, 논리 투성이니 의도적으로라도 문과 분야(철학, 심리학 등)를 공부하면서 시야를 넓힐 필요가 있겠다는 다짐을 하게 됐다. (저자의 의도와 전혀 다른 방향으로 깨달음을 얻은 것 같다)


급하게 방향을 전환해서 책 추천 요약을 하고 감상평을 마쳐야겠다. 데이터 과학자나 혹은 데이터 과학 분야 자체에 흥미를 가지고 있거나 혹은 기초 통계, 데이터 마이닝, 빅데이터, 기계 학습 등의 keyword에 관심이 있다면 가볍게 읽어보면서 입문하기에 좋은 책이 될 것 같다

728x90
반응형
댓글