일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- 독후감
- 데이터분석
- Recsys
- 티스토리챌린지
- 글또10기
- CausalInference
- 빅쿼리
- 벡터
- SQL
- Bayesian
- 잠재적결과
- 회고
- DataAnalyst
- 인과추론개요
- 인과추론 무작위 실험
- 선형대수학
- 네카라쿠배당토
- mathematicalthinking
- 수학적해석학
- chatGPT
- 코세라
- 실무로통하는인과추론
- 나의서양미술순례
- 베이지안통계
- recommendation system
- BigQuery
- 데이터분석가 코딩테스트
- 인과추론
- 오블완
- 데이터분석가
- Today
- Total
목록전체 글 (63)
Derek 의 데이터 분석 성장기
Chaptet 1. 나의 키워드 게임에 미쳐있던 10년, 소말리아 해외 파병, 편입, LA 해외인턴, 평창동계올림픽 조직위원회, AnR, 데이터분석가 등 저는 여러 경험이 융합 된 사람입니다. 어렸을적 부터 돌아보면 저는 한 가지에 몰입 되는 것을 잘 하는 사람이였습니다. 학창시절에는 게임을 너무 좋아했습니다. 지금 돌이켜 보면 그 시간들은 제 학업성취와 그 당시에만 누릴 수 있었던 찬란한 시간들을 가져갔습니다. 하지만, 그때의 아쉬움 때문일까. 22살 이후로 제 인생은 완전히 달라졌습니다. Chapter 2. 해군 군함이 타고 싶어 주체적으로 해군을 선택하고 해외 파병을 가기 위해 군함의 중령에게 직접 제가 왜 이 군함에 필요한 인재인지 단독 대면으로 제 자신을 어필했습니다. 어쩌면 그때부터 인지 모르..

진정한 나를 찾아주는 책. Ego(자아)와 나는 분리 된 존재이다. 자아에 본인을 대입하는 순간. 우리는 우리 자신을 찾지 못한다.1. 사건, 자아, 나의 분리누군가 나에게 책 1권을 추천한다면, 나는 거리낌 없이 이 책을 추천 할 것이다. 이유는 다양하겠지만, 이 책은 나에게 사건(Event) 자아(Ego) 나(I)는 구분된 존재라는 새로운 지식을 일 깨워 준 책이기 때문이다. 그렇다면, 이 3가지 분리는 왜 나에게 의미가 있을까? 에고는 '나'라는 존재를 말하고 싶어한다. 에고는 지위나 명예, 신앙, 곡브 브랜드와 상품, 외모 등으로 나 자신을 동일화하길 원한다. 그러나, 그것들은 결국 자기 자신이 아니기 때문에 무엇과 동일화되든 에고는 결코 만족할 수가 없다. 때문에, 에고는 계속 동일화된 외..
1. 후기 오랜만에 가짜연구소라는 커뮤니티에서 외부 스터디를 진행했다. 가짜연구소에는 러너와 빌더, 그리고 연에 1-2번 자체적으로 세미나를 진행할 정도로 큰 데이터 및 개발 커뮤니티라고 할 수 있다. 나는 선형대수 스터디를 진행했는데, 그 이유는 추천시스템이나 벡터의 내적 등에서 라이브러리 및 프로젝트는 진행해도, 그 원천인 선형대수에 대해서는 진지하게 공부해본적이 없기 때문이다. 우선, 대체적으로 대학생분들이 진행하는 스터디 였기 때문에 나 또한 오랜만에 학부생 느낌으로 공부하는 느낌이 들어 좋았다. 실무적 관점이 아닌, 학습 및 수식적 관점으로 진행하는 스터디가 내가 원했던 취지와 비슷한 것 같다. 특히, 인하대학교 김종한 교수님(링크) 수업을 기반으로 진행했는데, 무료로 학부생 수준의 수업을 듣는..

" 해당 정리글은 세상에서 가장 쉬운 베이즈 통계학 입문(링크) 를 기반으로 정리, 내용이 첨부되어있습니다" 세상에서 가장 쉬운 베이즈 통계학 입문은 위와 같이 도형의 면적을 활용하여 베이지안 통계학을 쉽게 설명한다. Q. 해당 내용은 어느 특정 암에 걸릴 확률이 0.1%(0.001) 이라고 하자. 이 암 검사를 진행하는데, 암에 걸려있는 사람은 95% 확률로 양성 진단을 받는다고 하자. 한편, 건강한 사람이 양성으로 오진을 받을 확률은 2% 다. 이 검사에서 양성이라고 진단 받았을때, 암에 걸려 있을 확률은 얼마일까? 라는 사전 확률과 조건부 확률을 기반으로 베이지안을 설명한다. * 면적은 A라는 사건이 발생 할 때, A가 발생하면서 B가 발생하는 조건부 확률을 면적으로 계산하여 풀어나간다.EX) 암..

평소 책을 사러 가는 과정을 좋아합니다. 온라인보다는 서점에 직접 가서 책을 구매하는 과정을 즐기는 편입니다. 서점에 도착하여 여러 책을 둘러보는 것은 제게 굉장히 흥미로운 하나의 탐험입니다. 다양한 디자인으로 된 책을 눈으로 보며, 책만이 줄 수 있는 활자로 된 가르침에 대한 기대감이 크기 때문인 것 같습니다. 제가 큰 대형서점에 방문했을 때, 는 이미 가판대에 진열되어 있었습니다. '음, 역시 히사이시조에 대한 책이기 때문에 인기가 많구나. 이번 책도 큰 인사이트를 줄 수 있겠네' 라고 생각했습니다. 하지만, 해당 책은 큰 울림을 주진 못했습니다. 책을 읽으며 이 책이 쓰여진 이유와 목적성에 대해 고민했습니다. '어떤 목적을 가지고 이 책은 쓰여졌을까?' 라는 생각이 들었고, 두 거장의 대화를 ..

참고 강의 : 김종한 교수님 - Linear Equations(선형방정식) (https://www.youtube.com/watch?v=ex3FOxSoqbQ) Linear Euqations 은 선형 방정식들을 의미한다. a1x1+a2x2+⋯+anxn=b 일차식으로 나타나는 값을 의미한다.이 때 앞에 표시되는 계수 a1,a2,⋯an은 실수혹은 허수가 올 수 있으며, 그리고 이러한 계수들을 coefficient라고 부른다. 사실, 해당 내용들은 이미 기전에 배운 모든 Linear Combination, Regression Model 등에 해당 되는 내용이다. Regression Model 의 예측결과 또한 X 라는 벡터에 B 를 곱셈하고, Error Term(v) 를 더해준 결과를 의..

베이지안에서 사후확률은 사전확률과 관측(증거) 와 가능도를 기반으로 확률이 업데이트 된다. 사전확률 * Likelihood(가능도)를 곱하고 정규화한 값으로 나누었을 때, 사후확률을 업데이트 할 수 있다. 예를 들어, 101개의 쿠키 그릇이 있다고 가정해보자.그리고, 각 그릇 번호마다 바닐라 쿠키가 들어있는 % 이다. EX) 그릇 0 에는 바닐라 쿠키가 0% 있다.EX1) 그릇1에는 바닐라 쿠키가 1% 있다.EXn) 그릇n 에는 바닐라 쿠키가 n% 있다.EX100) 그릇100에는 바닐라 쿠키가 100% 있다. 여기서 그릇을 임의로 골라 쿠키를 골랐을때, 이 쿠키가 바닐라 쿠키였다. 이때 각 값 x에 대해 그릇 x에서 쿠키가 나왔을 확률은 얼마일까? 그리고, 이는 쿠키를 101개의 그릇에서 꺼냈기 때문에..

매트릭스 벡터의 곱은 매트릭스가 m * n 이라고 하면, 곱하기 위한 원소의 길이는 매트릭스의 칼럼인 n과 길이가 같아야 한다. Row Interpretation 이란 매트릭스 안에 있는 ROW 의 각 원소에 특정 값 x를 곱한 겂의 합 b1Tx + b2Tx ... bnTx 형식으로 row 별로 값을 반환한다. Pandas 기준으론 Row 데이터에 각 곱을 해준다고 상상하면 된다. 그리고 그 row 값들의 합을 각 행 별로 반환한 것. Column Interpreation 은 반대로, 각 칼럼을 기준으로 곱하면 된다. 이는 Linear Combination과도 같다. 0 * 2 + 2 * 1 + -1 * -1 로 기존 매트릭스 형태에서 칼럼 기준으로 곱을 해주고, 각 칼럼 첫자리에 있는 곱의 ..