일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- 베이지안통계
- 오블완
- 인과추론개요
- CausalInference
- recommendation system
- Bayesian
- 데이터분석
- 나의서양미술순례
- 코세라
- chatGPT
- 데이터분석가 코딩테스트
- DataAnalyst
- 수학적해석학
- 데이터분석가
- 인과추론 무작위 실험
- 인과추론
- 실무로통하는인과추론
- 네카라쿠배당토
- 빅쿼리
- Recsys
- BigQuery
- SQL
- mathematicalthinking
- 티스토리챌린지
- 독후감
- 잠재적결과
- 벡터
- 글또10기
- 회고
- 선형대수학
- Today
- Total
목록데이터분석 (3)
Derek 의 데이터 분석 성장기

"글쓰기는 아무것도 아니다. 당신이 할 것은 타자기 앞에 앉아서 피를 흘리는 것이다." - 어니스트 헤밍웨이" 글을 쓰면 천국으로 가거나, 가고 싶은 곳 어디든 갈 수 있다". - 조안 디디언 0. 개요 2024년 10월 달 부터 글또(글쓰는 또라이들의 모임) 10기에 참여하였습니다. 2주 간격으로 글을 작성하는 모임으로서, 대체로 개발직군에 관련된 분들이 많이 참여하는 모임입니다. 저에게는 전 회사 동료들이 참여를 하며 글을 기고 했고 도움이 많이 되었다는 의견들이 많아 참여하게 되었습니다. 그리고, 지금 작성하는 이 글이 마지막 12회차여 글또에서 활동한 회고 글을 작성해보려 합니다. 1. 글또 참여 계기글또를 참여하게 된 계기는 크게 3가지로 생각할 수 있을 것 같습니다. 1. Writing : ..

1. Grouping Sets GROUPING SETS 함수는 복잡한 집계 쿼리를 단순화하고 여러 그룹화 수준에서 집계를 한 번에 계산할 때 유용한 함수입니다. 일반적으로 GROUP BY 를 사용하여 해결할 수 있지만, GROUP BY 를 사용하다가 더 세분화해서 사용할 수 있는 쿼리는 없을까? 라고 생각하면 GROUPING sets를 사용하면 됩니다. 예시로, GROUPING SETS와 일반 GROUP BY의 차이점은 여러 그룹화 수준을 한 번에 처리할 수 있는 능력입니다. 이와 같은 테이블이 존재한다고 가정해보자. 그리고, GROUP BY 를 활용하여 국가의 월별 매출을 조회해보고 싶다고 하자. ** 아래 데이터는 샘플** 실제로 빅쿼리상에서는 해당과 같이 날렸지만 STRUCT 에러로 인해서 조회가..

1. 목적(사용 이유) 시계열 데이터를 클러스터링 하는데, 일반적인 방법은 시계열 데이터를 인덱스로 평면한 다음 K-means 같은 클러스터링 알고리즘을 적용 하는 것 이다. 클러스터링 알고리즘은 '레이블' 없이 유사한 데이터 포인트를 군집화하는 비지도 학습 방법(Unsupervised Learning) 이다. 클러스터링 알고리즘은 유사한 데이터 포인트를 그룹화 하기 때문에, 데이터 포인트 간의 유사성을 찾는데 초점을 맞춘다. 서로 다른 시계열(ex: 카카오와 엔비디아의 주가 등) 을 유사한 그룹으로 클러스터링 하는 것은 각 시계열이 가진 시간차원을 무시한다는 점이다. 문제가 생기게 되는 점은 유클리디안 방법과 같은 일반적인 클러스터링 기법을 사용시, 시계열로 되어 있는 데이터를 클러스터링 하며 '시간에..