반응형
Recent Posts
Notice
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
Tags
- 잠재적결과
- Recsys
- 베이지안통계
- recommendation system
- 벡터
- 인과추론개요
- CausalInference
- 나의서양미술순례
- 실무로통하는인과추론
- 데이터분석가
- 오블완
- 빅쿼리
- DataAnalyst
- 선형대수학
- 인과추론
- BigQuery
- 인과추론 무작위 실험
- 티스토리챌린지
- 데이터분석
- 독후감
- 네카라쿠배당토
- 데이터분석가 코딩테스트
- Bayesian
- 글또10기
- 회고
- SQL
- 수학적해석학
- chatGPT
- mathematicalthinking
- 코세라
Archives
- Today
- Total
목록시계열데이터분석 (1)
Derek 의 데이터 분석 성장기

1. 목적(사용 이유) 시계열 데이터를 클러스터링 하는데, 일반적인 방법은 시계열 데이터를 인덱스로 평면한 다음 K-means 같은 클러스터링 알고리즘을 적용 하는 것 이다. 클러스터링 알고리즘은 '레이블' 없이 유사한 데이터 포인트를 군집화하는 비지도 학습 방법(Unsupervised Learning) 이다. 클러스터링 알고리즘은 유사한 데이터 포인트를 그룹화 하기 때문에, 데이터 포인트 간의 유사성을 찾는데 초점을 맞춘다. 서로 다른 시계열(ex: 카카오와 엔비디아의 주가 등) 을 유사한 그룹으로 클러스터링 하는 것은 각 시계열이 가진 시간차원을 무시한다는 점이다. 문제가 생기게 되는 점은 유클리디안 방법과 같은 일반적인 클러스터링 기법을 사용시, 시계열로 되어 있는 데이터를 클러스터링 하며 '시간에..
Data/머신러닝
2024. 2. 17. 19:36