본문 바로가기

분류 전체보기523

KSEB 3기 08.01 통계학습에서의 AIC, BIC 2024. 8. 4.
KSEB 3기 07.31 참고 자료 2ARIMA에서 p, d, q값 지정해주는 방법시계열 데이터 분석에서 "p", "d", "q"는 ARIMA(자동 회귀 이동 평균) 모델의 파라미터를 나타냅니다.ARIMA 모델은 시계열 데이터의 예측과 분석을 위해 사용되는 통계 모델 중 하나로, 시계열 데이터의 자기회귀(AR), 미분(I), 이동평균(MA) 요소를 조합하여 모델을 구성합니다.1. "p" (AR: 자동 회귀)"p"는 자동 회귀 모델의 자기회귀 차수(AR 차수)를 나타냅니다.자기회귀란 현재 시점의 데이터가 이전 시점의 데이터와 관련이 있는 경우를 의미합니다. "p"는 몇 개의 이전 시점 데이터를 사용할 것인지를 결정합니다. 예를 들어, "p=1"은 바로 직전 시점의 데이터만 사용하는 자기회귀 모델을 의미하고, "p=2"는 두 시점 .. 2024. 8. 4.
KSEB 3기 7.30 참고 자료 1자기상관 함수(ACF)의 정의ACF는 주어진 시계열 데이터 $X_t$에서 서로 다른 시차 $k$에 대해 데이터가 얼마나 상관관계를 가지는지를 측정합니다. $k$ 시차에서의 자기상관 계수 $ρ_k$는 다음과 같이 정의됩니다:$ρ_k=\frac{\text{Cov}(X_t, X_{t+k})}{\sqrt{\text{Var}(X_t) \text{Var}(X_{t+k})}}$여기서 $Cov(X_t,X_{t+k})$는 $X_t$와 $X_{t+k}$간의 공분산입니다.ACF가 0으로 수렴해야 하는 이유시간에 따른 독립성:대부분의 자연적이고 경제적인 시계열 데이터는 시간이 지남에 따라 서로 독립적으로 변하는 경향이 있습니다. 즉, 멀리 떨어진 시간 간격에서는 데이터 값들 간에 상관관계가 거의 없어야 합니다.예.. 2024. 8. 4.
KSEB 3기 7.29 AR, MA특성AR(p) 모델MA(q) 모델정의과거 값들의 가중합으로 현재 값을 설명과거 오차(백색 잡음)의 가중합으로 현재 값을 설명차수 식별PACF 그래프 사용ACF 그래프 사용모델링 요소자기회귀 계수($\phi$)이동평균 계수($\theta$)주요 적용 분야데이터의 패턴이나 추세 식별데이터의 노이즈나 불규칙성 설명자기상관과거의 값과 자기상관이 높음과거 오차와의 상관관계 설명여기에 기존의 데이터에서 차분을 얼만큼 했는지를 가지고 d의 값을 정해주면 된다. 2024. 8. 4.
윈도우에서 Program Files에 (x86)가 있고 없고의 차이 윈도우의 파일 구조를 보면, Program Files (x86)과 Program Files가 두 개로 존재한다. 우선 반드시 명심해야 할 것은 두 파일은 절대로 지워서는 안된다. 컴퓨터가 멈추거나 중요한 프로세스 등에 지장을 얻을 수 있다. 본론으로 다시 돌아와서 x86은 32비트 프로그램이 저장되는 장소, x64는 64비트 프로그램이 저장되는 장소를 의미한다. 이러한 작명법은 인텔의 cpu 프로세서 구분에 의해서 발생한 명명법이다. 2024. 8. 1.
KSEB 3기 07.26 모델 경량화  = 탄소절감 = why? 인공지능은 전기를 엄청 먹음float32가 float64보다 메모리를 덜 먹음 2024. 7. 29.
MYSQL 자료형 1. 문자형 (String Types)CHAR(size): 고정 길이 문자열. 최대 255 문자.VARCHAR(size): 가변 길이 문자열. 최대 65,535 문자.TINYTEXT: 최대 255 문자.TEXT: 최대 65,535 문자.MEDIUMTEXT: 최대 16,777,215 문자.LONGTEXT: 최대 4,294,967,295 문자.BINARY(size): 고정 길이 이진 데이터. 최대 255 바이트.VARBINARY(size): 가변 길이 이진 데이터. 최대 65,535 바이트.TINYBLOB: 최대 255 바이트의 이진 데이터.BLOB: 최대 65,535 바이트의 이진 데이터.MEDIUMBLOB: 최대 16,777,215 바이트의 이진 데이터.LONGBLOB: 최대 4,294,967,295 바.. 2024. 7. 28.
KSEB 3기 07.25 코랩에서 말하는 컴퓨팅 단위의 허점 python에서 MAGIC METHOD의 종류와 name manggling  릿지 회귀와 라쏘 회귀의 차이점 ARIMA의 순서 - 17개 지자체에 대해서 증강 데이터셋으로 진행 RF의 순서 - 17개 지자체에 대해서 증강 데이터셋으로 진행 2024. 7. 25.
KSEB 3기 07.24 시계열 데이터 분석 교재 링크https://otexts.com/fppkr/index.html Forecasting: Principles and Practice2nd editionotexts.com 코랩 유로로 쓰는 것은 비추 2024. 7. 24.
KSEB 3기 07.23 AWS sagemaker와 s3, 서브넷, vpcLLM과 RAG의 차이점 2024. 7. 23.