목록분류 전체보기 (71)
잡동사니 블로그
ImageFolder는 PyTorch의 torchvision.datasets 모듈에 속한 클래스로, 이미지 데이터를 폴더 구조에 기반해 자동으로 라벨을 할당하고 데이터셋을 생성해주는 클래스 import torchfrom torchvision import datasets, transformsfrom torch.utils.data import DataLoader, random_splitimport matplotlib.pyplot as plt#Image PreProcessingtransform = transforms.Compose([ transforms.Resize((256, 256)), transforms.Grayscale(num_output_channels=1), transforms.To..
Tkinter Tkinter는 파이썬의 표준 GUI (그래픽 사용자 인터페이스) 라이브러리로, 파이썬에서 간단한 GUI 애플리케이션을 만들기 위해 사용. Pyinstaller PyInstaller는 Python 애플리케이션과 모든 종속성을 단일 패키지로 묶음.그리하여 사용자는 Python 인터프리터나 모듈을 설치하지 않고도 패키지된 앱을 실행할 수 있음. PyInstaller는 Python 3.8 이상을 지원하며 numpy, matplotlib, PyQt, wxPython 등과 같은 많은 주요 Python 패키지를 올바르게 번들로 제공함. https://pyinstaller.org/en/stable/ PyInstaller Manual — PyInstaller 6.5.0 documentation PyIns..
주제는 MQL 데이터 기반 B2B 영업 예측 모델 만들기. 데이터를 살펴보면 개인정보에 민감한 데이터만 마스킹 되어있고, 실제 기업 데이터 같았다. 처리할 변수들이 많아서 팀원들과 변수를 각각 분할정복 하면서 전처리 하는식으로 진행했다. 나는 몇개의 Feature Engineering랑 모델 설계를 진행했고, Github, Notion도 활용하며, 매주 3회 정도 회의 하면서 진행함. 조~금만 더 높았더라면 본선일텐데 아깝다. 다같이 열심히 한 팀원들에게 박수를...
Class imbalance? 주로 분류(classification)에서 다수의 데이터와 소수의 데이터 차이 예를 들어 위와같은 데이터로 모델을 만든다고 가정할 때 모델이 불균형한 클래스에 대해 편향되도록 학습됨. 모든 데이터를 0으로 학습하더라도 95%의 Accuracy를 가진 모델이 됨. 이를 해결하기 위해 Over Sampling, Under Sampling이 있지만, Class weight라는 방법도 있다. \[ \text{LogLoss} = - \frac{1}{N} \sum_{i=1}^{N} \left[ y_i \log(\hat{y}_i) + (1 - y_i) \log(1 - \hat{y}_i) \right] \] 여기서 Class weight인 - \( w_{0} \)와 - \( w_{1} \..