목록분류 전체보기 (75)
잡동사니 블로그

크롤링 기본 구조 1. Selenium을 사용하여 소스코드로 지정된 WebDriver를 실행하여 웹 페이지에 접속한다. 2. 접속한 웹 페이지를 HTML 소스코드 형태로 파싱한다. 3. 파싱된 HTML 전체 코드에서 Beautiful Soup를 사용하여 원하는 부분만 골라낸다. 4. 골라낸 데이터를 원하는 형식의 파일로 저장한다. 크롬 버전확인 및 드라이버 설정 https://googlechromelabs.github.io/chrome-for-testing/ Chrome for Testing availability chrome-headless-shellmac-arm64https://edgedl.me.gvt1.com/edgedl/chrome/chrome-for-testing/118.0.5951.0/mac-..

사용데이터셋 https://www.kaggle.com/competitions/m5-forecasting-accuracy/overview M5 Forecasting - Accuracy | Kaggle www.kaggle.com import pandas as pd import matplotlib.pyplot as plt import seaborn as sns import numpy as np import plotly.express as px url = 'm5-forecasting-accuracy' calendar = pd.read_csv(f'{url}/calendar.csv') selling_prices = pd.read_csv(f'{url}/sell_prices.csv') sample_submission ..

YOLOv5는 단일 단계 방식의 객체 감지 딥 러닝 기법으로, 빠른 속도와 실시간 객체 인식 능력을 가지며 Fast R-CNN과 같은 기존의 실시간 객체 탐지 모델들과 비교하여 높은 성능을 보임. 단일 단계 방식은 입력 이미지를 한 번의 전방향 패스로 처리하여 객체의 위치와 클래스를 예측하는 방법이므로 기존 R-CNN 계열의 모델들과 달리 여러 단계의 처리를 거치지 않아도 되어 속도가 훨씬 빠르다는 특징을 가짐 Fast R-CNN과 같은 다른 모델들은 여러 단계로 나누어 객체 탐지를 수행하는데, 먼저 후보 영역을 추출한 다음, 각 후보 영역을 신경망에 넣어 객체의 위치와 클래스를 예측하지만 YOLOv5는 이미지를 그대로 신경망에 통과시켜 한 번의 추론으로 객체 탐지를 수행하므로 빠른 속도와 실시간 감지가..

지도 학습(Supervised Learning)의 한 종류로서, 데이터 포인트들 간의 거리를 기반으로 패턴을 학습하고 예측하는 알고리즘, 주어진 데이터셋 내에서 가장 가까운 이웃들을 이용하여 새로운 데이터 포인트의 클래스나 값을 예측하는 데 사용. 즉 어떤 데이터가 있으면 그 주변의 이웃 데이터를 살펴본 후 더 많은 데이터가 포함되어 있는 범주로 데이터를 분류. 새로운 데이터 근처에 가장 가까운 k개의 데이터의 레이블 가운데 가장 많이 포함되어있는 범주를 선택하는 알고리즘 k값에 따라 알고리즘의 결과가 바뀔 수 있음(k가 너무 작음: overfitting / k가 너무 큼: underfitting). 즉 적절한 k를 선택하는 것이 중요하며 일반적으로 k값은 홀수를 사용함. 이유는 짝수의 경우, 동점 상황..