분류 전체보기 75

[코딩테스트 풀이 링크 HUB]

코딩테스트 연습 문제 풀이 후 게시물 링크 연결 페이지 입니다. 개인 답안이며 최적의 답안이 아닌 점 참고 바랍니다. 총 문제 풀이 수 : 101 백준 : 0 프로그래머스 : 101 구름 level : 0 [프로그래머스] 로또의 최고 순위와 최저 순위 [프로그래머스] 옹알이 (2) [프로그래머스] 입양 시각 구하기(2) [프로그래머스] 실패율 [프로그래머스] 오프라인/온라인 판매 데이터 통합하기 [프로그래머스] 그룹별 조건에 맞는 식당 목록 출력하기 [프로그래머스] 과일 장수 [프로그래머스] 폰켓몬 [프로그래머스] 카드 뭉치 [프로그래머스] 명예의 전당(1) [프로그래머스] 추억 점수 [프로그래머스] 문자열 출력하기 [프로그래머스] 콜라 문제 [프로그래머스] 두 개 뽑아서 더하기 [프로그래머스] 푸드 파..

알고리즘 2023.10.07

왁물원 카페 크롤링 및 우왁굳즈 워드클라우드

아직 완벽하지 않지만 제목, 작성자, 링크, 내용 크롤링은 전부 가능하고 버튼 연동만 해주면 된다. 이런식으로 크롤링된다. def extract_word(text): hangul = re.compile('[^가-힣]') result = hangul.sub(' ', text) return result 특수문자 제거하기 spacing = Spacing() !pip install git+https://github.com/haven-jeon/PyKoSpacing.git 다운 받고 띄어쓰기되어 있지 않은 문자열들을 전부 해준다. 완벽하게 되진 않음.. okt = Okt() words = " ".join(df['content'].tolist()) words = okt.morphs(words,stem=True) re..

AI/데이터 분석 2022.12.21

IOU : 모델이 예측한 결과와 실측 Box가 얼마나 정확하게 겹치는 가를 나타내는 지표

IOU : 모델이 예측한 결과와 실측 Box가 얼마나 정확하게 겹치는 가를 나타내는 지표 Detection 데이터 셋별로 IOU 임계값이 다르다. Pascal voc는 0.5, MS COCO는 0.5 ~ 0.95 의 여러가지 경우를 두고 제출하도록 한다. 위 그림은 예시이다. 만약 Pascal voc 데이터 셋에서 왼쪽 2가지 경우만 Detecte 성공이고 나머지 3가지 경우는 실패이다. import numpy as np def compute_iou(cand_box, gt_box): # Calculate intersection areas x1 = np.maximum(cand_box[0], gt_box[0]) y1 = np.maximum(cand_box[1], gt_box[1]) x2 = np.minimu..

AI/컴퓨터 비전 2022.12.04

NMS : 여러 Bounding Box 중 확실한 Box만 선택하는 기법

NMS : 여러 Bounding Box 중 확실한 Box만 선택하는 기법 여러 개의 Bounding Box를 가지는 이유 : selective search 경우에도 object가 있을만한 공간을 box를 침. object가 있는데 실수를 하면 안 되기 때문 NMS 진행 과정 Detected 된 bounding box 별로 특정 Confidence threshold 이하 bounding box는 가장 먼저 제거 가장 높은 confidence score를 가진 box 순으로 내림차순 정렬하고 아래 로직을 모든 box에 순차적으로 적용. 정렬된 confidence score를 가진 box를 차례로 기준으로 삼고 다른 box들과 IOU를 구함. 구한 IOU가 특정 threshold 이상인 box를 모두 제거. ..

AI/컴퓨터 비전 2022.12.04

[Python, OpenCV 4로 배우는 컴퓨터 비전과 머신러닝] CH03

func1 : 이미지를 회색조 이미지로 불러오고 화면에 띄우기 까지 import numpy as np import cv2 def func1(): img1 = cv2.imread('cat.bmp', cv2.IMREAD_GRAYSCALE) if img1 is None: print('Image load failed!') return print('type(img1):', type(img1)) print('img1.shape:', img1.shape) if len(img1.shape) == 2: print('img1 is a grayscale image') elif len(img1.shape) == 3: print('img1 is a truecolor image') cv2.imshow('img1', img1) c..

AI/컴퓨터 비전 2022.12.04

GridSearch - 교차 검증과 최적의 하이퍼 파리미터 찾기

하이퍼 파라미터는 머신러닝 알고리즘을 구성하는 주요 구성 요소이며, 이 값을 조정해 알고리즘의 예측 성능을 개선할 수 있습니다. 사이킷런은 GridSearchCV 를 제공해 하이퍼 파라미터를 순차적으로 입력하면서 편리하게 최적의 파라미터를 찾아 준다. from sklearn.model_selection import train_test_split from sklearn.tree import DecisionTreeClassifier from sklearn.model_selection import cross_val_score import numpy as np dt = DecisionTreeClassifier(max_depth=3, min_samples_split= 5) X = iris_df.drop('labe..

AI 2022.12.04

[ML] K-Fold, Stratified K-fold 교차 검증

[교차 검증] 교차 검증을 사용하는 가장 큰 이유는 과적합(Overfitting)을 막기 위함이다. 과적합은 모델이 학습 데이터에만 과도하게 최적화되어, 실제 예측을 다른 데이터로 수행할 경우 예측 성능이 과도하게 떨어지는 것을 말한다. 이런 문제점을 개선하기 위해 교차 검증을 활용한다. 즉 수능 보기 전 모의고사를 여러번 치루는 것. 교차 검증은 테스트 데이터 셋 이외의 검증 데이터 셋을 만들어 모델을 다양하게 훈련하고 평가하는 데 사용한다. K-Fold 교차 검증 가장 보편적으로 사용되는 교차 검증 기법이다. K개의 데이터 폴드 세트를 만들어 K번만큼 각 폴드 세트에 학습과 검증 평가를 반복적으로 수행하게 된다. 위 그림처럼 데이터 세트를 훈련 데이터, 검증 데이터를 점진적으로 5개로 나눠 학습과 검..

AI 2022.12.03

[DACON] 따릉이 데이터 분석 EDA

환경 : Colab from google.colab import drive drive.mount('/content/drive') !sudo apt-get install -y fonts-nanum !sudo fc-cache -fv !rm ~/.cache/matplotlib -rf 구글 드라이브를 통해 파일을 업로드 할 것이다. 그리고 코랩에서의 그래프에서 한글이 깨지는 것을 방지하기 위해 위 폰트들을 설치한 후 런타임 재실행한다. import pandas as pd import matplotlib.pyplot as plt import numpy as np import seaborn as sns import warnings warnings.filterwarnings(action='ignore') palett..

AI/데이터 분석 2022.11.29
728x90
반응형
LIST