본문 바로가기

전체 글113

[01 - ImageNet Sketch 데이터] - Torchvision 와 Albumentations Trasnformer 비교 최근에 ImageNet Sketch 데이터셋을 사용하여 딥러닝 모델을 학습하던 중, 두 가지 이미지 변환 라이브러리인 Torchvision과 Albumentations에서 미묘한 차이점을 발견하게 되었습니다. 표면적으로는 동일한 이미지 전처리 작업을 적용했지만, 내부 구현 방식의 차이로 인해 모델 학습 과정에서 로스(loss)와 성능에 차이가 생겼습니다. 이 글에서는 두 라이브러리 간의 차이점을 명확히 비교하고, 실제로 어떻게 다른지 설명드리겠습니다.1. 변환 라이브러리의 내부 구현 차이회전의 중심이 어디로 설정되는지,이미지 크기 조정 방식,픽셀 처리 방식 등이 다를 수 있다.이러한 미세한 차이들이, 특히 모델이 민감하게 반응할 수 있는 스케치 이미지와 같은 데이터에서 큰 영향을 미칠 수 있습니다. 스케.. 2024. 9. 13.
Day-21 강의딥러닝 문제 정의 학습 내용어떻게 모델을 선택하는지문제 정의를 어떻게 접근 하는지  Daily study모델의 Inductive Bias 확인 후데이터가 어떤 모델에 적합한지 생각하기  회고어떤 딥러닝 프로젝트를 진행 할때막연한 과정에, 막연한 결론을 내봤자, 막연한 경험이 될뿐 이다그래서 근간의 이해하면서 공부와 프로젝를 진행 해야한다. 2024. 9. 11.
[05] - CV 분야에서 모델의 이해 및 선정 방법 1. 모델 이해 (Understanding Model) 1) 모델은 어떻게 이해할까??딥러닝 모델의 작동 방식을 이해하는 것은 복잡한 과정이지만, 그 근본적인 원리는 비교적 간단하다.우리는 데이터를 입력으로 주고, 모델은 그 데이터를 처리하여 예측을 내놓는다.하지만 그 과정에서 모델이 실제로 데이터를 어떻게 이해하고, 왜 특정한 결과를 도출하는지에 대한 이해는 어려울 수 있다.  Model은 어떻게 복잡한 데이터를 이해 할까?? 딥러닝의 Model 에서 집중적으로 봐야할 것은 그 안에 시스템이다.이 모델이 무엇이길래?? 어떻게 구성되어 있길래?? 학습을 어떻게 하는거지??모델의 근간에 대해서 이해를 해보자.  2) Inductive Bias (귀납적 편향) 위의 표는 딥러닝의 구성 요소들이 어떻게 데이터.. 2024. 9. 11.
[02] - 다양한 Image Format 1. Image  Data 및 Type1) Image Data이미지는 컴퓨터에서 데이터로 처리됩니다. 이미지를 처리할 때 중요한 요소는 해상도, 픽셀, 채널입니다. 이미지를 정확히 이해하고 처리하기 위해서는 이 요소들을 잘 파악해야 합니다.이미지는 컴퓨터에서 보통 w, h, c 형태의 데이터로 표현됩니다.w: 이미지의 너비(Width)h: 이미지의 높이(Height)c: 채널(Channel) 수예를 들어, w=1920, h=1080, c=3인 이미지는 1920x1080 해상도를 가진 이미지이며, 각 픽셀이 3개의 값을 갖는다는 뜻입니다. 이 3개의 값은 RGB 채널을 의미하며, 각각 빨간색(Red), 초록색(Green), **파란색(Blue)**의 값을 나타냅니다. 2) 이미지의 Data Type  디지.. 2024. 9. 10.
[01] - 딥러닝 문제 정의 및 구체화 딥러닝 모델을 개발할 때, 많은 사람들이 모델 설계나 데이터 처리에 집중하는 경향이 있습니다.하지만, 문제 정의와 구체화 과정이 제대로 이루어지지 않으면 아무리 좋은 모델을 사용하더라도원하는 성과를 얻기 어렵습니다. 이번 글에서는 딥러닝 프로젝트에서 문제를 정의하고 구체화하는 과정이 왜 중요한지,그리고 이 단계가 프로젝트의 성공에 어떤 영향을 미치는지 알아보겠습니다.1. 문제 정의가 왜 중요한가?문제를 정확하게 정의하는 것은 딥러닝 프로젝트의 첫걸음입니다.문제를 제대로 이해하지 못하면 해결책 또한 엉뚱한 방향으로 갈 수 있기 때문입니다.딥러닝은 일반적으로 데이터를 통해 학습하고 패턴을 찾아가는 과정이므로,문제의 핵심을 파악하지 못하면 모델이 학습해야 할 목표가 불분명해집니다. 예를 들어, 자동차 이미지 .. 2024. 9. 10.
Day-20 강의Generative Model 학습 내용Autoregressive (AE)Variational Auto Encoder (VAE)Difusstion  Daily study생성모델의 개념과 원리에 대한 이해 회고생성모델에 개념을 정리하고, 수식도 파악 후에 머릿속에 넣어야겠다. 2024. 9. 6.
Day-19 강의Visual-languge model 학습 내용다양한 시각언어 모델 설명 Daily studyLLaVa, instructBLIP 회고모든 논문을 정확히 파악하기는 어렵다.내가 관심있는 분야를 정해서 논문을 하나씩 봐야겠다. 2024. 9. 4.
R-CNN 논문 리뷰 서론딥러닝의 발전과 함께 컴퓨터 비전 분야는 급격한 변화를 겪고 있습니다. 그중에서도 객체 탐지(Object Detection)는 이미지나 비디오에서 특정 객체를 찾아내고, 그 위치를 정확히 예측하는 중요한 과제입니다. 이 과제는 자율 주행, 영상 감시, 의료 영상 분석 등 다양한 분야에서 활용되며, 딥러닝의 주요 연구 주제 중 하나입니다.오늘 살펴볼 논문은 R-CNN (Region-based Convolutional Neural Networks) 입니다. R-CNN은 2014년 Ross Girshick가 주도한 연구로, 객체 탐지의 성능을 크게 향상시킨 모델입니다.Pascal VOC 2012 데이터셋에서 mAP 가 53.3% 로 이전 최고 결과보다 30% 향상되었습니다.이 글에서는 R-CNN의 기본 개.. 2024. 9. 3.
SVM(Support Vector Machine) 이란? [R-CNN] 1. SVM 이란??SVM, 즉 Support Vector Machine은 지도 학습(Supervised Learning)의 한 종류로,주어진 데이터를 기반으로 새로운 데이터를 분류하는 데 사용되는 강력한 알고리즘입니다.이 모델은 기본적으로 데이터를 분류할 수 있는 최적의 경계(또는 선)를 찾는 일을 합니다.2. SVM의 기본 아이디어는 최적의 경계를 찾는 것!SVM은 두 클래스 사이의 Decision Boundary(결정 경계)를 찾습니다. 이 경계는 데이터를 가장 잘 분리할 수 있는 선을 의미합니다.예를 들어,키와 몸무게라는 두 가지 특징을 데이터를 이용해 사람들을 "운동 선수"와 "비운동 선수"로 분류하려고 합니다. 각 사람의 키와 몸무게는 좌표 평면에 점으로 나타낼 수 있습니다. SVM은 이 점들.. 2024. 9. 3.