목차 서론 딥러닝(Deep Learning)은 데이터에서 패턴을 학습하는 신경망 모델이며, 특히 이미지, 영상, 음성과 같은 복잡한 데이터를 분석하는 데 강력한 성능을 발휘한다.이 중에서도 CNN(Convolutional Neural Network, 합성곱 신경망)은 이미지 분석에 특화된 딥러닝 모델로,이미지 인식(Image Classification), 객체 탐지(Object Detection), 영상 분할(Segmentation) 등 다양한 컴퓨터 비전(Computer Vision) 문제를 해결하는 데 필수적인 기술이다.CNN이 등장하기 전, 기본적인 신경망 모델인 다층 퍼셉트론(MLP, Multi-Layer Perceptron)도 이미지 데이터를 처리하는 데 사용되었다.하지만 MLP는 입력 이미..
목차 컴퓨터 비전 분야에서 합성곱 신경망(CNN, Convolutional Neural Network)은 이미지 인식과 분류 작업의 핵심 기술로 자리 잡아 왔다. 하지만 CNN에도 한계가 존재하며, 이를 극복하기 위해 어텐션 기법과 비전 트랜스포머(ViT) 모델이 등장했다. 어텐션 기법은 비전 트랜스포머의 핵심 메커니즘으로, 두 기술은 밀접하게 연결되어 있다. 이 글에서는 CNN의 한계, 어텐션 기법의 개념과 역할, 그리고 비전 트랜스포머 모델의 특징을 차례로 설명한다. CNN의 기본 원리와 한계 CNN의 기본 원리 CNN은 이미지를 처리하기 위해 합성곱 연산을 사용하는 신경망이다. 합성곱 연산은 작은 필터를 사용해 이미지의 특정 특징(예: 가장자리, 텍스처)을 추출한다. CNN은 계층적으로 ..
목차 지난 글에선 기초적인 MLP를 이용한 집값 예측 모델을 만들어 보았다. 이번 글에서는 컴퓨터 비전 쪽으로 넘어와서 CNN을 이용해 CIFAR-10 데이터셋을 학습하고, 테스트 데이터를 분류하는 코드를 구현해 보겠다. 참고로 CIFAR-10은 10가지 클래스(예: 자동차, 개, 새 등)의 컬러 이미지를 포함한 데이터셋이며, 딥러닝에서 CNN은 이미지 데이터의 특성을 잘 학습하기 때문에 이미지 분류 문제에 자주 사용된다. 사실 구현이라기 보단 학습 코드를 뜯어보는 것에 가깝기 때문에, 별 새로운 내용은 없다. 선 요약 먼저 오늘 뜯어볼 코드와 결과는 다음과 같다:import torchimport torchvision.datasets as datasetsimport torchvision.transform..
- Total
- Today
- Yesterday
- 맛집
- 백준
- 파이썬
- 동적계획법
- 중남미
- 면접 준비
- Backjoon
- 지지
- 알고리즘
- spring
- Algorithm
- Python
- 세모
- 스프링
- 기술면접
- 남미
- RX100M5
- java
- 야경
- 리스트
- 칼이사
- 스트림
- a6000
- BOJ
- 여행
- 유럽
- 유럽여행
- 세계일주
- 세계여행
- 자바
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | ||||
| 4 | 5 | 6 | 7 | 8 | 9 | 10 |
| 11 | 12 | 13 | 14 | 15 | 16 | 17 |
| 18 | 19 | 20 | 21 | 22 | 23 | 24 |
| 25 | 26 | 27 | 28 | 29 | 30 | 31 |