
목차 서론 딥러닝(Deep Learning)은 데이터에서 패턴을 학습하는 신경망 모델이며, 특히 이미지, 영상, 음성과 같은 복잡한 데이터를 분석하는 데 강력한 성능을 발휘한다.이 중에서도 CNN(Convolutional Neural Network, 합성곱 신경망)은 이미지 분석에 특화된 딥러닝 모델로,이미지 인식(Image Classification), 객체 탐지(Object Detection), 영상 분할(Segmentation) 등 다양한 컴퓨터 비전(Computer Vision) 문제를 해결하는 데 필수적인 기술이다.CNN이 등장하기 전, 기본적인 신경망 모델인 다층 퍼셉트론(MLP, Multi-Layer Perceptron)도 이미지 데이터를 처리하는 데 사용되었다.하지만 MLP는 입력 이미..

목차차근차근 배운 것이 아니라 빠르게 결론에 도달하려다 깨달은 것은 지식에 구멍이 너무도 많다는 것이다. 오늘은 CNN에 대해 공부 중 그런 생각이 들었다. 왜 ReLU는 중간층에서 사용되고 Softmax는 출력층에서만 사용되는가. 애초에 Softmax 함수가 활성화 함수는 맞는가. 이 글은 위 질문에 대한 짧은 방황의 결과이다. 너무 쉬운 질문이라고 생각하면 안 읽어도 된다! 어쨌거나 글을 시작한 김에 활성화 함수와 ReLU, Softmax 함수 등에 대해 짧게 다루며 Softmax 함수 자체에 대해 짧게 생각해 보겠다. 활성화 함수(Activation Function) 활성화 함수란 무엇인가? 그 일반적인 정의와 역할은 다음과 같다. 활성화 함수는 뉴런이 입력받은 값(로짓, logits)을 조정하여 ..

목차CNN에서는 합성곱 계층(Convolutional Layer)에서 활성화 함수(예: ReLU)를 적용한 후, 완전 연결층(Fully Connected Layer)에서도 활성화 함수를 한 번 더 적용한다. 이유는 완전 연결층이 수행하는 역할과 신경망의 학습 방식 때문이다. 활성화 함수는 왜 여러 번 적용될까? CNN의 각 계층에서 활성화 함수를 적용하는 이유는 각 층이 독립적으로 의미 있는 표현(Feature Representation)을 학습해야 하기 때문이다. 즉, 합성곱 계층과 완전 연결층이 담당하는 역할이 다르므로, 활성화 함수를 두 번 적용하는 것이 필수적이다. 합성곱 계층(Convolutional Layer)에서 활성화 함수 역할 합성곱 연산을 통해 CNN은 로우 레벨 특징(Low-lev..

목차 이번엔 백본(Backbone)이다. 공부하면서 좀 더 알아야 할 것 같은 개념을 나를 위해 정리하는 글이기 때문에 너무 쉬울 수도 있다. 일단 백본이 뭔지 다시는 검색하지 않기 위해 정리한다. 시작! 1. 백본(Backbone)이란? 비전 인공지능, 특히 객체 탐지(Object Detection), 이미지 분류(Image Classification), 세그멘테이션(Segmentation) 같은 작업에서 자주 듣게 되는 용어가 있다. 바로 백본(Backbone)이다.백본은 신경망(Neural Network)에서 입력 이미지가 처음 들어와서 지나가는 부분,즉, 초기 단계에서 특징(Feature)을 뽑아주는 역할을 하는 기본 구조를 의미한다.쉽게 말하면, 이미지에서 중요한 정보를 걸러내는 기초 근육 같..

목차지난 글에서는 객체 탐지의 필수 평가요소인객체 탐지(Object Detection)에서는 프리시전(Precision), 리콜(Recall), mAP 등에 대해 알아보았다. 그러나 아직 넘어야 할 선이 있는데, 그것이 바로 후처리 과정! 그 과정에서 쓰이는 알고리즘이 바로 NMS(Non-Maximum Suppression) 알고리즘이다. 선요약하고 들어가자면, 이 알고리즘은 모델이 탐지한 결과 중 겹치는 박스들 중 가장 좋은 것만 남기고 나머지를 제거하는 과정이다. 이어지는 글에서는 적당한 예시를 들어, NMS가 왜 필요하고 어떻게 동작하는지 간단히 살펴본다. 객체 탐지 모델이 주는 결과는 어떤 모습일까? 객체 탐지 모델(YOLO, Faster R-CNN 등)이 이미지를 보고 예측을 하면, 다음과 같은..

목차 지난 글에서 컴퓨터 비전과 객체 인식에 대한 입문의 입문.. 정도 되는 개념을 알아보았다. 하지만 들을땐 그런가 보다 하고 들었는데 생각할수록 각종 지표의 개념과 의미가 헷갈려서.. 글을 하나 따로 작성해 보았다. 제발 내가 이 글을 적으며 이해에 도달할 수 있기를. 서론 객체 탐지(Object Detection) 모델의 성능을 평가할 때 자주 등장하는 지표가 있다. 바로 프리시전(Precision), 리콜(Recall), mAP(Mean Average Precision), F1 Score이다.이 지표들은 이론적으로 수식만 외우면 되는 것처럼 보이지만, 실제 상황에 적용해보려고 하면 막막할 때가 많다.그래서 이번 글에서는 간단한 예제를 들어 최대한 쉽게 설명해보려고 한다. 기본 개념: TP, FP,..

목차 서론 컴퓨터 비전은 이미지나 비디오에서 의미 있는 정보를 추출하는 기술로, 자율주행, 보안, 헬스케어, 제조업, 소매업 등 다양한 분야에서 사용된다. 예를 들어, 자율주행 차량은 도로에서 차량과 보행자를 인식해 안전한 주행 경로를 결정하며, 보안 시스템은 침입자를 탐지하거나 얼굴 인식을 통해 출입 통제를 할 수 있다. 헬스케어 분야에서는 의료 영상을 분석해 암과 같은 질병을 조기 진단할 수 있다. 이러한 성과는 컴퓨터 비전 기술 중 객체 인식의 발전에 크게 의존한다.객체 인식은 컴퓨터 비전의 중요한 하위 분야로, 이미지 내 객체가 무엇인지(Classification)와 그 위치(Bounding Box)를 동시에 인식하는 기술이다. 이 기술은 이미지의 정보 추출 속도를 높이고 정확도를 개..
목차 컴퓨터 비전 분야에서 합성곱 신경망(CNN, Convolutional Neural Network)은 이미지 인식과 분류 작업의 핵심 기술로 자리 잡아 왔다. 하지만 CNN에도 한계가 존재하며, 이를 극복하기 위해 어텐션 기법과 비전 트랜스포머(ViT) 모델이 등장했다. 어텐션 기법은 비전 트랜스포머의 핵심 메커니즘으로, 두 기술은 밀접하게 연결되어 있다. 이 글에서는 CNN의 한계, 어텐션 기법의 개념과 역할, 그리고 비전 트랜스포머 모델의 특징을 차례로 설명한다. CNN의 기본 원리와 한계 CNN의 기본 원리 CNN은 이미지를 처리하기 위해 합성곱 연산을 사용하는 신경망이다. 합성곱 연산은 작은 필터를 사용해 이미지의 특정 특징(예: 가장자리, 텍스처)을 추출한다. CNN은 계층적으로 ..
- Total
- Today
- Yesterday
- RX100M5
- 중남미
- 야경
- 유럽
- 칼이사
- 지지
- a6000
- Algorithm
- 리스트
- 파이썬
- 스트림
- 기술면접
- BOJ
- 백준
- 동적계획법
- 세계여행
- 유럽여행
- java
- 자바
- 세계일주
- Backjoon
- 여행
- spring
- 남미
- 스프링
- Python
- 맛집
- 알고리즘
- 세모
- 면접 준비
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |