본문 바로가기

DeepLearning|MachineLearning8

Confusion Matrix(분류 모델 성능 평가지표) 란? 공부를 하며, 내가 이해한 방향으로 끄적이는 글이므로 이 글이 무조건적인 정답은 아니다. Classification task의 논문들의 코드들을 보면, 보통 성능을 평가하기 위해 Accuracy(정확도), Recall(재현도), Precision(정밀도), F1_score등이 쓰이는데, 그냥 남들이 쓰니까 나도 써야지 하며 쓰는것보다는 왜, 어떻게, 무슨 원리로, 분류모델에 쓰는지를 제대로 알면 그에 대한 성능을 끌어올리는데에 있어서 도움이 될까 공부를 하며 글을 쓴다. 먼저, 위의 네가지의 평가지표를 이해하려면 오차행렬을 알아야한다. 1. 오차행렬(Confusion Matrix) 정의 : 예측성능을 측정하기 위하여 예측값과 실제값을 비교하기 위한 표 TP, TN : 실제값(Actual Positive,.. 2023. 12. 20.
DeepLearning 기초 개념 : batch_size, steps, epoch, iteration batch_size - 1 step에서 사용한 데이터의 개수. step - batch_size 만큼 처리한 다음 weight, bias 업데이트 한 것을 1번으로 취급 == 1 step Epoch - 전체 데이터를 한 바퀴돌면서 한 번 학습을 한 것 == 1 epoch iteration - 전체 데이터를 모델에 한 번 학습시키는데 필요한 batch의 수. - 1 epoch를 마치는데 필요한 파라미터 업데이트 횟수 - 각 배치마다 파라미터 업데이트가 한 번씩 이뤄지므로, iteration = 전체 데이터 / batch_size steps_per_epoch - 1 epoch 당 step 수 (weight, bias 업데이트 수) validation_steps - 지정한 step마다 validation을 한 .. 2022. 4. 28.
TTA(Test-Time Augmentation) Segmentation Data Augmentation에 관련된 여러 논문들을 읽다가 Test-time augmentation이라는 걸 봤는데, 파파고에 번역을 돌려봤을 때, 더욱 헷갈리게 되어 그냥 넘어가게 되었는데, 이 글을 쓰기 바로 직전에 운이 좋게도 test-time augmentation에 관련하여 공부를 할 수 있게 되어서 메모를 한다. Neural Network의 성능을 올리는데에는 매우 많은 방법이 존재하는데, 그 중 가장 중요한 방법이 Augmentation이라고 생각한다. 왜냐하면 딥러닝에서 뭐가 되었든 data의 질과 양이 중요한데, Data Augmentation은 여러가지 방법들(rotate, translate, flip..등)로 기존의 train set을 증강시켜서 Networ.. 2022. 4. 28.
Deep Pose Human Pose Estimation Human Pose Estimation(이하 HPE)은 크게 2D와 3D로 나뉜다. 3D HPE는 2D 이미지에서 (x,y,z) 3차원 좌표들을 찾아내는 기술 Pose 와 face landmark face landmark - 얼굴 인식에서는 물리적으로 거의 고정되어있다. Pose - 팔, 다리가 상대적으로 넓은 범위와 _자유도_를 갖는다. - 자유도를 높다는 것은 데이터분포를 특정하는데에 어려움이 있다는 뜻이고, 더 복잡하다. 접근법 1. Top-down - 사람들의 key-point를 정확하게 찾기 위해 object detection을 사용 - crop 한 이미지 내에서 keypoint를 찾아내는 방법으로 표현 - detector가 선행되어야 하고 사람 숫자마다 .. 2022. 1. 21.
Face Detection Face Detection은 빨라야 하고, weight가 작아야 한다. 예를 들어 얼굴인식으로 화면 잠금을 푸는 기술에서 서버로 이미지를 보낸 후 처리를 한다면? 인식하는 데에 시간이 소요가 되고, 여러 가지 영향들(네트워크 비용 + 서버 비용 + 인터넷 속도)때문에 적합하지 않다. 따라서 위의 영향들에 대해서 무관하게 항상 동작해야 하는데, 핸드폰에 모델을 올려서 바로 이용하는 방법이 있다. 그런데, 핸드폰에 모델을 올리려면 weight가 작은 모델이 유리하지만 작은 모델은 성능이 일반적으로 떨어지기 때문에 보완을 해야 한다. 어떻게 하면 빠르게? Face Detection에서 시간이 많이 드는 요소는 Sliding window이므로 이것을 버려야 빨라진다. ∴ 2-stage 방식의 detection은.. 2022. 1. 13.
OCR(Optical Character Recognition) OCR 개요 OCR 이란? Text detection + Text recognition 이미지 속의 문자를 읽는 OCR은 크게 문자의 영역을 검출하는 Text Detection + 검출된 영역의 문자를 인식하는 Text Recognition으로 구분된다. Text Detection - Object Detection 문제를 Text 찾아내기로 확장한 느낌 - 추가로 Segmentation 기법도 사용되며 문자가 가지는 특성까지 고려한 형태로 발전 Text Recognition - 검출된 영역의 문자가 무엇인지 인식해 내는 과정 Text Detection 이미지 속에서 문자를 찾아내는 것은 물체를 찾아내는 것과 조금 다른 특징을 가지고 있다. 문자는 몇개가 모여서 단어/문장을 이루므로 이미지 내에서 문자를 .. 2022. 1. 6.
Segmentation image classification, object detection 모델은 이미지에서 어떤 물체의 종류를 분류하거나 물체의 유무와 위치를 탐지한다. Segmentation - 픽셀 수준에서 이미지의 각 부분이 어떤 의미를 갖는영역인지 분리해 내는 방법이다. - 이미지 분할 기술로써, 예를 들면 인물사진모드에서 인물과 배경을 분리해내어 배경을 흐리게 아웃포커싱 효과, 크로마키, 자율주행의 도로와 오브젝트 분리 등이 있다. Segmentation 종류 이미지 내에서 영역을 분리하는 접근방식은 두 가지가 있다. - Semantic Segmentation 과 Instance Segmentation이 있는데, 접근방식에 따라 문제의 정의와 모델을 구성하는 방식이 달라진다. - 좌측 상단의 사진은 물체들이 모여있.. 2022. 1. 5.
Object Detection Object detection - 이미지 내에서 물체위치 및 종류를 찾아내는 것 - 이미지 기반의 문제를 풀기 위해 사용되는 기법 Ex) 차량 , 사람 detection, 사람얼굴 detection 등 용어 1. Object Localization Localization이란 이미지 하나의 물체가 있을 때 물체의 위치를 특정 Detection이란 다수의 물체가 있을 때 각 object의 존재여부를 파악하고 위치를 특정하며 클래스 분류까지 수행 이미지 내에서 물체의 위치를 표현하는 방법에는 Bounding Box, Object Mask로 표현하는 방법이 있다. 2. Bounding Box Bounding Box는 이미지 내에서 물체의 위치를 사각형으로 정의하고 꼭지점의 좌표로 구현 - 1. 전체 이미지의 좌.. 2021. 12. 29.
반응형