본문 바로가기

분류 전체보기25

TTA(Test-Time Augmentation) Segmentation Data Augmentation에 관련된 여러 논문들을 읽다가 Test-time augmentation이라는 걸 봤는데, 파파고에 번역을 돌려봤을 때, 더욱 헷갈리게 되어 그냥 넘어가게 되었는데, 이 글을 쓰기 바로 직전에 운이 좋게도 test-time augmentation에 관련하여 공부를 할 수 있게 되어서 메모를 한다. Neural Network의 성능을 올리는데에는 매우 많은 방법이 존재하는데, 그 중 가장 중요한 방법이 Augmentation이라고 생각한다. 왜냐하면 딥러닝에서 뭐가 되었든 data의 질과 양이 중요한데, Data Augmentation은 여러가지 방법들(rotate, translate, flip..등)로 기존의 train set을 증강시켜서 Networ.. 2022. 4. 28.
jupyter notebook에서 .py 파일 만드는 법 python의 module, package 공부를 하다보니 .py 파일을 만드는법이 필요했는데, 쥬피터노트북 환경에서는 만들어지지 않는것같아 검색을하고 찾아보니 첫번째 방법으로 제일 쉽지만 조금 귀찮은 방법 이렇게 .ipynb 파일에 들어가서 .py 파일을 다시 받은 후, 다시 폴더에 넣는 방법이 있다. 좀 귀찮긴하지만 확실한 방법? 두번째 방법으로는 terminal을 이용하여 .ipynb > .py 파일로 변환하는 방법 주피터 창에서 터미널로 들어간 뒤에 cd 파일경로/ change directory를 통해 변환하고자 하는 .ipynb 파일이 있는 디렉토리로 들어가서 jupyter nbconvert --to script file_name.ipynb 를 해주면된다. 여기서 file_name은 당연히 파일.. 2022. 2. 22.
MacOS에서 키 반복 MacOS 에서 한글은 아래와 같이 "ㅁ"을 꾹 눌렀을 때 연속적으로 쳐지지만, 숫자/영문같은 경우에 꾹 눌렀을 때 아래와 같이 연속적으로 타이핑이 되지 않는다. 이럴 경우는 우선 spotlight에서 terminal을 검색하여 defaults write -g ApplePressAndHoldEnabled -bool false 를 쳐주면 되고, 재시동을 한다. 그럼 다음과 같이 잘 된다! 2022. 2. 18.
Deep Pose Human Pose Estimation Human Pose Estimation(이하 HPE)은 크게 2D와 3D로 나뉜다. 3D HPE는 2D 이미지에서 (x,y,z) 3차원 좌표들을 찾아내는 기술 Pose 와 face landmark face landmark - 얼굴 인식에서는 물리적으로 거의 고정되어있다. Pose - 팔, 다리가 상대적으로 넓은 범위와 _자유도_를 갖는다. - 자유도를 높다는 것은 데이터분포를 특정하는데에 어려움이 있다는 뜻이고, 더 복잡하다. 접근법 1. Top-down - 사람들의 key-point를 정확하게 찾기 위해 object detection을 사용 - crop 한 이미지 내에서 keypoint를 찾아내는 방법으로 표현 - detector가 선행되어야 하고 사람 숫자마다 .. 2022. 1. 21.
Face Detection Face Detection은 빨라야 하고, weight가 작아야 한다. 예를 들어 얼굴인식으로 화면 잠금을 푸는 기술에서 서버로 이미지를 보낸 후 처리를 한다면? 인식하는 데에 시간이 소요가 되고, 여러 가지 영향들(네트워크 비용 + 서버 비용 + 인터넷 속도)때문에 적합하지 않다. 따라서 위의 영향들에 대해서 무관하게 항상 동작해야 하는데, 핸드폰에 모델을 올려서 바로 이용하는 방법이 있다. 그런데, 핸드폰에 모델을 올리려면 weight가 작은 모델이 유리하지만 작은 모델은 성능이 일반적으로 떨어지기 때문에 보완을 해야 한다. 어떻게 하면 빠르게? Face Detection에서 시간이 많이 드는 요소는 Sliding window이므로 이것을 버려야 빨라진다. ∴ 2-stage 방식의 detection은.. 2022. 1. 13.
pycharm - 주석, 코멘트 (line comment) 색 바꾸기 for intel mac 주석이 옅은 회색으로 나와서 나의 pycharm의 배경색깔에서는 잘 보이지 않아 바꾸게 되는 계기가 되었다. 들어가서 Editor ==> color Scheme ==> python 클릭 맨 우측 Foreground 부분 오른쪽 16진수 부분을 클릭하여 색을 변경할 수 있다. 본인은 검정배경에서 눈에 가장 잘 띄는 노란색으로 2022. 1. 7.
OCR(Optical Character Recognition) OCR 개요 OCR 이란? Text detection + Text recognition 이미지 속의 문자를 읽는 OCR은 크게 문자의 영역을 검출하는 Text Detection + 검출된 영역의 문자를 인식하는 Text Recognition으로 구분된다. Text Detection - Object Detection 문제를 Text 찾아내기로 확장한 느낌 - 추가로 Segmentation 기법도 사용되며 문자가 가지는 특성까지 고려한 형태로 발전 Text Recognition - 검출된 영역의 문자가 무엇인지 인식해 내는 과정 Text Detection 이미지 속에서 문자를 찾아내는 것은 물체를 찾아내는 것과 조금 다른 특징을 가지고 있다. 문자는 몇개가 모여서 단어/문장을 이루므로 이미지 내에서 문자를 .. 2022. 1. 6.
Segmentation image classification, object detection 모델은 이미지에서 어떤 물체의 종류를 분류하거나 물체의 유무와 위치를 탐지한다. Segmentation - 픽셀 수준에서 이미지의 각 부분이 어떤 의미를 갖는영역인지 분리해 내는 방법이다. - 이미지 분할 기술로써, 예를 들면 인물사진모드에서 인물과 배경을 분리해내어 배경을 흐리게 아웃포커싱 효과, 크로마키, 자율주행의 도로와 오브젝트 분리 등이 있다. Segmentation 종류 이미지 내에서 영역을 분리하는 접근방식은 두 가지가 있다. - Semantic Segmentation 과 Instance Segmentation이 있는데, 접근방식에 따라 문제의 정의와 모델을 구성하는 방식이 달라진다. - 좌측 상단의 사진은 물체들이 모여있.. 2022. 1. 5.
Object Detection Object detection - 이미지 내에서 물체위치 및 종류를 찾아내는 것 - 이미지 기반의 문제를 풀기 위해 사용되는 기법 Ex) 차량 , 사람 detection, 사람얼굴 detection 등 용어 1. Object Localization Localization이란 이미지 하나의 물체가 있을 때 물체의 위치를 특정 Detection이란 다수의 물체가 있을 때 각 object의 존재여부를 파악하고 위치를 특정하며 클래스 분류까지 수행 이미지 내에서 물체의 위치를 표현하는 방법에는 Bounding Box, Object Mask로 표현하는 방법이 있다. 2. Bounding Box Bounding Box는 이미지 내에서 물체의 위치를 사각형으로 정의하고 꼭지점의 좌표로 구현 - 1. 전체 이미지의 좌.. 2021. 12. 29.
Infra 운영 따라잡기 6주차 1. Polkit(Policykit)의 특징 및 적용방법, 사용이 필요한 경우 생각 폴킷 - 유닉스 운영체제의 시스템 전반에서 인증 단계를 통제하기 위해 만들어진 프로그램으로 인증을 받지 않은 프로세스로 하여금 인증을 받은 계정과 커뮤니케이션이 가능하도록 체계적인 방법을 제공 sudo 등 기존의 인증 시스템과 달리 모든 프로세스에 대하여 최고 관리자의 권한을 요구하는 것이 아니라 집중화된 시스템 정책의 통제 아래에서 느슨한 수준의 인증을 행함 polkit을 사용함으로서, 관리자는 일부 사용자에게 날짜나 시간을 변경할 수 있게 하거나, 특정 사용자에게 시스템 서비스를 시작하거나 멈추게 할 수 있는 권한을 준다. 사용자에게는 변경 권한이 없는 사용자에게 설정 단계로 가기전에 잠금 풀기 버튼이 나타난다. 2... 2021. 11. 29.
반응형