- Today
- Total
목록Boostcourse (94)
hye-log
🍳 오늘의 회고 오전에는 주말동안 돌린 모델 관련해서 이야기해보았다.. 확실히 큰 모델이 성능도 좋은건 당연한 결과인가..(그만큼 시간이 많이 들긴 했지만..!ㅠ) 원래는 작은 오브젝트에 대한 탐지 성능이 낮은거 같아서 해결해보고자 다른 모델(tood)를 돌려봤는데, 생각보다 전반적인 성능도 낮고, 작은 오브젝트에 대해서도 성능이 크게 개선되는 양상이 없어서 중단했다. 사실 작은 오브젝트가 이미지 크기가 달라지면 같이 달라질 수 있는 요소이다보니 작은 오브젝트 성능 향상이 크게 중요한지는 의문이다.. 피어세션 때에는 본격적으로(?) augmentation 관련 실험을 하기 위해서 baseline으로 모델을 정하고, 어떤 augmentation을 적용하면 좋을지 찾아보았다! 오늘은 강의가 없어서 조금 짧은..
⚽ 오늘의 회고 (왜 안 올라갔지..?ㅠㅠ) cascade 결과를 확인해봤는데 생각보다 잘 나오지가 않아서 faster-rcnn을 계속 사용하기로 했다! 오전에는 다른 팀원이 올려주신 코드 써보다가 뭔가.. 패키지가 꼬여버려서.. 서버를 다시 받았다..(하하) 서버를 다시 다운 받고 세팅하고 train 코드를 돌렸는데, 학습은 되는거 같은데 validation이 안 되는 문제가 발생했었ㄷㅏ.. 피어세션 때 화면 공유해서 log interval이랑 loss랑 바꿔주고 돌리니까 제대로 잘 동작하는 걸 확인했다!(다행..) 주말동안에는 조금 큰 모델을 돌려서 최대한(?)의 성능을 뽑아보기로!
⚽ 개별학습 [8] Advanced Object Detection 2 2. M2Det 1) Overview (1) 여러 크기의 물체를 탐지하기 위해서 Image Pyramid, Feature Pyramid와 같은 방법을 사용 (2) Feature Pyramid의 한계 - classification을 위해 설계되어 detection에는 적합하지 않음 - backbone network가 single level 정보만 나타냄 (3) M2Det - Multi-level, multi-scale Feature Pyramid(MLFPN) 제안 - MLFPN + SSD => M2Det 라는 1 stage detector 제안 2) Architecture (1) Overall Architecture - Backbone ..
⚽ 개별학습 [8] Advanced Object Detection 2 1. YOLO v4 1) Overview (1) Background - 최신 Detection에서 정확도는 크게 향상했지만, 많은 GPU 필요 - 실시간 task에는 부적합 - 다른 detector보다 빠르면서 정확도가 높음 (2) Contribution - 하나의 GPU에서 훈련할 수 있는 빠르고 정확한 Object Detector - BOF(Bag of Freebies, inference 비용 유지, 정확도 향상), BOS(Bag of Specials, inference 비용 높임, 정확도 향상) 실험을 통해서 증명 - GPU 학습에 효율적이고 적합하도록 방법들을 변형 2) Related work (1) Object Detectio..
⚽ 개별학습 [7] Advanced Object Detection 1 3. Transformer 1) Overview (1) Transformer - NLP에서 long range dependency 해결 -> Vision에서 Vision Transformer(ViT)로 발전 - End-to-End Object Detection with Transformers(DETR) - Swin Transformer (2) Self Attention - Input(text)를 deep learning이 이해할 수 있는 포맷인 vector로 변환해줌 - Input embedding과 Positional Encoding을 합쳐서 network에 넣어줌 2) Vision Transformer(ViT) (1) Overvie..