목록Papers/논문 리뷰 (11)
Logical Scribbles
보호되어 있는 글입니다.
보호되어 있는 글입니다.
보호되어 있는 글입니다.
보호되어 있는 글입니다.
오늘은 대망의 'Attention Is All You Need' 논문에 대해서 리뷰해보겠다. Attention Is All You NeedThe dominant sequence transduction models are based on complex recurrent or convolutional neural networks in an encoder-decoder configuration. The best performing models also connect the encoder and decoder through an attention mechanism. We propose a new arxiv.org 사실 최근의 몇몇 포스팅들이 이 리뷰를 위한 빌드업이었다. 우선 기초 지식을 위해 아래의 내용을 숙..
이번 포스팅에서는 R-CNN을 소개한 논문, "Rich feature hierarchies for accurate object detection and semantic segmentation" 에 대해 알아보자. 이 논문은 객체 탐지에서 2-stage-detection 모델의 시초급 논문이다. 위의 객체 탐지 논문 리스트에서도 볼 수 있듯이, R-CNN 논문은 당당히 필수 논문 중 가장 첫번째로 읽어야할 논문이라고 소개되어있다. (빨간색 글씨가 필수 논문) 2-stage-detector와 1-stage-detector에 대해서는 아래의 글에 자세히 설명이 되어있다. [객체 탐지] 2-Stage Dectector 와 1-Stage Detector 이번 포스팅에서는 객체 탐지 논문을 읽다보면 많이 등장하는 ..
이번 포스팅은 AlexNet에 대한 논문이다. 논문 제목은 'ImageNet Classification with Deep Convolutional Neural Networks ' 이고, AlexNet은 VGG를 소개한 포스팅에서 말했듯 세상에 딥러닝의 시대가 도래했음을 알린 모델이기도 하다. 또한 2012년 ILSVRC (ImageNet Large Scale Visual Recognition Challenge)의 우승자이다. AlexNet은 LeNet-5 등장 이후 약 10년 뒤에 나온 모델이며, 해당 연도 이미지넷 대회에서 경쟁팀 대비 정확도가 약 10% 정도 앞서있는 모델이었다. 이 모델이 AlexNet이라고 이름 붙여진 이유는 Alex Krizhevsky 라는 이름을 가진 딥러닝 대가 제프리 힌튼 ..
지난 포스팅에 이어서 VGG모델의 실험 결과를 살펴보도록 하자. Dataset ILSVRC-2012 dataset(이미지넷)을 사용하였다. 이 데이터셋은 1000개의 class를 포함하고 있고, 3종류로 split 되어 있다. (Training data, Validation data, Testing data) 이러한 데이터셋의 1000개의 class를 classification 하는 것에 있어 performance의 측정 방식은 두가지이다. Top-1 Error : 예측이 잘못된 이미지의 비율 Top-5 Error : 예측된 top-5 class에 정답이 없는 이미지의 비율 ILSVRC-2012에서는 두번째 측정 방식을 주요 평가 지표로 사용하였다고 한다. 또한, 이 실험에서는 이미지넷 데이터셋의 Val..