딥러닝 3

[논문 리뷰] Dynamic Memory Networks for Visual and Textual Question Answering

Dynamic Memory Networks for Visual and Textual Question Answering 논문을 읽기 전 읽어야 할 논문들 앞의 논문들에 비해 위 논문의 개선점(본문 내용) 설명 *참조 : positional encoding 관련 설명 위 수식은 End-to-End Memory Networks에서 사용한 수식과 같으며, 이의 의미에 관한 설명은 아래 참조 https://stackoverflow.com/questions/46082659/position-encoding-pe-in-end-to-end-memorynetworks Position Encoding (PE) in End-to-End MemoryNetworks Recently I am studying End-To-End M..

Show, Attend and Tell : Image Captioning에서 Soft Attention, Hard Attention

논문 링크 : https://arxiv.org/pdf/1502.03044.pdf 참조 블로그 링크 : http://sanghyukchun.github.io/93/ Show, Attend and Tell: Neural Image Caption Generation with Visual Attention (ICML2015) - README 주어진 이미지에 대한 설명을 하는 문장, 혹은 캡션을 생성하는 문제를 image caption 문제라고 한다. 이 문제는 여러 가지 문제들이 복합적으로 얽혀있는 문제라고 할 수 있는데, 먼저 이미지가 어떤 것에 대한 이미지인지 판별하기 위하여 object recognition을 정확하게 할 수 있어야한다. 그 다음에는 detect한 object들 사이의 관계를 추론하여 이미..

[논문 읽기] Wasserstein GAN

논문 링크 : https://arxiv.org/pdf/1701.07875.pdf 불러오는 중입니다... 아래 블로그가 정말 알기쉽게 설명이 잘 되어있습니다!! 많이 참고하였고 다른 분들도 참고하시면 좋을거 같습니다ㅎㅎ https://medium.com/@jonathan_hui/gan-wasserstein-gan-wgan-gp-6a1a2aa1b490 1. Introduction Unsupervised Learning(Self-supervised Learning)은 학습 데이터 x에 대한 정답 라벨 y가 존재한 것과는 달리, 데이터 x의 분포 P(x)를 직접 학습하겠다는 것이다. 이를 위해서 P(x)를 parameter θ에 대해 아래와 같이 표현하고, 이를 학습시킬 수 있다. 그러나 P(x)의 식을 직접 ..

논문 리뷰/GAN 2019.05.05
1