반응형
생성 모델 (Generative Model)의 목표와 Image-to-Image Translation 소개
- 대표적인 image - to - image translation 아키텍처로 Pix2Pix가 있습니다.
- Pix2Pix는 학습과정에서 이미지 x자체를 조건(condition)으로 입력받는 cGAN의 한 유형입니다.
- Pix2Pix은 픽셀(pixel)들을 입력으로 받아 픽셀(Pixel)들을 예측하는 의미를 가집니다.
Image-to-Image Translation: Pix2Pix의 아키텍처
- Pix2Pix는 이미지를 조건(condition)으로 입력받아, 이미지를 출력으로 내보냅니다.
- 이를 효과적으로 처리할 수 있는 U-Net 기반의 네트워크 아키텍처를 사용합니다.
- Pix2Pix는 image를 image로 변환하도록 generator를 학습합니다.
Image-to-Image Translation: Pix2Pix의 손실 함수
- GAN은 기본적으로 다른 생성 모델에 비하여 blurry한 결과가 나오는 문제가 적은 편입니다.
- GAN은 성능을 더 향상시키기 위해 L1 손실(loss)함수를 함께 사용합니다.
- L1 손실에대하여
Pix2Pix의 discriminator는 convolutional PatchGAN 분류 모델을 사용합니다.
- 이미지 전체에 대하여 판별하지 않고, 이미지 내 패치 단위로 진짜/가짜 여부를 판별합니다.
참고 사이트
'AI_Bootcamp' 카테고리의 다른 글
6주차 Day23 CycleGAN (0) | 2022.02.14 |
---|---|
6주차 Day22 Pix2Pix 실습 코드 with 나동빈멘토님 (0) | 2022.02.10 |
6주차 Day21 GAN: Generative Adversarial Networks (0) | 2022.02.07 |
4주차 Day20 Lenet, Alexnet, VCG-16-net, Resnet (0) | 2022.02.06 |
4주차 Day19 Deep Learning ANN,DNN,CNN 비교 (0) | 2022.02.01 |