목록[AI] (68)
개발자로 후회없는 삶 살기
서론 교과목 5주차 고급 신경망 활용에 관한 내용을 정리합니다. 본론 - VQA 컴퓨터에게 사진을 주면서 사진에 관한 질문을 합니다. = 묻는 말이 이 영상에서 뭘 묻는 건지 영상과 자연어를 잇는 문제입니다. > 대답은 또 자연어로 답합니다. > 5지 선다로 객관식입니다. > 지금 비가 오고 있니? 자연어를 이해해서 영상에서 답을 찾아서 자연어로 대답을 하는 것입니다. => 코드 1. cnn 모델 2. rnn 모델 -> 임베딩 매개변수는 동일합니다. (단어의 종류 10000가지, 256 크기의 벡터로 바꿈, 최대 입력은 100개) + 256 벡터 100개가 쫙 있는데 이걸 lstml에 넣는다는 게 100 단어를 한 번에 넣는 게 아니고 첫 번째 넣고 두 번째 넣고 쭉쭉쭉 넣어서 100번째 단어를 넣습니다..
서론 이번 포스팅에서는 Tensorflow로 구현한 GAN을 MNIST dataset으로 학습한 후, 학습된 generator이 생성한 가짜 이미지를 확인하는 것을 목표로 한다. 작업 환경은 Google Colab에서 진행합니다. -> 전체 코드 https://github.com/SangBeom-Hahn/AI_Paper_Review_Analysis/tree/main/Vanila_Gan GitHub - SangBeom-Hahn/AI_Paper_Review_Analysis Contribute to SangBeom-Hahn/AI_Paper_Review_Analysis development by creating an account on GitHub. github.com 본론 - 목차 1. 학습에 필요한 util..
서론 Generative Visual Manipulationon the Natural Image Manifold은 제목 그대로 이미지의 자연 상태에서 시각적인 조작을 하는 방법을 설명합니다. 본 포스팅에서 주요 내용 위주로 논문을 번역/ 요약하였습니다. > 논문에서는 이미지 조작을 실시간으로 대화형(interactive)으로 하는 것을 목표로 하기 때문에 IGAN이라고 부릅니다. official pix2pix의 저자분들께서 제안하셨으며 GAN을 대화형으로 사용할 수 있다는 것을 보여줌과 동시에 사용자를 위한 인터페이스까지 제공합니다. 틀린 내용이 있으면 피드백 부탁드립니다. - 논문 제목 : Generative Visual Manipulation on the Natural Image Manifold - ..
서론 교과목 5주차 강의 내용을 정리합니다. 본론 - faster rcnn 복습 => rpn 1. 어디에 있냐를 예측해야 하는데 어떤 모양으로, 어떤 크기로 있는지도 모르기 때문에 아는 게 없습니다. 2. 아무것도 모르는데 예측하 는 건 말이 안 되니 기본 틀을 만들어 두고 이 크기로 물체가 있을 거다라고 생각해 보겠습니다. > 실제로 물체가 어떻게 있는지 모르는 상태에서 예측하라고 하면 말도 안 되는 말입니다. 3. 그래서 미리 "이럴 거다~"는 식으로 만들어 놓습니다. > 전체를 격자로 쪼개고 (이것도 하이퍼 파라미터입니다.) 격자의 점을 중심으로 k개의 앵커박스를 준비하고 다음 한 칸 옆 픽셀에서도 그 점을 중심으로 k개를 준비합니다. > 지역으로 제안할 후보(candidate)가 엄청 많은데 그 ..