Tech News

제목Deep Daze - 텍스트에서 이미지 생성하기2021-03-31 00:34
작성자 Level 10

GitHub - lucidrains/deep-daze: Simple command line tool for text to image generation using OpenAI's CLIP and Siren (Implicit neural representation network) 


- OpenAI의 CLIP과 Siren을 이용해서, 간단한 문자열을 넣으면 이미지를 생성해주는 도구

$ imagine "a house in the forest"

- 기본 모드는 최대 77자만 가능

- create_story 옵션을 주면 전체 이야기/노래/시 등을 변화하는 이미지로 생성가능


OpenAI의 Dall-E가 클로즈드 소스여서, 이걸 오픈으로 구현하고자 하는 시도들

- DALL·E : 텍스트에서 이미지 생성하기 https://news.hada.io/topic?id=3537

- DALL-E in Pytorch https://github.com/lucidrains/dalle-pytorch

- Big Sleep - text-to-image : CLIP + BigGAN, https://github.com/lucidrains/big-sleep


OpenAI의 CLIP 을 이용한 다른 프로젝트

- 유튜브 비디오 내부를 자연어로 검색하기 https://news.hada.io/topic?id=3741

G
M
T
Text-to-speech function is limited to 200 characters
댓글
자동등록방지
(자동등록방지 숫자를 입력해 주세요)