본문 바로가기
  • 기술을 이야기하지만 사람을 생각합니다.

20. 인공지능과 딥러닝48

미드저니 Midjourney 사용 방법 & 파라미터 설정하기 미드저니 Midjourney 살펴보기 슬랙과 비슷한 디스코드 UX와 파라미터 설정을 CLI 명령어 입력하는 규칙과 비슷한 걸로 보아, 굉장히 개발자 친화적이다. 커뮤니티에 공개되어 바이럴을 유도하고, 빠르게 배포하고 선보일 수 있는 채널을 선택한 것도 미드저니의 전략으로 보인다. 미드저니 가입하기 1. 미드저니(https://www.midjourney.com/)에 접속합니다. 하단 우측에 Sign in 버튼을 클릭합니다. 또는 디스코드 미드저니 초대 링크(https://discord.com/invite/midjourney)로 바로 접속합니다. 2. 디스코드로 이동됩니다. 가입 또는 로그인합니다. 내가 인간임을 인증하는 게 생각보다 어렵습니다. 미드저니 그림 그리는 방법 최초 가입 시, 무료 크레딧 25개.. 2023. 5. 18.
Generative AI를 만드는 생성형 모델 동작 방식 최근 chatGPT, 미드저니 등 생성형 AI가 적용된 서비스들이 많이 등장하면서, 이미지를 생성하는 Stable Diffuion 서비스에 적용된 Diffusion model의 동작 방식과 개념에 대해서 간단히 알아보고자 한다. Generative Model 생성형 AI 모델은 분류 모델과 달리, 낮은 차원의 데이터에서 높은 차원의 데이터를 만들어내는 과정을 거친다. 대표적인 방식으로 GAN, VAE, Flow 기반 모델, Diffusion 등이 있다. 각 모델마다 이미지를 생성하는 방식이 조금씩 다르다. VAE(Variational AutoEncoder)는 Auto Encoder 방식에서 파생된 모델이다. encoder의 입력값을 특정 확률 분포의 한 점으로 만들고, decoder에서 한 점으로부터 입.. 2023. 5. 18.
2023 Google I/O : 인공지능, 검색엔진, 하드웨어 인공지능을 외치다, Google I/O 2023 한국 시간으로 5월 11일 새벽 2시, Google의 개발자 컨퍼런스 'Google I/O'가 열렸다. 구글 I/O 컨퍼런스는 온라인으로 누구나 참석 가능하며, 구글의 방향성과가치, 목표, 집중하는 분야에 대한 키노트와 세션 등이 있다. 행사장에는 구글의 생성형 AI가 만든 가사와 뮤직 비디오로 이루어진 음악으로 흥을 돋구며, 구글의 기술력을 자연스럽게 홍보하였다. 구글의 CEO, 순다 피차이가 직접 나와 발표를 진행하였다. chatGPT 등장 이후, 구글을 위협할 것이라는 예상과 달리, 구글 I/O 컨퍼런스에서 대화형 AI '바드'를 성공적으로 소개하며 알파벳 주가는 4% 상승하였다. 작년 8월 이후 최고치를 찍었다. 이번 컨퍼런스에서는 논문으로만 소개되.. 2023. 5. 17.
오토인코더의 모든 것 (1/3) 03. Autoencoders 김활석(Naver) 님의 오토인코더의 모든 것 (1/3) 강의에서 03. Autoencoders 챕터 일부를 정리한 글입니다. 오토인토더란? 인코딩(encoding) 하면 줄어들고, 디코딩(decoding)하면 늘어나는 구조 Autoencoders = Auto-associators = Diabolo networks = Sandglass-shaped net Bottleneck Hidden Layer code Laten Variable Feature Hidden representation Introduction | Notations Make output layer same size as input layer Loss encourages output to be close to input L(x, y) : 네트.. 2022. 3. 26.
[인공지능 및 기계학습 개론 II] Latent Dirichlet Allocation 모델 KAIST 산업및시스템공학과 문일철 교수님의 인공지능 및 기계학습 개론 II 중 강의를 위주로 기타 자료를 참고하여 정리하였습니다. 잘못된 부분이 있으면 말씀해 주세요. Topic Modeling LDA 모델은 주요 키워드를 스스로 선별하는 것이 핵심이며, 문서 모델링에서 적합하게 차원을 축소하는 방법 중 하나이다. 아래 그림은 오바마를 다룬 신문을 모두 수집 후 LDA 모델을 이용하여 토픽을 뽑은 것으로, 전체 내용의 비율을 100이라고 했을 때, 각 토픽의 비중(propotion)이 얼마만큼 다뤄졌는지 나타내는 그래프이다. 알 수 없는 대용량의 문서를 토픽모델링에 적용하여 나온 결과로 주제를 추측할 수 있다. LDA는 소프트 클러스터링이며, 하나의 주제를 하나의 클러스터로 볼 수 있다. LDA 모델 .. 2020. 11. 29.
Asynchronous Methods for Deep Reinforcement Learning (A3C) Asynchronous Methods for Deep Reinforcement Learning 논문과 관련 아티클 등을 참고하여 A3S(Asynchronous Advantage Actor-Critic)을 정리하였습니다. 잘못된 부분이 있으면 말씀해 주세요! A3C는 Google의 Deepmind에서 범용적으로 사용할 수 있는 강화학습 프레임워크를 소개한 논문입니다. 기존의 DQN 강화학습은 한 개의 에이전트가 시간 순서대로 경험한 결과를 쌓은 뒤, correlation을 줄이기 위해 랜덤하게 학습하는 replay memory 방식이였다. A3C는 여러 에이전트를 다른 환경에서 경험을 쌓으나, 학습 시키는 policy network와 value network는 중앙에서 관리하며 각각의 환경에 비동기식으로 .. 2020. 9. 14.
DQN 실습 :: CartPole 게임 Deep Q-Network 튜토리얼 클래식한 게임 CartPole에 Deep Q-Learning(Reinforcement learning)을 적용한 코드를 실습해 보았습니다. 와 다른 아티클 등을 참고하여 정리하였습니다. OpenAI Gym에서 Chartpole 게임에 DQN을 적용한 튜토리얼과 설명을 확인할 수 있습니다. CartPole 게임 Chartpole은 카트를 왼쪽 또는 오른쪽으로 잘 밀어서 균형을 잡는 문제이다. 이 게임에 DQN을 적용하여, remember와 replay를 반복하며 스스로 방법을 터득하게 된다. reward function : 매 타임스텝마다 +1씩 보상을 받음 막대가 중심에서 2.4유닛 이상 기울어지거나, 멀리 떨어지면 종료됨 State space : 현재 위치, 막도의 .. 2020. 8. 30.
스터디 | Playing Atari with Deep Reinforcement Learning 강화학습 배우기 위해 입문편으로 논문을 읽고 관련 자료 등을 참고하여 정리한 블로그입니다. 잘못된 부분이 있다면 말씀해 주세요! Playing Atari with Deep Reinforcement Learning은 알파고를 만든 Deep Minde에서 2013년도 NIPS 워크샵에 소개한 논문이다. 1. Introduction 비전이나 음성처럼 높은 차원의 인풋(high-dimensional sensory input)은 강화학습 에이전트에서 직접 학습하기 어려웠다. 그나마 강화학습(Reinforcement learning, RL)은 대부분 hand-crafted feature에 의존했다. 최근에는 컴퓨터 비전의 낮은 센서 데이터에서 높은 차원의 피처를 추출하여 딥러닝하는 것이 가능해졌다. 이러한 접근을 .. 2020. 8. 9.
GAN| PyTorch Implementation Generative Adversarial Network PyTorch Implementation 2020. 7. 4.
GAN(Generative Adversarial Networks) 논문 리뷰 01. Taxonomy of Machine Learning GAN 모델을 설명하기 전에 딥러닝을 크게 두 가지로 나누면, 1) Supervised Learning과 2) Unsupervised Learning이 있다. A. Supervised Learning 지도 학습 대표적인 모델로 Discriminative Model이 있으며, 로지스틱 회귀분석, 뉴럴 네트워크 등이 해당된다. Input에 해당하는 클래스를 맞추기 위해 학습하게 된다. 예를 들어 남자냐, 여자냐를 구분하는 것이다. B. Unsupervised Learning 비지도 학습 label이 없는 데이터를 잘 학습하는 것이다. Generative Model에는 Naive Bayes, Gaussian discriminant analysis (G.. 2020. 6. 7.