728x90

미드저니로 프롬프트를 만들어보려고 기존의 사진을 이용해서 챗봇에게 그림해석을 부탁해보려고 했습니다. 기존의 사진과 비슷한 그림을 추출하기 위해서였죠. 그러나 아직까지는 API로 개발을 할 수 있는 분들에게만 좋은 소식이구요. 우리는 그분들이 개발한 다양한 프로그램을 사거나 이용해야 할 것 같습니다. 

 

 

1. GPT-4에게 그림을 보여주고 해설해 달라고 하면 ? (직접 물어봄)

GPT-4는 텍스트 기반 인공지능 모델이기 때문에 직접 그림을 보고 해설하는 것은 불가능합니다. 하지만 그림에 대한 설명이나 묘사를 텍스트로 전달해 주시면, 그에 대한 정보를 바탕으로 관련된 해설이나 정보를 제공해 드릴 수 있습니다.

aiai

*그림이나 이미지를 텍스트로 설명해 주실 때 다음과 같은 정보를 포함하면 도움이 됩니다:

  1. 그림의 주요 색상과 느낌 (예: 밝은 색, 어두운 색, 화려한 색 등)
  2. 그림에 그려진 주요 객체나 인물 (예: 산, 나무, 건물, 동물, 인물 등)
  3. 그림의 스타일 (예: 초현실주의, 입체주의, 인상주의 등)
  4. 그림이 전달하려는 메시지나 감정 (예: 평화, 슬픔, 기쁨 등)

이러한 정보를 바탕으로 GPT-4는 그림에 대한 해설이나 관련 정보를 제공하는 데 도움이 될 수 있습니다.

2. 혹시 Api를 이용해서 그림을 볼 수 있는 기능을 만들 수는 있는지?

직접 GPT-4로 이미지를 처리할 수는 없지만, 이미지를 처리하고 분석하는 인공지능 모델과 결합하여 사용하실 수 있습니다. OpenAI에서 제공하는 DALL-E와 같은 이미지 생성 모델이나, Google Cloud Vision API, Amazon Rekognition, Microsoft Azure Computer Vision API 등의 이미지 인식 및 분석 서비스를 활용하실 수 있습니다.

이러한 서비스를 사용하면 이미지의 객체, 색상, 스타일 등에 대한 정보를 텍스트 형태로 받을 수 있습니다. 그런 다음, 이 정보를 GPT-4에 전달하여 이미지에 대한 해설이나 정보를 생성하도록 할 수 있습니다.

*이를 위해서는 다음 단계를 따르면 됩니다:

  1. 이미지 인식 및 분석 서비스를 선택하세요 (예: Google Cloud Vision API, Amazon Rekognition 등).
  2. 선택한 서비스에 이미지를 전송하고, 이미지에 대한 정보를 텍스트로 받아옵니다.
  3. 받아온 텍스트 정보를 GPT-4에 전달하고, 이미지에 대한 해설이나 정보를 생성하도록 요청합니다.
  4. GPT-4에서 생성된 결과를 사용자에게 전달합니다.

이렇게 하면 이미지를 볼 수 있는 기능을 구현하고 GPT-4와 결합하여 이미지에 대한 해설이나 정보를 생성할 수 있습니다.

 

 

3. 그림 설명해 주는 프로그램 없는지?

여기 그림을 설명해주는 프로그램 2개를 소개합니다. 하나는 Imagga 홈페이지에 들어가셔서 그림에 대한 키워드를 얻는 방법입니다. 이 방법으로 키워드를 추출하면 추출된 키워드별로 그림에서 차지하는 분량이 %로 표시됩니다. 저는 이 방법으로 미드저니에서 그림을 생성할 때 참고해서 비슷한 그림을 추출하기도 합니다.   

예시된 선글라스 사진의  태깅을 복사하면 아래와 같이 나옵니다. 

 

sunglasses100.00 %

sunglass98.99 %

spectacles59.96 %

optical instrument44.81 %

beach43.24 %

summer32.15 %

sea31.27 %

vacation31.10 %

ocean29.04 %

sun27.37 %

 Imagga

이마가 태깅

 

Auto-Tagging Demo - Imagga

Options Change language: English Arabic Bosnian Bulgarian Catalan Chinese Simplified Chinese Traditional Croatian Czech Danish Dutch English Estonian Finnish French German Greek Haitian Creole Hebrew Hindi Hmong Daw Hungarian Indonesian Italian Japanese Kl

imagga.com

다음은 카카오톡에서 플러스친구로 사용할 수 있는 AskUp인데요. 지난번에 포스팅을 했었지요. 이곳에 그래서 그림을 딱 올렸는데 해석을 못해주더라구요 그래서 다시 이미지 링크를 올렸더니 정말 그림에 대한 해설을 해줬어요. 여러분도 한번 시도해보세요. 

업스테이지, OCR 기술과 챗봇 기술을 결합한 카카오톡 채널 서비스 'AskUp' 출시

 

업스테이지, OCR 기술과 챗봇 기술을 결합한 카카오톡 채널 서비스 'AskUp' 출시

업스테이지는 최신 기술과 본사만의 창의적인 아이디어를 바탕으로 다양한 AI 솔루션을 개발하여 고객들의 비즈니스 성장과 혁신을 지원하고 있습니다. 이번에는 최신 OCR 기술과 챗봇 기술을

freebee.co.kr

그렇게 해서 추출한 미드저니 프롬프트로 일단 그림을 생성해보기로  했습니다. 왼쪽은 원본이고 오른쪽은 AskUp에게 해설을 부탁해서 나온 프롬프트를 기반으로 만든 미드저니의 생성된 그림입니다. 완전히 다른 느낌이네요. 아마 다른 파라미터나 좀 더 디테일한 기술들을 입력했다면 비슷한 그림이 생성되지 않았을까 생각됩니다.

원본생성된-그림
왼쪽은 원본 -오른쪽은 생성된 그림

요즘 많은 AI가 쏟아져 나오고 있습니다. 특히 그림과 영상 부분에서는 엄청난 발전이 이루어지고 있는데요. 이렇게 쏟아져 나올 때  우리에게는 무료로 사용할 수 있는 기회도 있으니 놓치지 마시고 많이 사용해보시기 바랍니다. 감사합니다. 

 

미드저니 Midjourney ai로 다양한 표정의 귀여운 캐릭터 만들기

 

미드저니 Midjourney ai로 다양한 표정의 귀여운 캐릭터 만들기

미드저니 Midjourney ai로 다양한 표정의 귀여운 캐릭터 만들기 웹사이트를 검색하다가 미드저니 (Midjourney)로 다양한 표정의 캐릭터를 만드는 프롬프트를 발견해서 따라해 보았습니다. 프롬프트는

freebee.co.kr

원더 다이내믹스, 영화 및 TV 산업을 위한 혁신적인 AI 툴 Wonder Studio 출시

 

원더 다이내믹스, 영화 및 TV 산업을 위한 혁신적인 AI 툴 Wonder Studio 출시

엔터테인먼트 업계의 선도적인 AI 기반 기술 회사인 원더 다이내믹스(Wonder Dynamics)가 영화 제작자와 프로듀서의 콘텐츠 제작 방식에 혁신을 가져올 획기적인 AI 도구인 원더 스튜디오(Wonder Studio)

freebee.co.kr

구글 클라우드 네트워크 신제품 공개

 

구글 클라우드 네트워크 신제품 공개

구글 클라우드, 모바일 월드 콩그레스에서 통신 서비스 제공업체의 네트워크 혁신을 지원하는 신제품 공개 구글 클라우드가 세계 최대 이동통신 행사인 모바일 월드 콩그레스(MWC) 2023에서 텔레

freebee.co.kr

리처드 도킨스가 바라본 인공지능(AI)의 잠재적 가치와 위험

 

리처드 도킨스가 바라본 인공지능(AI)의 잠재적 가치와 위험

저명한 동물행동학자이자 진화생물학자인 리처드 도킨스(Richard Dawkins')는 저서 '이기적 유전자'와 더불어 과학에 대한 열정적인 지지 활동으로 널리 명성을 얻고 있습니다. 도킨스는 문학 작품

freebee.co.kr

메타인지 뜻 Metacognition

 

메타인지 뜻 Metacognition

메타인지의 사전적 정의 : 자신의 인지 과정에 대하여 한 차원 높은 시각에서 관찰ㆍ발견ㆍ통제하는 정신 작용. 「영어」 metacognition -국립국어원(우리말 샘) 유의어 : 상위인지(上位認知), 초인

freebee.co.kr

 

728x90
  • 네이버 블러그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 카카오스토리 공유하기