Tags
숏폼 모바일 비디오 플랫폼 '틱톡'이 간단한 텍스트로 이미지를 만들 수 있는 인공지능(AI) 효과를 도입했다.틱톡은 사용자가 간단한 텍스트를 입력하면 이에 따라 제작된 이미지를 영상 배경으로 사용할 수 있는 AI그린스크린을 추가했다. 틱톡의 AI그린스크린은 단순하고 추상적이다. 오픈AI가 개발한 달리2(DALL-E2)나 구글의 '이매젠'보다는 단순하다. 그동안 크리에이터의 제작 수준에 따라 달라지던 영상 배경이 AI를 기반으로 전환된 것이다. 저작물의 상향 평준화가 시작됐다. AI 저작 콘텐츠는 이렇게 자연스럽게 우리 생활에 파고들고 있다. 합성 미디어(synthetic media)의 부상이다.
김인순 2022.08.16 23:55 PDT
스마트폰에서 문자 메시지를 보낼 때 단어나 문장 자동 완성 기능을 쓴다. 원하는 문장이 자동으로 추천돼 편하게 문자를 보낼 수 있다. 소프트웨어 개발자도 프로그래밍을 할 때 이런 기능이 생겼다. 마이크로소프트가 인수한 깃허브의 '코파일럿(Copilot)', 아마존웹서비스(AWS)의 '코드위스퍼러(CodeWhisperer)'다. 인공지능(AI) 기반 코딩 자동화 도구다. 왜 MS와 AWS는 코드 자동화 도구를 만들었을까. 한국은 물론이고 미국에서도 개발자 인력난이 여전하다. 코딩 자동화 도구가 개발자 부족 현상을 해소할 수 있을지 관심이 모인다.
김인순 2022.06.27 22:54 PDT
위 그림을 어떻게 설명할 수 있을까? '초밥으로 만들어진 집에 사는 개' 정도로? 이런 사진을 왜 찍지? 저런 초밥 집이 가능한가? 개의 크기가 작은 것일까? 초밥 집을 크게 지은 것일까? 하지만 놀랍게도 ‘초밥으로 만들어진 집에 사는 귀여운 웰시 코기(A cute corgi lives in a house made out of sushi)’ 라는 문장을 입력하면 인공지능이 실제 촬영한 사진처럼 보이는 가상의 이미지를 만들어준 결과라고 하면 어떨까? 현실에 존재하지 않는 사물까지 AI가 인간처럼 ‘상상해’ 만들어 준다. 구글의 인공지능(AI) 연구조직 구글 리서치 브레인팀(Google Research, Brain Team)은 23일(현지시각) 46페이지 분량의 연구 논문을 발표했다. 이 발표에는 인간의 언어를 이해, 그 정보를 바탕으로 이미지를 만들어 내는 AI 모델 이매진의 성능이 자세히 기술돼 있다.생성적 적대 신경망(Generative Adversarial Network, 이하 GAN)이라고 부르는 딥러닝(Deep Learning, 심층학습) 기술의 발전으로 이런 이미지 창조가 가능해졌다. 생성 모델(생성자, generator)과 판별 모델(감별자, discriminator)이 서로 경쟁, 실제와 가까운 이미지를 자동으로 만들어낸다.가짜 지폐를 만드는 범인(생성자)과 위폐를 감별하는 경찰(감별자)이 경쟁하는 상황을 떠올리면 된다. 경쟁 과정에서 위폐가 발전해 진짜 지폐와 구별할 수 없는 수준에 이르게 되는 것이다. 여기에 텍스트, 사진 등 다양한 양식의 정보를 동시에 이해하는 ‘멀티모달(Multimodal, 다중모드)’ 학습이 더해져 말하는 대로 그려주는 똑똑한 AI가 완성됐다.구글이 인공지능 전문 기업 ‘오픈AI’와 본격적인 경쟁 구도를 형성했다는 점도 흥미로운 부분이다. 오픈AI는 지난 4월 6일 텍스트 기반 이미지 생성 모델 ‘달리2’를 공개해 화제를 불러일으킨 바 있다. 구글은 불과 한 달여 만에 달리와 비슷한 이머젠을 공개, 차세대 AI 대전을 예고했다.
박원익 2022.05.24 23:45 PDT
순다르 피차이 구글 CEO는 5월 18일(현지 시각) “자연어(Natural Language) 이해 분야의 돌파구 ‘람다(LaMDA, Language Model for Dialogue Applications)’를 소개할 수 있어 흥분된다”며 이같이 말했다.람다는 이날 미국 캘리포니아 마운틴뷰 구글 본사에서 온라인으로 개막한 ‘구글 I/O(연례 개발자회의)’의 주인공이었다. 피차이 CEO는 기조연설 초반 직접 람다를 소개했고, 약 10분을 할애해 람다의 성능과 가능성을 강조했다. 스마트폰 운영체제(OS) ‘안드로이드’, 업무 도구 ‘워크스페이스(Workspace)’처럼 상용화된 제품이 아니라 개발 중인 AI(인공지능) 모델이라는 점을 고려하면 이례적인 일이었다.람다는 어떤 주제든 사람처럼 대화할 수 있는 AI 언어 모델이다. 예컨대 람다를 활용하면 명왕성, 종이비행기 같은 사물과 대화하는 경험을 할 수 있다. 기계가 일부 학습된 정보만 나열하는 것이 아니라 인격을 가진 사람처럼 자연스럽게 말을 건네기 때문이다. 이날 시연에 등장한 명왕성은 자존감이 높았고, 종이비행기는 재기발랄했다.
박원익 2021.05.30 13:09 PDT
코딩 없이 만들어지는 소프트웨어, 모듈처럼 필요한 부분만 사용할 수 있는 앱(API), 인공지능이 쓰는 기사. 한 번쯤은 들어보셨을 것이다. 하지만 더 이상 미래 스토리가 아닙니다. 코로나 팬데믹으로 인해 이처럼 SW, AI 발전이 가속화되고 있는 사례가 속속 등장하고 있기 때문이다. 구글(Google)은 지난 9월 8일(현지 시간) 일반인이 코딩을 하지 않고도 애플리케이션을 개발할 수 있는 서비스를 공개했다. 비즈니스 분석도 해주는 새로운 비즈니스 애플리케이션 플랫폼이다. 이 서비스를 이용하면 API(운영체제와 응용프로그램 사이에 사용되는 언어나 메시지 형식)를 통해 프로그램 언어를 잘 몰라도 비전문가도 앱을 빠르게 구축할 수 있고 데이터도 만들 수 있게 해준다. 전문 소프트웨어 엔지니어나 코딩없이도 일반인들이 앱과 서비스를 개발할 수 있도록 해서 소프트웨어 개발을 민주화하려는 것이 구글의 목표다.이처럼 소프트웨어 개발의 핵심 요소 중 하나인 ‘API’를 필요에 따라 조립해서 사용할 수 있는 'API 이코노미'가 곧 부상할 것이다. 가트너(Gartner Inc)에서 따르면 오는 2023년까지 ‘시민 개발자’가 기업의 전문 소프트웨어 엔지니어(전문 코더)보다 4배 더 많을 것으로 예상했다. 앞으로 ‘서버 없는 컴퓨팅(Serverless computing)’ ‘코딩 없는 소프트웨어’ 시대가 올 것이다.
손재권 2020.09.09 01:39 PDT
“이건 공상과학 소설이 아니다. 현실이다.”“비트코인 이후 가장 강력한 파괴력을 지닌 도구다.”“(프로그램 개발에서 다른 영역으로) 커리어 전환을 고민해야 할 때다." 오픈AI(OpenAI)가 최근 공개한 언어 생성기 GPT-3(Generative Pre-Training 3)가 전 세계 소프트웨어 개발자들을 깜짝 놀라게 했다. 오픈AI는 일론 머스크(Elon Musk) 테슬라 최고경영자(CEO), 샘 알트만(Sam Altman) 와이콤비네이터(Y-Combinator) 전 대표 등이 지난 2015년 12월 실리콘밸리에 설립한 AI(인공지능) 연구기업이다.GPT-3는 학습을 거쳐 언어를 생성할 수 있게 하는 기계다. GPT-3를 이용해서 뉴스 기사나 시, 소설을 쓸 수 있여러 AI 모델 중에서 자연어 처리(NLP) 모델로 분류된다. 특정 단어가 주어졌을 때 다음 단어가 나올 확률을 계산해 확률 높은 단어를 제시하는 방식으로 작동하는데, 모델의 성능이 뛰어날수록 단어들의 조합과 문장의 적합성이 높아진다.오픈AI는 지난 6월 5일 관련 논문을 발표했는데, 최근 일부 연구자, 개발자들에게 GPT-3의 API(Application Program Interface)를 공개하면서 큰 화제가 됐다. 논문에서 GPT-3가 작성한 기사와 인간이 쓴 기사의 저자를 알아맞히는 비율을 측정했는데, 약 절반 정도의 응답자는 이 기사를 기계가 썼는지 인간이 썼는지 구분하지 못 했다. 샌프란시스코에 본사를 둔 스타트업 창업가 애럼 사베티(Arram Sabeti)는 GPT-3를 테스트 해본 후 “미래를 보는 느낌”이라고 평가하기도 했다. MIT 테크놀로지 리뷰는 20일 “충격적일만큼 훌륭하다”고 치켜세웠다.
박원익 2020.07.21 01:40 PDT