OPENAI - 더밀크

"합법적 LLM 학습 데이터, AI 사업 리스크 줄인다"

지난달 6일 보도된 뉴욕타임즈(NYT) 기사다. NYT는 특히 “오픈AI 직원들이 위법 행위 가능성을 사전에 인지하고 있었지만 AI 학습은 이용 목적에 부합하다고 믿었던 것처럼 보인다"고 보도했다. 실제 미 실리콘밸리 기업들은 막대한 데이터를 학습, AI 서비스에 활용하고 있는 상황. ‘데이터 헝그리'란 말이 나올 정도. 현존 데이터가 부족해서 데이터를 만들어 내는 ‘합성데이터’까지 나오는 상황이다. AI를 학습하기 위해서는 수백, 수 천 억개의 데이터가 필요하기 때문이다. 이 같은 상황에서 ‘정제된' 뉴스 데이터를 합법적으로 AI 플랫폼 기업이 활용하는 사례가 등장 주목을 받고 있다. 세계적으로 드문 사례다. 뉴스, 미디어, 법률 등 다양한 섹터의 고급 지식 데이터를 수집, 제공하고 있는 한국의 비큐AI(BECUAI, 구 비플라이소프트)가 주인공이다. 비큐AI 임경환 CEO는 “데이터의 질과 양은 인공지능의 효율성과 유효성을 결정하는 핵심 요소다. 데이터의 출처와 사용 방법에 대한 윤리적, 법적 문제가 대두되고 있다”며 “특히 실시간으로 업데이트되는 뉴스 데이터는 AI시스템의 학습 과정에 필수적인 자원"이라며 “다만 이를 사용하기 위해서는 적법한 절차를 따라야 한다"고 말했다. 임 대표는 뉴스 데이터의 가치와 데이터를 합법적으로 사용할 수 있는 방안 등에 대한 인사이트를 공유했다. 임 대표의 비큐AI는 최근 비플라이소프트에서 AI 사업을 강화하기 위해 사명을 바꾸고 해외 신사업 등을 준비하고 있다.

권순우 2024.05.12 05:09 PDT

애플과 구글은 뉴IBM... 선도적이고 놀라운 혁신없이 지키기 급급

애플과 구글은 세계에서 가장 가치있는 기업이자 오늘날 실리콘밸리의 혁신 문화를 만든 장본인입니다. 애플은 MP3 플레이어 아이팟이 점유율 90%를 넘으며 시장을 지배할 때 MP3P 시장을 자기잠식할 수 있는 스마트폰 '아이폰'을 내놓고 시장을 뒤흔들고 혁신의 아이콘으로 자리잡았습니다. 구글은 인터넷 검색으로 시작, 모바일 운영체제 '안드로이드'로 시장을 장악하며 디지털 세상을 재정의했습니다. 하지만 2024년들어 애플과 구글이 혁신하기는 커녕 현존 시장을 지키기에 급급한 모습을 보이며 실리콘밸리 내에서도 큰 비판을 받고 있습니다. 무슨 일일까요?

Sejin Kim 2024.05.11 14:16 PDT

🌎 노인을 위한 나라 (Feat. AI 교육)

안녕하세요 뷰스레터 구독자 여러분, 버티컬 뷰스레터, [비저너리(Visionary)]의 김세진입니다."갑자기 왜 그렇게 된거에요?"미국에서 흔히 듣는 질문입니다. 한국의 저출산∙고령화에 관한 질문이었죠. 전세계인들이 한국을 걱정하고 관심을 둡니다. 거의 모든 국가의 지상파 9시뉴스(메인 뉴스)에 등장한 것 같아요. 사실 노인은 귀한 존재였습니다. 100년 전 평균 수명은 약 50세로 지금의 ½ 수준이었습니다. 인터넷도 없고 책을 읽기도 어렵던 농경사회에서, 노인은 농사에서 중요한 계절의 변화나, 당시 가장 두려워했던 자연재해를 방어한 경험이 있었던 유일한 존재였죠. 이때는 경험이 정보이자, 지식이었습니다. 그러나 산업사회-정보화사회로 넘어 가면서 경험은 소비 대상으로 바뀌었습니다. 정보는 데이터로 갈음됐고, 지식은 이 데이터를 아는 사람들이 전달하기 시작했습니다. 테크 업계가 주창하는 ‘정보의 민주화’가 이뤄지면서 노인은 인터넷에 이 데이터베이스(DB) 자리를 내줬습니다.

Sejin Kim 2024.05.10 09:07 PDT

나도 오픈AI 주주 된다... 빅테크급 스타트업 주식 상품 속속 등장

일반인도 오픈AI 주주 될 수 있을까? 비상장 스타트업 투자 환경에 변화가 감지되고 있다. 미국 결제 스타트업 스트라이프는 지난 2월 상장(IPO) 전 지분 거래에서 650억달러의 기업가치를 평가받았다. 그러나 창업 이래 15년 동안 개인이 투자할 방법은 없었다. 오픈AI도 최근 기업가치가 약 800억달러(100조원)로 치솟았지만, 주로 관계사인 마이크로소프트(MS), 엔비디아, 월드코인(WMD) 등에 투자하는 방안이 언급됐었다. 그러자 미국에서는 개인 투자자도 비상장 스타트업 주식을 보유하고 판매할 수 있는 간접투자 시장이 열리고 있다. 민간시장에서 스타트업 지분 투자 플랫폼은 이전에도 존재했지만, 이번에는 공공 시장에서 거래할 수 있는 상품이 나왔다는 점이 특징이다. 스타트업이 공공시장에 상장하기까지 속도가 느려지면서 개인투자자의 권한을 강화하고 일종의 유동성을 부여하려는 움직임으로 보인다. 다만 스타트업 주식의 경우 개인투자자가 정보에 접근하기 어려운 데다 선도계약이라는 구조로 상품이 출시된다는 점 등에서 투자자들의 주의가 요망된다.

Sejin Kim 2024.05.08 09:22 PDT

생성AI, 코파일럿 넘어 '파일럿'... 알아서 움직인다

생성 AI가 출판 업계에도 변화를 불러오고 있습니다. 혁신이 일어나고 있는 분야는 바로 오디오북입니다. 아마존이 지난해 베타 서비스로 내놓은 오디오북 전환 생성 AI 도구가 급진적인 변화를 가져오고 있어 업계가 주목하고 있습니다. 아마존닷컴은 지난해 11월 자사의 출판 플랫폼인 '킨들 다이렉트 퍼블리싱(Kindle Direct Publishing)'에서 작가들이 자신이 출간한 전자책을 생성AI 기술을 활용해 오디오북으로 생성할 수 있는 베타 서비스를 제공했는데요. 작가들은 오디오북으로 전환 가능한 기준을 갖춘 전자책을 선택한 뒤 음성 샘플을 고른 뒤 설정을 통해 오디오북으로 전환할 수 있습니다. 최대 72시간 이내에 실시간으로 변환된 오디오북은 아마존의 오디오북 플랫폼인 오더블(Audible)에서 이를 판매하고, 40%의 로열티를 받게 됩니다. 블룸버그는 "이렇게 '가상 음성' 내레이션을 생성할 수 있는 베타 도구를 발표한 이후 4만 권 이상의 AI 내레이션 책이 오더블에 쏟아져 들어왔다"라고 전했습니다.👉 작가들은 "비용 및 시간 절감"... 내레이터는 "실직 우려" 생성 AI 도구로 가장 혜택을 본 이들은 작가였습니다. 비용과 시간적인 제약 때문에 자신이 세상에 내놓은 전자책을 오디오북으로 쉽게 변환하지 못했는데요. 인공지능이 이를 가능하게 만든 겁니다. 실제로 작가들은 내레이션 비용을 타이틀 당 수백에서 수천 달러 절약할 수 있었다고 하는데요. 한 작가는 작가들의 블로그에서 "책 한 권을 오디오북으로 전환하는데 불과 52분 밖에 걸리지 않았다"라고 언급했습니다. 청취자 입장에서는 AI로 만들어진 오디오북과 실제 내레이터를 통해 만들어진 오디오북을 쉽게 필터링할 수 없다고 불평하기도 하는데요. 오더블 대변인은 블룸버그와의 인터뷰에서 "혁신을 통해 고객이 원하는 것이 무엇인지를 계속 배우고 있다"며 "AI 음성 타이틀은 평균 전체 등급이 4+일 정도로 반응은 좋다"라고 설명했습니다. 일부에서는 내레이터들이 직업을 잃을 수 있다고 우려합니다. 음악계 작곡자들이 AI가 업계에 도입되는 것을 반대하면서 보호 방안을 모색하는 것과 달리, 출판업계에서는 위협에 직면한 기술에 대해 별다른 의지가 없어 보인다고 블룸버그는 분석했는데요. 그리고 음악계의 작가들이 AI가 업계에 도입되는 것을 반대하고 이에 대한 보호책을 모색하는 데 적극적으로 나서는 반면, 오디오북 해설자들은 별다른 의지 없이 기술의 위협에 직면해 있는 것으로 보입니다. 그럼에도 불구하고 출판사, 저자, 그리고 독자 사이에 인공지능을 활용한 오디오북의 범람으로 인해 긴장이 고조되고 있다고 매체는 덧붙였습니다.

권순우 2024.05.08 07:41 PDT

미국 민간이 AI초격차 주도... 2024 AI 핵심 트렌드 7

2024년, 인공지능(AI) 기술은 어디에서 왔고 방향으로 가고 있을까? 지난 2022년에는 생성AI가 대중에게 강력하게 인식됐고, 2023년은 비즈니스 세계에 뿌리내리기 시작했다. 2024년은 연구자들과 기업이 이 기술의 진화를 일상 생활에 가장 실질적으로 통합할 수 있는 방법을 모색하면서 AI의 미래를 위해 나아가는 중추적인 해가 될 것이다.IBM 리서치에 따르면 생성 AI의 진화는 극적으로 빨라지긴 했지만, 컴퓨터 진화와 유사한 양상이다. 중앙에서 운영되는 소수의 대규모 메인프레임 컴퓨터는 기업과 연구 기관에서 사용할 수 있는 더 작고 효율적인 컴퓨터로 대체됐다. 그 후 수십 년 동안 점진적인 발전을 통해 취미로도 사용할 수 있는 가정용 컴퓨터가 탄생했다. 시간이 지나면서 코드가 필요 없는 직관적인 인터페이스를 갖춘 강력한 개인용 컴퓨터가 보편화 됐다. 생성 AI는 더 작은 패키지로 더 큰 성능을 달성하는 것을 목표로 발전하고 있다. 2023년에는 Meta의 대규모 언어 모델(LLM) 제품군인 라마 출시를 시작으로 스테이블LM(StableLM), 펠콘(Falcon), 미스트랄(Mistral), 라마2(Llama 2) 등 오픈 라이선스를 통해 더 효율적인 기반 모델(foundation model)이 폭발적으로 증가했다. 스탠포드 인간 중심 인공지능 연구소(HAI)에서 발간한 AI 보고서, <2024 AI 인덱스 리포트>에서는 이러한 AI 트렌드에 대한 상세한 분석을 제공하고, 책임 있는 인공지능에 대한 장과 과학 및 의학 분야의 인공지능에 대한 새로운 장을 추가했다. R&D, 기술 성과, 경제, 교육, 정책 및 거버넌스, 다양성 및 여론에 대한 일반적인 요약도 포함됐다. 이 리포트는 500페이지나 된다. 핵심을 추려 AI 트렌드 중 의미있는 시그널이 될만한 데이터 7가지를 꼽아봤다.

한연선 2024.05.05 07:25 PDT

AI
EDUTECH

영어학습 앱의 종말? 구글, AI 영어 스피킹 앱 실험 중

인공지능(AI) 기술로 에듀테크의 판도가 더 크게 바뀔 조짐이다. 구글이 생성AI를 도입한 영어학습 앱을 테스트 중이다. 구글이 자사 검색 서비스에 이 기능을 본격 탑재할 경우 영어학습앱에 미치는 영향은 상당할 것으로 보인다. 당연한 질문이 생긴다. 구글이 침투하려는 시장이 과연 영어학습 앱 뿐일까?

Sejin Kim 2024.05.02 00:48 PDT

오픈AI도? 아이폰으로 ‘AI 주도권’ 역전... 애플의 미래는

새로운 LLM ‘센스노바 5.0’ 발표 당일 홍콩 증시에 상장돼 있는 중국 최대 AI 기업 센스타임의 주가는 전날 종가 대비 36% 급등했습니다. GPT-4 터보를 뛰어넘은 벤치마크 점수를 기록했다는 점에 업계는 물론 투자자들의 기대감이 반영된 것입니다. 쉬 리 센스타임 CEO는 “센스노바 5.0의 창의적 글쓰기, 추론 능력은 크게 향상됐다. 동급 최고의 수학, 코딩 추론 기능을 자랑한다”고 강조했습니다.발표 현장에서 공유된 자료, 데이터를 살펴보면 센스노바 5.0의 MMLU(대규모 다중작업 언어 이해) 점수는 오픈AI의 GPT-4 터보, 앤트로픽의 클로드3 오푸스, 최근 공개된 메타의 라마3 70B를 모두 능가했습니다. 수학을 제외한 대부분의 영역에서 가장 높은 점수를 기록한 것으로 전해집니다.

박원익 2024.04.29 16:31 PDT

AI
AGI

AGI 시대 3년내 윤곽... "생성AI로 인간 능력 후퇴 우려"

인간처럼 사고하고 행동할 수도 있는 인공지능(AI), '일반인공지능(AGI)'에 대한 기대와 두려움이 커지는 가운데, AI가 이미 인간의 학습능력을 침범하기 시작했다는 주장이 나왔다. 이때 눈에 띄는 변화는 AI의 추격이 아닌 인간 스스로의 후퇴다. 이장선(학계 활동명: 칼 스트라토스) 럿거스대학교(뉴저지주 주립대) 교수는 AGI 시대에 앞서 인간이 경계해야 할 점으로 ‘생각의 자동화’를 꼽았다. 미국 고등교육 현장에서 이미 이를 피부로 느끼고 있다. 챗GPT 등으로 학교 과제가 무의미해지고, 인간의 학습 능력이 쇠퇴하기 시작했다는 것. 이 교수는 미국 컬럼비아대학교를 거쳐 현재 럿거스 대학교에서 AI 비지도 학습법 및 지식사용모델 개발을 연구하는 미국 내에서도 손꼽히는 AI 전문가다.

Sejin Kim 2024.04.29 14:45 PDT

메타버스 새국면, 메타 OS 개방∙구글의 참전.. 승자는 따로 있다

오래된 미래, 메타버스가 돌아왔다. 확장현실(XR)을 만나면서다. XR은 VR, AR(증강현실), MR(혼합현실), 공간컴퓨팅 등을 아우르는 개념이다.메타버스를 전면에 내세웠던 메타(Meta)는 이제 혼합현실(XR) 전용 헤드셋과 운영체제(OS)로 이를 구현하고 있다. 특히 XR 전용 OS의 이름을 ‘메타 호라이즌OS(Meta Horizon OS)’으로 변경하고, 다른 기업들도 쓸 수 있도록 오픈소스로 전환하면서 시장을 점유하겠다는 야심을 드러냈다. 모바일계의 안드로이드가 되겠다는 구상이다. 실제 애플이 폐쇄적인 생태계로 모바일 앱 시장을 잠식하던 시절 구글 안드로이드는 개방형 전략으로 애플과 양강구도를 형성했다. 지금 MR 전용 OS 시장은 메타 퀘스트와 애플 비전프로 헤드셋을 중심으로 생태계가 형성되고 있다. 이에 질세라 구글도 VR OS를 곧 공개할 것으로 알려지면서 메타버스 구상은 XR을 만나 새로운 국면을 맞았다. 플랫폼 기업의 적극적인 시장 경쟁이 시작되면서 뒤에서 웃는 기업도 있다.

Sejin Kim 2024.04.23 19:47 PDT

TSMC
AI

마이크로소프트가 딥페이크를? ‘소라 모멘트’ 왔다

안녕하세요, 앞서가는 더밀크 구독자 여러분을 위한 프리미엄 리포트 ‘위클리AI브리핑(Weekly AI Briefing)’입니다. 한 주 동안 쏟아지는 AI 뉴스 홍수 속에서 놓치지 않고 꼭 챙겨봐야 할 정보를 선별해 드립니다. 팩트 요약으로 독자분들이 시간을 아낄 수 있도록 돕고 ‘실리콘밸리+실리콘앨리’ 현장에서 빅테크, 유망 스타트업의 움직임을 취재하는 더밀크만의 인사이트를 추가했습니다. 보다 자세한 내용은 더 알아보기 링크로 확인하실 수 있습니다.

박원익 2024.04.23 01:33 PDT

[팩트체크] 라마, 개방형이지만 오픈 소스는 아니다… 왜?

메타 라마3는 오픈 소스일까요? 팩트를 체크해 보면 답은 ‘아니오’에 가깝습니다. “공개적으로 설계에 접근할 수 있어 누구나 해당 기술을 수정하고 공유할 수 있다”는 오픈 소스의 정의에 해당하지 않기 때문입니다. 결정적으로 라마3는 소스 코드가 공개돼 있지 않습니다. 소스 코드가 공개돼 있느냐, AI 모델을 훈련한 데이터가 공개돼 있느냐, AI 모델의 특성 및 성능을 결정하는 가중치(weights)가 공개돼 있느냐 등 세부 항목을 따져서 ‘개방성’ 정도를 평가하는 차트가 등장할 정도로 ‘개방성’은 AI 업계의 중요 이슈가 되고 있습니다.

박원익 2024.04.22 17:06 PDT