퀄컴의 ‘성배’ 생성적 인공지능이 곧 스마트폰에 도입됩니다.

Qualcomm's 'Holy Grail' generative artificial intelligence will soon be introduced to smartphones.

ChatGPT와 Midjourney와 같은 생성적 AI는 상상력을 사로잡고 산업을 혁신시키지만, 그 출시는 대부분 데스크톱 컴퓨터의 브라우저 창으로 제한되어 왔습니다. 내년에는 Qualcomm의 최고급 칩이 탑재된 프리미엄 스마트폰으로 생성적 AI를 이용할 수 있게 될 것입니다.

스마트폰은 사진 보정과 자동 올바르게 쓰기를 개선하기 위해 AI를 여러 년 동안 사용해왔지만, 생성적 AI 도구는 모바일 경험에 다음 수준의 개선을 가져올 수 있습니다. Qualcomm은 생성적 AI를 차세대 프리미엄 칩에 내장하고 있으며, 이 칩은 10월 말 하와이에서 열리는 Qualcomm Summit에서 데뷔할 예정입니다.

Summit 참가자들은 직접적으로 스마트폰에 생성적 AI가 가져올 혜택을 체험할 수 있지만, Qualcomm의 제품 관리 부사장인 Ziad Asghar는 왜 사용자들이 기기 내 AI에 흥미를 가질지에 대해 ENBLE에 설명했습니다. 먼저, 사용자의 데이터에 접근할 수 있다는 것 – 운전 패턴, 음식점 검색, 사진 등 – 이 모두 한 곳에 모여 있으면, 클라우드 기반 생성적 AI의 일반적인 응답보다 훨씬 맞춤화되고 도움이 되는 솔루션이 스마트폰에서 생성될 수 있습니다.

“그것이 진정한 성공이 될 것이라고 생각합니다,” Asghar는 말했습니다. “이 기술이 어디로 발전할 수 있는지에 대해 우리를 정말로 흥분시키는 진정한 약속입니다.”

기기 내 생성적 AI를 사용하는 데는 다른 장점도 있습니다. 가장 중요한 것은 검색된 쿼리와 개인 데이터가 개인 정보로 유지되며 먼 서버를 통해 전달되지 않는다는 점입니다. 로컬 AI를 사용하는 것은 클라우드 계산을 기다리는 것보다 빠르며, 항공기를 이용하거나 셀 서비스가 없는 다른 지역에서도 작동할 수 있습니다.

하지만 기기 내 솔루션은 비즈니스적으로도 효율적입니다. 기계 학습 모델이 점점 복잡해지면서(수십만 개의 매개 변수에서 수십억 개로 증가), 쿼리에 대답하는 서버를 실행하는 데는 더 많은 비용이 듭니다. 지난달에 발표된 Qualcomm의 백서에서 설명한 것처럼, OpenAI는 ChatGPT가 프롬프트에 대답하기 위해 하루에 약 70만 달러를 지출한다고 추정되었으며, 이 비용 예측은 더 복잡하고 유지 비용이 더 많이 들 것으로 예상되는 GPT-4가 아닌 이전의 GPT-3 모델을 기반으로 한 것입니다. Qualcomm의 솔루션은 전체 서버 팜이 필요하지 않고, 기기의 기존 실리콘 브레인이 모든 필요한 사고를 수행할 수 있도록 하는 것입니다 – 추가 비용없이.

“스마트폰에서 AI를 실행하는 것은 사실상 무료입니다 – 사전에 컴퓨팅 파워에 대해 지불했기 때문입니다,” Techsponential 분석가 Avi Greengart는 이메일로 ENBLE에 말했습니다.

Greengart는 Qualcomm이 2월에 Mobile World Congress에서 전시한 Snapdragon 8 Gen 2 기반 안드로이드 폰을 사용하여 이미지 생성 소프트웨어 Stable Diffusion을 실행하는 것을 보았을 때 Qualcomm의 기기 내 생성적 AI가 작동하는 것을 볼 수 있었습니다. 초기 데모임에도 불구하고, 그는 그것을 “매우 흥미로운” 것으로 발견했습니다.

Snapdragon 8 Gen 2 칩셋.

David Lumb/CNET

기기 내 생성적 AI가 제공하는 것

Qualcomm은 스마트폰 기반 생성적 AI로 수행할 수 있는 작업에 대한 아이디어를 가지고 있으며, 생산성 작업부터 엔터테인먼트 시청, 콘텐츠 작성 등 모든 것을 개선할 수 있습니다.

Stable Diffusion 데모에서 볼 수 있듯이, 기기 내 생성적 AI를 사용하면 사람들이 이미지를 명령에 따라 조정할 수 있게 됩니다. 예를 들어, 배경을 변경하여 베니스의 운하 앞에 자신을 배치하도록 요청할 수 있습니다. 또는 완전히 새로운 이미지를 생성하도록 할 수도 있습니다 – 그러나 그것은 시작에 불과합니다. 텍스트와 시각적인 대규모 학습 모델은 아이디어에서 준비된 출력으로 흐르는 연속적인 작업으로 작동할 수 있습니다.

Asghar는 여러 모델을 사용하여 사용자의 음성을 자동 음성 인식으로 번역하고, 그것을 이미지 생성기에 입력하는 것이 가능하다고 말했습니다. 이를 한 단계 더 나아가서 핸드폰이 사람의 얼굴을 렌더링하도록 하고, 생성적 AI를 사용하여 현실적인 입 움직임을 만들고, 텍스트 음성 변환을 통해 사용자에게 다시 말할 수 있게 하면, 생성적 AI 기반의 가상 비서와 대화를 나눌 수 있습니다.

이 특정 예제는 Facebook의 모회사 Meta와 마이크로소프트와의 파트너십을 통해 최근 출시된 대형 언어 모델 Llama 2와 Qualcomm과 같은 타사 AI를 일부 사용할 수 있습니다.

“[Llama 2]는 인공지능 가상 비서, 생산성 애플리케이션, 콘텐츠 생성 도구, 엔터테인먼트 등과 같은 사용 사례를 구축할 수 있게 합니다,” Qualcomm은 당시 언론 발표에서 말했습니다. “Snapdragon으로 구동되는 이러한 새로운 기기 내 AI 경험은 연결이 없는 지역이나 비행기 모드에서도 작동할 수 있습니다.”

Qualcomm 본사의 예약 전용 박물관에서 볼 수 있는 레트로 폰이 가득한 내부

퀄컴은 이러한 기능을 스마트폰에만 제한하지 않을 것입니다. 다가오는 정상회의에서, 회사는 PC 및 자동차에 대한 생성적 AI 솔루션을 발표할 계획입니다. 그 개인 비서는 할 일 목록 작성, 회의 일정 조정 및 이메일 발송에 도움을 줄 수 있습니다. 만약 사무실 외부에 갇혔고 발표를 해야 한다면, Asghar는 AI가 새로운 배경을 생성하여 자동차에 앉아 있는 것처럼 보이지 않게 하고 슬라이드 덱을 보여줄 수 있다고 말했습니다 (심지어 발표에도 도움을 줄 수 있습니다).

“우리 중에서 나이트 라이더를 보면서 자란 사람들에게는, 이제 KITT가 현실이 될 것입니다,” Asghar는 이 TV 프로그램의 상징적인 스마트 카를 언급하며 말했습니다.

플랫폼에 상관없이, 핵심 생성적 AI 솔루션은 장치 내에서 작동할 것입니다. 이는 통화에서 자동으로 메모를 생성하고 주요 포인트를 요약하는 5개의 슬라이드 덱을 생성하는 것과 같은 사무실 업무에도 도움을 줄 수 있습니다 (“이는 Clippy처럼 보이지만 스테로이드가 든 것이다, 맞지?” Asghar가 말했습니다). 또는 AR 및 VR에서 디지털 세계를 완전히 만들어 낼 수도 있습니다.

환상적인 세계 이상으로, 생성적 AI는 시각 장애인들이 현실 세계에서 이동할 수 있도록 도움을 줄 수 있습니다. Asghar는 휴대폰의 카메라를 사용하여 사용자가 교차로에 있는지를 인식하고 언제 멈추어야 하는지, 그리고 어느 방향에서 얼마나 많은 차들이 오는지를 알려주는 상황을 설명했습니다.

교육 분야에서는 웹캠이나 휴대폰의 카메라를 사용하여 생성적 AI가 학생들이 교수 수업을 얼마나 잘 이해하고 있는지 판단할 수 있습니다. 그리고 생성적 AI는 각 학생의 강점과 약점에 맞춰 자료를 맞춤화할 수 있을 것이라고 Asghar는 이론을 제시했습니다.

이 모든 것은 퀄컴의 예측입니다. 하지만 제3자들은 자신들의 제품과 서비스를 개선하기 위해 이 기술을 어떻게 활용할지 결정해야 합니다. 스마트폰의 경우, 생성적 AI는 모바일 앱과 통합되어 보다 맞춤형 게임 경험, 소셜 미디어 및 콘텐츠 생성에 실질적인 영향을 줄 수 있다고 Techsponential의 Greengart는 말했습니다.

앱 제작자들이 앱에 생성적 AI 기술을 직접 적용하고 통합할 수 있을 때까지 사용자들에게 어떤 의미를 가질지는 알기 어렵습니다. 현재 AI가 어떻게 사람들을 도와주는지를 바탕으로 어떤 일을 할 수 있는지 추론하는 것이 더 쉽습니다. Recon Analytics의 분석가인 Roger Entner는 생성적 AI가 현재 존재하는 부족한 사진의 결점을 수정하고, 소셜 미디어를 위한 필터를 생성하며, 자동 교정을 개선하는 데 도움을 줄 것으로 예측합니다.

“여기에서 생성적 AI는 우리가 당연하게 여기게 될 사용성 향상을 만들어냅니다,” Entner는 이메일로 ENBLE에게 말했습니다.

생산 중인 칩을 테스트하기 위해 사용되는 빨간색 퍽 앞에 놓인 Snapdragon 8 Gen 2.

David Lumb / ENBLE

생성적 AI는 먼저 프리미엄 스마트폰에 도입될 것입니다

현재 생성적 AI 솔루션은 대규모 쿼리에 대답하기 위해 큰 서버 팜에 의존하지만, 퀄컴은 장치 내 칩이 단일 사용자의 요구를 처리할 수 있다고 확신하고 있습니다. Asghar의 실험실에서, 회사의 칩은 70억 개의 파라미터를 가진 AI 모델을 처리했습니다 (데이터를 평가하고 출력의 톤이나 정확성을 변경하는 측면). 이는 ChatGPT를 구동하는 OpenAI의 GPT-3 모델의 1750억 개의 파라미터보다 훨씬 작지만, 모바일 검색에 적합할 것입니다.

“우리는 [하와이] 정상회의에서 이 장치에서 실행되는 것을 실제로 보여줄 수 있을 것입니다,” Asghar는 말했습니다.

데모 장치는 아마도 퀄컴의 다음 최상위 칩인 Snapdragon 8 Gen 3를 탑재할 것으로 예상되며, 이 칩은 내년 프리미엄 안드로이드 스마트폰에 사용될 것입니다. MWC 2023에서 Stable Diffusion을 실행하는 데모 장치는 지난 해 하와이의 Snapdragon 정상회의에서 발표된 Snapdragon 8 Gen 2를 사용했습니다.

하루 종일 사용자들의 쿼리를 실행하며도 배터리가 소진되지 않았거나 심지어 뜨거워지지 않은 것을 보면, 하루 종일 생성적 AI를 호출하는 것이 배터리를 더 빨리 방전시킬 것인지에 대한 우려도 있습니다. 기술이 어떻게 구현되고 최적화되는지를 보기 위해 실제 세계 테스트를 기다려야 하지만, Asghar는 MWC 2023 데모 장치가 하루 종일 참가자들의 쿼리를 실행하며 배터리를 소진시키지 않았으며 심지어 손에 닿을 정도로 발열하지 않았다고 지적했습니다. 그는 퀄컴의 실리콘이 독특하게도 대부분 Snapdragon 칩셋의 Hexagon 프로세서와 신경 처리 유닛에서 생성적 AI를 실행하는 능력이 “매우 좋은 전력 소비”라고 믿고 있습니다.

“이 처리를 수행하기 위한 전용 하드웨어가 없는 사람들에게는 우려가 있을 것이라고 생각합니다,” Asghar는 말했습니다.

아스가르는 내년에 출시될 프리미엄 안드로이드 폰들이 퀄컴의 칩으로 구동될 때 생성적 AI를 사용할 수 있을 것이라고 믿고 있습니다. 그러나 저렴한 폰으로 이 기술이 전파되는 데에는 시간이 필요합니다. 현재 폰에서 이미지, 오디오 및 비디오 정리를 위한 AI 지원이 상위 제품군에서 가장 잘 작동하며 저렴한 폰으로 갈수록 효과가 떨어지는 것처럼, 생성적 AI 기능은 퀄컴의 칩 카탈로그에서 아래로 내려갈수록 적지만 (그래도 존재함) 존재할 것입니다.

“프리미엄 제품군에서는 100억 개 이상의 매개변수 모델을 사용할 수 있고, 그 아래의 등급에서는 그보다 적을 수도 있고, 그보다 낮은 등급에서는 그보다 더 적을 수도 있습니다,”라고 아스가르는 말했습니다. “그래서 이러한 경험들은 우아하게 저하되겠지만, 다른 제품들로도 확장될 것입니다.”

5G와 마찬가지로 퀄컴은 생성적 AI와 같은 새로운 기술에서 첫 번째일 수 있지만 마지막은 아닐 것입니다. 애플은 조용히 기기 내 AI를 개선해 왔으며, 소프트웨어 부사장인 크레이그 페더리기는 세계 개발자 회의 후에 AI 자동 교정을 개선하기 위해 더 강력한 변환기 언어 모델을 적용했다고 언급했습니다. 애플은 심지어 내부적으로 “애플 GPT” 챗봇을 테스트한 것으로 알려져 있습니다. 이 기술 기업은 AI 분야에서 경쟁하기 위해 큰 언어 모델을 생성하기 위한 자체 프레임워크를 개발 중이라고 전해졌으며, OpenAI가 2022년 말에 ChatGPT를 공개한 이후로 AI 분야가 가열되었습니다.

이것을 보세요:

애플의 AI는 Google의 Bard AI와 Microsoft의 Bing AI와 경쟁할 수 있으며, 이들은 올해 한정된 범위의 퍼블릭 테스트를 진행했습니다. 이들은 생성적 AI를 향상시키는 “지능형 챗봇” 모델을 따르고 있지만, 앱을 통해 폰에 도착하거나 웹 브라우저를 통해 액세스할 수도 있습니다. Google과 Microsoft는 이미 생성적 AI를 생산성 플랫폼에 통합하고 있으므로 사용자들은 Google 문서 또는 Microsoft Office의 모바일 버전에서 먼저 그들의 노력을 볼 수 있을 것입니다.

하지만 대부분의 폰 소유자들에게는 퀄컴의 칩 기반 생성적 AI가 새로운 기술의 첫 번째 중요한 사용 사례가 될 수 있습니다. 우리의 모바일 경험이 얼마나 다가오는 해에 변화할지는 스냅드래곤 서밋에서 확인해야 할 것입니다.