Meta가 첫 번째 맞춤형 AI 칩을 공개합니다.
Meta unveils first customized AI chip.
페이스북, WhatsApp 및 Instagram 소유인 Meta는 목요일에 인공지능 프로그램을 처리하는 데 특별히 맞춤화된 첫 번째 제작용 컴퓨터 칩인 Meta Training and Inference Accelerator(MTIA)를 공개했습니다.
이 칩은 병렬로 작동하는 회로 블록들의 그리드로 구성되어 있으며, Meta의 PyTorch 오픈 소스 개발자 프레임워크를 사용하여 프로그램을 최적화하는 소프트웨어를 실행합니다.
또한: 깊은 학습이란 무엇인가요? 알아야 할 모든 것
Meta는 이 칩을 깊은 학습 추천 모델이라고 설명합니다. 이는 소셜 네트워크에서 게시물을 클릭하는 등의 활동 패턴을 보고 사용자에게 추천할 만한 관련성이 있는 자료를 예측할 수 있는 프로그램입니다.
- Meta의 Data2vec 2.0 두 번째 시도는 더 빠릅니다
- 메타의 대규모 다국어 번역 작업은 여전히 그리스어, 아르메니아어, 오...
- 아마존의 알렉사 과학자들은 더 큰 인공지능이 항상 더 좋은 것은 아니...
이 칩은 Meta가 “칩의 가족”이라고 지칭하는 것 중 첫 번째 버전이며, 2020년에 시작되었다고 밝혔습니다. 앞으로의 칩 모델이 언제 출시될지에 대한 세부 정보는 제공되지 않았습니다.
Meta는 기존에 지배적인 Nvidia의 표준 GPU 칩 외에도 AI에 대한 자체 칩을 개발한 거대 기술 회사들을 따라갑니다. 지난 몇 년 동안 Microsoft, Google 및 Amazon은 AI 프로그램의 다양한 측면을 처리하기 위해 여러 개의 맞춤형 칩을 공개했습니다.
또한: Nvidia, Dell 및 Qualcomm이 최신 벤치마크 테스트에서 AI 결과 속도를 높이다
Meta의 발표는 Meta의 컴퓨팅 능력을 인공지능에 대해 강화하는 방법에 대해 몇 명의 Meta 임원이 폭넓게 발표한 일환입니다.
MTIA 칩 외에도, 회사는 “차세대 데이터 센터”를 설명했으며, 이 데이터 센터는 “AI에 최적화된 디자인으로, 수 천 개의 AI 칩을 연결하는 고성능 AI 네트워크와 액체 냉각 AI 하드웨어를 지원할 것입니다.”
또한: ChatGPT와 새로운 AI가 사이버 보안에 대한 혼란을 일으키고 있습니다
Meta는 또한 Facebook 사용자가 업로드하고 보는 데 효율적으로 비디오를 압축 및 해제하고 여러 가지 다른 형식으로 인코딩하는 사용자 정의 비디오 인코딩 칩인 Meta Scalable Video Processor를 공개했습니다. Meta는 MSVP 칩이 “1-in, 5-out 스트림과 최고 품질 구성에서 최대 4K 15fps의 피크 전환 성능을 제공하고, 표준 품질 구성에서 4K 60fps까지 확장 가능하다”고 설명했습니다.
Meta는 Nvidia GPU나 Intel의 CPU에 의존하는 대신, “미래의 AI 관련 사용 사례를 고려하여 컴퓨팅 파워와 효율성 측면에서 특화된 하드웨어가 최상의 솔루션이라고 믿습니다.”라고 말했습니다. 회사는 사람들이 Facebook에서 비디오를 시청하는 시간의 절반 이상을 보내며, 하루에 40억 개의 비디오 조회가 있다고 언급했습니다.
또한: AI 이후 개발자를 만나보세요: 더 창의적이고 비즈니스 중심적인
Meta는 여러 해 동안 칩 개발에 대한 단서를 제공해왔습니다. 예를 들어, Meta의 주요 AI 과학자인 얀 르쿤이 2019년 ENBLE에서 이에 대해 인터뷰를 받았을 때입니다. 다른 회사들이 칩을 공개하고 Cerebras Systems, Graphcore 및 SambaNova Systems와 같은 스타트업이 AI에 초점을 맞춘 독특한 칩으로 Nvidia에 도전함에도 불구하고, Meta는 그 노력의 세부 정보를 유지하면서 조용했습니다.
MTIA는 스타트업의 칩과 유사한 측면이 있습니다. 이 칩의 핵심은 8×8 그리드로 배열된 64개의 프로세서 요소로 구성된 메쉬로, 데이터가 최고 속도로 요소를 통과할 수 있는 “시스톨릭 어레이”라는 것을 채택한 AI 칩의 많은 디자인과 유사합니다.
MTIA 칩은 인공지능 프로그램의 두 가지 주요 단계인 훈련과 추론을 모두 처리하기 위해 구성된 것이 약간 독특합니다. 훈련은 AI 프로그램의 신경망이 예상대로 작동할 때까지 처음으로 다듬어지는 단계입니다. 추론은 사용자 요청에 대한 예측을 위해 신경망을 실제로 사용하는 단계입니다. 일반적으로 두 단계는 컴퓨터 처리 측면에서 매우 다른 요구사항을 가지고 있으며, 서로 다른 칩 디자인으로 처리됩니다.
또한: 이 새로운 기술은 GPT-4와 비슷한 모든 것을 능가할 수 있을 것입니다.
MTIA 칩은 에너지 소비 당 초당 부동 소수점 연산의 수에 있어서 GPU보다 최대 3배 더 효율적일 수 있다고 Meta는 말했습니다. 그러나 더 복잡한 신경망을 처리할 때는 GPU에 뒤처지게 되며, Meta는 칩의 향후 버전에서 복잡한 작업을 처리하기 위해 더 많은 작업이 필요하다고 언급했습니다.
Meta의 엔지니어들이 목요일 발표한 프레젠테이션은 MTIA가 하드웨어-소프트웨어 “공동 설계”의 혜택을 받는다고 강조했습니다. 여기서 하드웨어 엔지니어들은 회사의 PyTorch 개발자들과 지속적인 대화를 통해 아이디어를 교환합니다.
PyTorch 또는 C++에서 칩에서 실행할 코드를 작성하는 것 외에도, 개발자들은 KNYFE라는 칩을 위해 개발된 전용 언어로 작성할 수 있습니다. KNYFE 언어는 “ML 연산자에 대한 짧고 고수준의 설명을 입력으로 받아, 이 연산자의 MTIA에 대한 최적화된 저수준 C++ 커널 코드를 생성합니다,”라고 Meta는 말했습니다.
또한: Nvidia는 챗봇이 환각을 일으키는 것을 방지할 수 있다고 주장합니다.
Meta는 Meta가 개척한 Open Compute Project를 기반으로 서버 컴퓨터에 여러 개의 MTIA 칩을 통합하는 방법에 대해 논의했습니다.
MTIA에 대한 자세한 내용은 Meta의 블로그 게시물에서 제공됩니다.
Meta의 엔지니어들은 6월에 플로리다 주 오블랜도에서 개최되는 국제 컴퓨터 아키텍처 심포지엄에서 “MTIA: Meta의 추천 시스템을 대상으로 한 첫 번째 세대 실리콘”이라는 제목의 논문을 발표할 예정입니다.