Cerebras, WSE-3 공개 훈련 모델용 세계 최대 AI 칩 🚀

단일 반도체 웨이퍼 크기 칩의 성능이 2배로 향상되어 수십조의 매개변수를 가진 대형 언어 모델을 효율적으로 처리할 수 있게 되었습니다.

“`html

AI 스타트업 Cerebras가 생산적 AI를 위한 최대 칩 WSE-3을 공개했습니다.

더 크고 더 나은 AI 모델 경쟁이 가열되고 있으며, 주요 경쟁사 Nvidia의 Cerebras Systems가 최신 창조물인 Wafer Scale Engine 3 (WSE-3)를 공개했습니다. 이 3세대 AI 칩은 세계 최대의 반도체로 산업을 혁신할 것으로 예상됩니다.

소개

더 강력한 AI 모델 수요는 칩 기술의 한계를 끌어올리고 있습니다. 분야에서 혁신으로 유명한 Cerebras Systems는 세계 최대의 AI 칩인 WSE-3를 공개했습니다. 이 혁신적인 칩은 AI 모델을 훈련하기 위해 설계되었으며, 뉴럴 가중치를 최적화하여 기능성을 향상시킵니다. 이 기사에서는 WSE-3의 기능, 산업에 미치는 영향, 그리고 미래 전망을 살펴보겠습니다.

강력한 WSE-3

인상적인 성능 향상을 자랑하는 WSE-3은 AI 칩에 새로운 기준을 제시합니다. 명령 처리량이 62.5 페타FLOP에서 놀랍게 125 페타FLOP으로 두 배로 증가하여 이 칩은 진정한 파워를 자랑합니다. 전 증폭소 수는 이전 제품의 2.6조에 비해 4조로 상당한 증가를 기록했습니다. 5나노미터 기술을 사용하여 만들어진 WSE-3은 세계적인 칩 제조업체 중 하나인 TSMC의 제조 전문 기술을 활용합니다.

진정한 무어의 법칙

Cerebras Systems의 공동 창업자이자 CEO인 Andrew Feldman은 WSE-3의 무어의 법칙적 중요성을 강조했습니다. 무어의 법칙은 칩 회로가 대략 18개월마다 두 배로 증가한다는 것을 명시합니다. Feldman은 WSE-3이 동일한 전력 소비량과 가격을 유지하면서 성능을 두 배로 늘렸다고 선언했습니다. 이 진보는 산업에서 오랫동안 기다려온 진전입니다.

크기의 중요성

칩 크기에서, WSE-3은 특히 Nvidia의 H100 GPU와 비교하여 상대적으로 거대합니다. Feldman은 두 제품을 비교하여 전력의 엄청난 차이를 강조했습니다. WSE-3은 Nvidia의 제품보다 57배 크며, 코어 수는 52배 많고, 칩 내 메모리는 800배 많으며, 패브릭 대역폭은 3,700배 이상입니다. 이러한 인상적인 통계는 WSE-3의 탁월한 성능의 기초를 마련했습니다.

완벽한 균형

Cerebras는 WSE-3에서 연산과 메모리 사이의 완벽한 균형을 이룩했습니다. 메모리 내용과 연산 코어 수를 약간 증가시킴으로써, 양측 측면을 최적화한 칩을 만들었습니다. Feldman은 계산과 메모리의 이상적인 동화를 달성했다고 주장하며, AI 훈련을 위한 최상의 성능을 제공합니다.

훈련 시간 규정 재작성

WSE-3은 이론적으로 24조 개의 매개변수를 처리할 수 있는 거대한 계산 능력을 제공합니다. 이는 OpenAI의 GPT-4와 같은 최첨단 생성적 AI 도구보다 10배 가량 더 큰 양입니다. Cerebras의 기계는 단일 장치에서 전체 24조 개의 매개변수 실행이 가능합니다. 반면, GPU는 유사한 결과를 이룩하기 위해 상당히 복잡한 프로그래밍과 훨씬 더 많은 코드 라인이 필요합니다.

Q&A

Q: WSE-3은 크기 측면에서 다른 AI 칩들과 비교했을 때 어떤가요?

A: WSE-3은 가장 큰 AI 칩으로, 경쟁사들을 압도합니다. Nvidia의 H100 GPU와 비교했을 때, 57배 크며 상당히 더 많은 코어, 칩 내 메모리, 그리고 패브릭 대역폭을 제공합니다.

Q: WSE-3의 증가된 연산 및 메모리 능력의 중요성은 무엇인가요?

A: 연산과 메모리 사이의 적절한 균형을 맞춤으로써, WSE-3은 AI 훈련을 위한 최적의 성능을 달성합니다. 이를 통해 모델을 더 빠르고 효율적으로 훈련시킬 수 있습니다.

Q: GPU와 비교하여 WSE-3은 어떻게 프로그래밍을 간소화하나요?

A: Cerebras의 기계는 GPU보다 프로그래밍이 더 쉽습니다. GPU는 복잡한 프로그래밍이 필요하지만, WSE-3은 유사한 결과를 얻기 위해 필요한 코드 라인을 줄여들어 더 접근 가능하고 사용자 친화적입니다.

“““html

Q: WSE-3의 성능은 다른 AI 칩들과 어떻게 비교되나요?

A: WSE-3는 엄청난 성능을 제공하여 125 페타플롭의 명령 처리량을 달성합니다. 이 엄청난 계산 성능은 24조 개의 매개변수를 갖는 대규모 언어 모델을 처리할 수 있도록 하여 이와 경쟁사와의 간극을 벌이고 있습니다.

향상된 추론을 위한 협력

WSE-3의 놀라운 훈련 능력에 더해, Cerebras는 칩 거인 크왈콤과 협력하여 추론 과정을 강화하였습니다. 크왈콤의 AI 100 프로세서를 활용함으로써, Cerebras는 생성적 AI 모델을 운용하는 비용을 줄이기 위해 노력하고 있습니다. 드문드문함, 추측적 디코딩, 그리고 네트워크 아키텍처 검색과 같은 기술을 통해, Cerebras와 크왈콤은 추론 성능을 상당히 개선하였습니다.

미래를 그리며

WSE-3의 등장은 AI 칩 개발의 전환점을 알립니다. 그 뛰어난 성능과 효율성으로, 이 칩은 산업에 새로운 기준을 설정하고 있습니다. AI 모델이 크기와 복잡성을 지속적으로 확장함에 따라, WSE-3과 같은 칩은 분야를 발전시키는 데 중요한 역할을 할 것입니다.

결론

Cerebras의 WSE-3는 더 강력한 AI 모델을 지속적으로 추구하는 증거입니다. 전례 없는 크기, 성능, 그리고 훈련 최적화를 갖춘 이 WSE-3은 업계를 혁신할 준비가 되어 있습니다. 이 칩은 새로운 계산 능력을 제공하여 AI 연구와 개발의 진전을 촉진할 것입니다.

이 기사를 공유하고 아래 댓글에 여러분의 생각을 알려주시기 바랍니다! 💬


참고 자료:

  1. 중국의 생성 비디오 경쟁이 가열되고 있습니다
  2. 마이크로소프트 프로젝트 2021 및 비지오 2021을 30% 할인된 가격으로 구입하세요
  3. AI 방화벽이 새 비즈니스 응용 프로그램을 안전하게 보호할 것입니다
  4. AlphaTheta(이전의 파이오니어 DJ 코프)가 최초의 무선 DJ 컨트롤러와 스피커를 출시합니다
  5. 중국의 문샷 AI가 25억 달러의 시장 평가를 기록하며 LLM 중심의 장기 컨텍스트에 10억 달러를 조달합니다
  6. AI 선구자 Cerebras가 하이브리드 AI 컴퓨팅에서 “몬스터 연도”를 보내고 있습니다
  7. airfocus가 프로젝트 관리 소프트웨어를 경쟁하는데 7500만 달러를 확보했습니다
  8. 새로운 종류의 칩으로 GenAI를 더 효율적으로 만들기

“`