Meta는 Llama 2의 코딩 버전을 방금 출시했습니다.

Meta released the coding version of Llama 2.

지난 달 Meta가 ChatGPT 뒤에 있는 것과 유사한 강력한 인공 지능 모델인 Llama 2를 출시함으로써 개발자, 스타트업 및 연구원들이 거의 1년 동안 세계를 열광시킨 AI와 같은 AI를 다뤄볼 수 있게 되었습니다.

오늘, Meta는 프로그래밍 작업에 튜닝된 버전인 Code Llama의 출시로 이어갑니다. 이 출시는 AI 보조 코딩을 할 수 있는 개발자들이 더 많이 생겨날 수 있음을 의미할 수 있습니다. 또한 소프트웨어에 AI를 포함시키는 새로운 방법을 영감을 줄 수 있으며, “오픈” AI 도구의 선도적인 공급 업체인 Meta를 더욱 확립시킬 수 있습니다.

“그들이 가중치를 커뮤니티에 공개하는 것은 흥미롭습니다.”라고 AI 코딩을 연구한 Stanford의 박사 후 연구원인 Deepak Kumar가 말합니다. 이는 모델의 핵심인 신경망의 매개변수를 의미합니다.

Kumar는 Meta의 일반 언어 모델인 Llama 2의 출시로 행동 방식 및 수정 방법에 대해 토론하는 커뮤니티의 형성을 가져왔다고 말합니다. “이는 Google이나 OpenAI의 폐쇄된 소스 모델과 비교하여 무슨 일이 벌어지고 있는지에 대해 더 자유롭게 실험할 수 있는 유연성을 제공합니다.”라고 그는 덧붙입니다.

Kumar는 Code Llama를 사용하여 새로운 종류의 응용 프로그램을 개발하는 개발자들이 있을 것이라고 말합니다. 예를 들어, 코드 조각을 추천하기 전에 다양한 추가적인 안전 검사를 수행하는 프로그래밍 어시스턴트를 만들 수도 있다고 Kumar는 말합니다. 그는 자신의 연구에서 AI 지원이 때로는 덜 안전한 코드로 이어질 수 있다는 것을 탐구했습니다. Kumar는 출시가 특정 유형의 코딩에 특화된 어시스턴트의 창조를 영감을 줄 수도 있다고 덧붙입니다. “모델 위에 다양한 도구를 구축할 수 있습니다.”라고 그는 말합니다.

프로그래밍은 최근 AI의 발전이 이미 상당한 영향을 미친 하나의 영역입니다.

2021년 5월, Microsoft의 자회사인 GitHub은 사용자가 입력한 첫 번째 줄 또는 주석을 기반으로 코드 일부를 자동으로 완성하는 코딩 프로그램 플러그인인 Copilot을 출시했습니다. Copilot은 ChatGPT 뒤에 있는 Open AI의 GPT의 버전을 사용합니다. 이 모델은 개발자용으로 저장된 코드뿐만 아니라, 보고서에 따르면, 자신의 코드를 주석으로 추가하는 도급업자들에 의해 추가로 훈련됩니다.

GitHub는 훈련 데이터에 오픈 소스 코드를 사용한 것으로 소송을 당하고 있으며, Masad는 Meta가 이러한 문제를 피하기 위해 훈련 데이터를 제한했을 것으로 예상합니다. Copilot은 개인당 월 10달러, 기업당 사용자당 월 19달러입니다.

Copilot은 개발자들에게 큰 인기를 끌었습니다. 6월에 GitHub에서 발표한 숫자에 따르면, Copilot은 100만 명 이상의 개발자와 20만 명 이상의 기업에서 사용됩니다. 회사의 자체 연구도 코딩 작업을 수행하는 속도를 가속화하여 생산성을 30% 증가시키는 것을 보여줍니다.

Meta는 Code Llama의 두 가지 버전을 출시하며, 하나는 파이썬 코드 생성을 위한 것이고, 다른 하나는 자연 언어 명령을 코드로 변환하기 위한 것입니다. 또한 세 가지 크기의 모델을 사용할 수 있습니다. 가장 작은 모델은 단일 GPU에서 실행될 수 있습니다.

Meta는 Code Llama이 공공 도메인의 코드로 훈련되었다고 말합니다. 두 가지 일반적인 코딩 벤치마크인 HumanEval과 Mostly Basic Python Problems에서 기존의 오픈 소스 코딩 모델보다 훨씬 우수한 성능을 발휘하며, “ChatGPT와 비슷한 수준”이라고 회사는 말합니다.

여러 생성적 AI 도구를 제공하는 온라인 코딩 플랫폼인 Replit의 CEO인 Amjad Masad는 Code Llama가 더 제한된 훈련 데이터로 인해 Copilot을 대체하지 않을 것으로 예상합니다. 그러나 그는 이러한 출시로 개발자들이 정보를 검색하거나 API를 사용하여 항공편을 예약하거나 식사를 주문하는 등 유용한 작업을 수행하는 에이전트를 실험할 수 있게 될 수 있다고 말합니다. “그것은 정말 흥미로운 분야라고 생각합니다.”라고 Masad는 말합니다. “자연 언어 명령을 입력하고, 모델이 데이터를 처리하여 세상에서 흥미로운 일을 할 수 있는 상호작용.”

Code Llama의 출시는 Meta에게 이익을 제공할 수도 있습니다. Meta는 ChatGPT나 AI 기반 검색 엔진을 보유하고 있지 않을 수 있지만, 많은 개발자, 기업 및 연구원들에게 무료 AI 공급자가 되는 것은 생성적 AI를 활용하기 위한 경쟁에서 발판을 마련해줄 수 있습니다. Meta는 5월에 Llama의 초기 버전이 웹에 유출되는 것을 보고 오픈 접근 방식을 채택하기로 결정했습니다.

라마 2와 코드 라마 모두 보통의 오픈 소스 소프트웨어 라이선스로는 상업적 사용에 제약이 따르지 않습니다. 예를 들어, Meta의 라이선스에 따르면, 사용자들은 월 7억 명 이상의 사용자를 가진 앱이나 서비스에서 모델을 사용하는 것이 제한됩니다.

이번 달에 온라인에 게시된 연구 논문은 AI 도구를 공개하는 것이, 예를 들어 연구자들을 해당 도구에 얽매이게 함으로써 회사에 상당한 간접적 이익을 제공하며, 대규모로 활용할 수 있는 새로운 아이디어를 제공한다는 점을 언급합니다.