오픈 소스는 사실 인공지능의 유모입니다. 이것이 그 이유입니다.

오픈 소스는 사실 인공지능의 어머니 역할을 합니다. 이유는 다음과 같습니다.

keep-ai-open-source-smaller-may-2023

어떤 면에서 오픈 소스와 인공지능은 함께 태어났습니다.

1971년에 만약 대부분의 사람들에게 인공지능에 대해 언급했다면, 그들은 아이작 아시모프의 로봇의 세 가지 법칙을 떠올렸을 것입니다. 하지만, 인공지능은 이미 MIT에서 진행 중이던 실질적인 주제였으며, 그해에 Richard M. Stallman (RMS)이 MIT의 인공지능 연구소에 합류했습니다.

특별 기능

zd-del2

생성적 인공지능과 엔지니어링의 교차점

생성적 인공지능의 급증은 엔지니어링 분야에서 엄청난 잠재력을 활용할 수 있습니다. 또한 기업과 엔지니어들은 인공지능이 역할, 비즈니스 전략, 데이터, 솔루션 및 제품 개발에 미치는 영향을 파악하는 과정에서 도전을 겪고 있습니다. 생성적 인공지능을 소프트웨어 세계로 가져오기 위한 미래 로드맵은 어떻게 보일까요? 엔블은 다각도의 해석을 제공합니다.

지금 읽기

수십 년 후, 프로그램의 상용 소스가 등장하면서 RMS는 자유 소프트웨어라는 뿌리깊은 아이디어를 개발했습니다. 몇십 년 후에는 이 개념이 오픈 소스로 변모하여 현대 인공지능의 탄생지가 되었습니다.

과학 소설 작가가 아닌 컴퓨터 과학자인 Alan Turing이 현대 인공지능 운동을 시작했습니다. 1950년 터링의 논문 “Computing Machine and Intelligence“은 터링 테스트의 기원을 제시했습니다. 이 테스트는 간단히 말해, 기계가 사람과 대화하는 것처럼 속이면 그것은 지능적이라고 주장합니다.

일부 사람들에 따르면, 오늘날의 인공지능은 이미 이를 수행할 수 있다고 합니다. 저는 동의하지 않지만, 우리는 분명히 그 방향으로 나아가고 있습니다.

또한: 최고의 인공지능 챗봇: ChatGPT와 대안들

1960년, 컴퓨터 과학자인 John McCarthy은 “인공지능”이라는 용어를 만들었으며, 그 과정에서 Lisp 언어를 개발했습니다. McCarthy의 업적은 컴퓨터 과학자인 Paul Graham이 “did for programming something like what Euclid did for geometry. 소프트웨어에 대한 유클리드가 기하학에 대한 것처럼 프로그래밍에 대한 것을 한 것처럼 해주었습니다.”라고 표현한 대로, 간단한 연산자와 함수에 대한 표기법만 주어진다면 전체 프로그래밍 언어를 구축할 수 있다는 것을 보여주었습니다.

데이터와 코드가 혼합된 Lisp는 인공지능의 최초 언어였으며, RMS에게도 첫 번째 프로그래밍 사랑이 되었습니다.

그래서 왜 우리는 이미 1980년대에 GNU-ChatGPT를 보유하지 못했을까요? 이에 대한 여러 가설이 있습니다. 제 선호도는 초기의 인공지능이 올바른 아이디어를 잘못된 시대에 가지고 있었다는 것입니다. 하드웨어가 요구 사항을 충족하지 못했습니다. 기타 핵심적인 요소들 – 예를 들어 빅 데이터 – 이런 종류의 데이터를 저장하고 처리하기 위한 도구들이 아직 이용 가능하지 않았습니다. 아파치 하둡, 스파크, 카산드라와 같은 오픈 소스 프로젝트는 인공지능과 머신 러닝이 대규모 데이터를 클러스터의 기계들에서 저장하고 처리하는 데 필요한 도구를 제공했습니다. 이러한 데이터와 빠른 액세스 없이는 대형 언어 모델(LLM)이 작동하지 않을 수밖에 없었습니다.

또한: 내가 가장 좋아하는 ChatGPT Plus 플러그인 두 가지와 그것으로 할 수 있는 놀라운 것들

오늘날, 오픈 소스 기반의 인공지능은 오픈 소스에 호의적이지 않은 Bill Gates조차도 1980년에 그래픽 사용자 인터페이스(GUI) 개념을 소개받는 것 이후로 가장 큰 일이라고 인정하고 있습니다. 이 GUI 아이디어에서 Gates는 Windows라는 작은 프로그램을 만들었을 것입니다.

특히, 오늘은 매우 인기 있는 AI 생성 모델인 ChatGPT 및 Llama 2와 같은 모델들이 오픈 소스로부터 파생되었습니다. ChatGPT, Llama 2 또는 DALL-E이 오픈 소스인 것은 아닙니다. 사실 그들은 아닙니다.

나는 그들이 그렇게 되기를 바랬지만, 초기 OpenAI 투자자 중 한 명인 Elon Musk는 다음과 같이 말했습니다: “OpenAI는 처음에 오픈 소스로 만들어졌습니다 (그래서 나는 그것을 “Open” AI라고 이름 지었습니다) 도구로서 Google에 반대하기 위해 설립된 비영리 회사이지만 현재는 Microsoft에 통제되는 폐쇄 소스의 수익을 극대화시키는 회사가 되었습니다. 나의 의도와는 전혀 다른 결과입니다.”

또한: 시도해볼 최고의 AI 이미지 생성기

그럼에도 불구하고, OpenAI 및 다른 생성 모델 AI 프로그램들은 오픈 소스 기반 위에서 구축되었습니다. 특히, Hugging Face의 Transformer은 오늘날의 머신 러닝 (ML) 모델을 구축하기 위한 최고의 오픈 소스 라이브러리입니다. 재미있는 이름이지만, 이 라이브러리는 사전 학습된 모델, 구조 및 자연 언어 처리 작업에 대한 도구를 제공합니다. 이를 통해 개발자들은 기존 모델을 기반으로 새로운 모델을 구축하고 특정 사용 사례에 대해 세밀하게 조정할 수 있습니다. 특히, ChatGPT는 GPT LLM을 위해 Hugging Face의 라이브러리를 사용합니다. Transformer가 없다면 ChatGPT도 없습니다.

또한, Google과 Facebook이 개발한 TensorFlow와 PyTorch는 ChatGPT를 지원하는 데 중요한 도구 및 라이브러리를 제공합니다. 이러한 Python 프레임워크는 딥 러닝 모델을 구축하고 학습하기 위한 필수 도구를 제공합니다. 말할 필요도 없이, 다른 오픈 소스 AI/ML 프로그램들도 그 위에 구축되었습니다. 예를 들어, 심층 학습에 대한 배경 지식이 없는 개발자들이 신경망을 구축하는 데 자주 사용되는 고수준의 TensorFlow API인 Keras가 있습니다.

또한: 자체 AI 챗봇을 만들고 싶나요? 오픈 소스 허깅쳇에 인사해보세요

AI 프로그래머들은 어떤 것이 더 좋은지에 대해 논쟁할 수 있습니다 – 그리고 그렇게도 합니다 – 하지만 TensorFlow와 PyTorch는 여러 프로젝트에서 사용됩니다. 당신이 좋아하는 AI 챗봇 뒷면에는 다양한 오픈 소스 프로젝트의 조합이 있습니다.

일부 최상위 프로그램들, 예를 들어 Meta의 Llama-2는 자체가 오픈 소스라고 주장합니다. 하지만 사실은 그렇지 않습니다. 많은 오픈 소스 프로그래머들이 Llama를 선호하는 이유는 대규모 AI 프로그램 중 하나로서 가장 오픈 소스 친화적인 기능을 제공하기 때문입니다. 그러나 Llama-2는 오픈 소스가 아닙니다. 맞습니다, 다운로드 및 사용이 가능하지만 라이선싱에는 한 가지 작은 문제가 있습니다: “전월에 7억 명 이상의 활성 사용자를 보유한 경우, Meta에게 라이선스를 요청해야하며 이러한 권리를 Meta가 별도로 명시적으로 부여하지 않는 한 이 계약의 권리를 행사할 수 없습니다.”

Llama를 기반으로 Virtual Girl/Boy Friend를 작성하여 억만장자가 될 꿈을 포기하세요. 마크 저커버그는 여러분이 그를 몇 억 달러 더 부자로 만들어준 것에 감사할 겁니다.

또한: AI는 스트리밍과 매우 유사합니다. 부가 기능이 빠르게 더해집니다

지금은 진정한 오픈 소스 LLM들도 존재합니다 – 예를 들어 Falcon180B와 같은 모델. 그러나 대부분의 상용 LLM들은 제대로 된 오픈 소스가 아닙니다. 그럼에도 불구하고, 모든 주요 LLM들은 오픈 데이터로 훈련되었습니다. 예를 들어, GPT-4와 대부분의 큰 LLM은 웹에서 크롤링한 페타바이트 규모의 데이터가 포함된 텍스트 아카이브인 CommonCrawl에서 일부 데이터를 가져옵니다. Facebook에서 Facebook의 생일 소원, Linux에 대한 Reddit 댓글, Archives.org에서 책을 쓴 경우 – HTML로 작성되었다면, 어디선가 데이터가 있을 것입니다.

그래서, 오픈 소스는 인공지능 비즈니스에서 언제나 절대 후보로만 남겨지고 결코 주인의 자리에 앉을 수 없는 운명일까요? 그렇게 빠르게 결론을 내릴 순 없습니다.

구글 내부 문서 유출에서 구글 AI 엔지니어는 “불편한 진실은, 우리는 이 [생성적 AI] 경쟁에서 이길 준비가 되어 있지 않으며, OpenAI도 마찬가지입니다. 우리가 다투고 있는 동안 제3의 진영이 우리의 점심을 가만히 먹어 간다는 사실이 불편합니다.”라고 썼습니다.

그 제3의 선수는 누구일까요? 바로 오픈 소스 커뮤니티입니다.

사실, 생성적 AI에서 유용한 답변을 얻기 위해서는 초대형 클라우드나 수천 개의 고급 GPU가 필요하지 않습니다. 실제로, LLMs를 스마트폰에서 실행할 수도 있습니다. 사람들은 Pixel 6에서 기초 모델을 실행시키며 5 LLM 토큰을 1초에 처리하고 있습니다. 또한 저녁에는 노트북에서 개인화된 AI를 세밀하게 조정할 수 있습니다. “소비자용 하드웨어에서 몇 시간 만에 언어 모델을 개인화할 수 있다면,” 엔지니어는 주장했습니다. “큰 문제입니다.” 그렇게 틀림없습니다.

또한: 생성적 AI의 윤리: 이 강력한 기술을 어떻게 이용할 수 있을까요

Hugging Face의 오픈 소스 low-rank adaptation (LoRA)와 같은 세밀한 조정 메커니즘 덕분에 다른 방법들보다 저렴하고 빠르게 모델을 세밀하게 조정할 수 있습니다. 얼마나 저렴한가요? “소비자용 하드웨어에서 몇 시간 만에 언어 모델을 개인화할 수 있다고 생각하면 어떨까요?”라는 엔지니어의 말대로 말이죠.

구글 개발자는 다음을 덧붙였습니다:

“LoRA가 다른 조정 방법과 마찬가지로 효과적인 이유 중 하나는, 이 방식이 쌓을 수 있다는 겁니다. 지침 조정과 같은 개선 사항은 대화나 추론, 또는 도구 사용과 같은 다른 기여자들이 추가하면서 적용되고 활용될 수 있습니다. 개별적인 세밀한 조정은 저차원이지만, 모델의 전체적인 조정은 그렇지 않아도 됩니다. 이는 새롭고 더 나은 데이터셋과 작업들이 제공되는 경우에도 모델을 저렴하게 최신 상태로 유지할 수 있게 해줍니다. 이는 전체 실행 비용을 지불하지 않고도 모델을 지속적으로 업데이트하는 것을 의미합니다.”

우리의 신비한 프로그래머는 결론적으로 “오픈 소스와 직접 대항하는 것은 지는 제안입니다…. 우리는 따라잡을 수 있을 것이라고 기대해서는 안 됩니다. 현대 인터넷은 오픈 소스에서 동작하도록 되어 있기 때문에 오픈 소스에는 어떤 무시할 수 없는 장점들이 있습니다.”라고 말했습니다.

또한: <a href=”/?s=ChatGPT 확장: AI 챗봇 플러그인이 정말 게임을 바꿀 수 있을까요?</a>

30년 전에는 누구도 오픈 소스 운영 체제가 Unix와 Windows 같은 자체 소유 시스템을 대체할 수 있을 거라고 상상하지 못했습니다. 아마도 우리가 오늘날 사용하는 준사유적 프로그램들을 압도할 수 있는 진정한 오픈 소스 AI 프로그램에는 30년 이상 걸리지 않을지도 모릅니다.