ChatGPT가 첫 선을 보인 지 벌써 1년이 넘었습니다. 초기에는 자연어 이해와 생성 능력으로 우리 모두를 놀라게 했죠. 하지만 AI 혁신의 꾸준한 진전으로 오픈AI만이 모든 주목을 받을 수는 없게 되었습니다. 구글의 바드 출시부터 최첨단 신모델 제미나이의 발표, 앤트로픽과 같은 새로운 경쟁자들의 등장, 그리고 메타의 LLaMA에 의해 촉진된 강력한 오픈소스 운동에 이르기까지, 오픈AI는 AI 분야에서 선두를 유지하고 싶다면 빠르게 움직여야 할 것입니다.

오늘날 우리는 또 다른 기술적 이정표의 시작에 서 있습니다. 기술 커뮤니티 내에서의 상상과 추측에 주로 기반한 GPT-5에 대한 기대가 커지고 있죠. 이 글은 GPT-4와 같은 선대 모델들과 AI 분야의 주요 발전 경로에서 아이디어를 얻어 GPT-5로부터 우리가 기대할 수 있는 것에 대해 조명하려 합니다.

여기서 논의된 대부분은 예측에 기반을 두고 있어, 아직 매우 흥미롭지만 불확실한 미래의 그림을 그리고 있습니다. 그럼 GPT-5가 과연 어떤 진실을 품고 있는지 함께 파헤쳐 볼까요?


GPT5란?

Generative Pre-trained Transformer, 즉 GPT는 오픈AI가 개발한 대규모 언어 모델 시리즈로, ML과 AI 분야에 상당한 영향을 미쳤습니다. GPT는 본질적으로 입력받은 내용을 바탕으로 인간과 같은 텍스트를 이해하고 생성하도록 설계되었습니다. 이 모델들은 방대한 데이터셋으로 훈련되었으며, GPT 모델 시리즈는 LLM 기반 응용 프로그램을 대중화하는 데 기여하며 자연어 처리, 생성 등에서 가능한 것의 새로운 기준을 설정했습니다.

지금까지의 GPT 모델의 역사는 아래와 같습니다.

GPT-1
2018년, 오픈AI는 GPT-1을 통해 생성 전처리 개념을 소개하며 자연어 이해를 개선하기 위한 변환 아키텍처를 사용했습니다. 이 모델은 "Improving Language Understanding by Generative Pre-Training"이라는 논문에 자세히 설명되어 있으며, 개념 증명으로 제공되었고 공개적으로는 출시되지 않았습니다.

GPT-2
1년 후, 오픈AI는 텍스트 생성에서 상당한 개선을 보여주는 GPT-2를 출시했습니다. GPT-2는 짧은 텍스트 패시지를 생성할 수 있었으며, 그 전임자보다 주목할만한 발전을 이루었습니다. 더 넓은 실험을 위해 공개적으로 사용할 수 있었습니다.

GPT-3
2020년 GPT-3의 출시로 오픈AI는 모델을 대폭 확장하여 GPT-2보다 100배 더 많은 매개변수를 자랑했습니다. 이 확장은 GPT-3가 훨씬 더 길고 일관된 텍스트를 생성하게 하여 다양한 작업에서 인상적인 성능을 보여주었습니다. ChatGPT의 도입, 즉 GPT-3.5 시리즈 내의 대화 중심 반복은 모델이 인간과 같은 텍스트를 생성할 수 있는 놀라운 능력을 보여주었으며, 단 두 달 만에 1억 명의 사용자를 달성하는 등 빠르게 채택되었습니다.

GPT-4
시리즈의 최신 반복인 GPT-4는 그 전임자들에 의해 도입된 능력을 더욱 정제합니다. 더 큰 데이터셋과 더 많은 매개변수를 사용하여 GPT-4는 GPT-3의 자연어 이해 및 생성 능력을 개선합니다. 이는 연장된 패시지에서 일관된, 문맥상 관련된 텍스트를 생성하는 성능을 향상시키고 복잡한 대화 시나리오에서 더 나은 이해를 보여줍니다.

GPT-4의 발전에는 문맥의 더 세밀한 이해, 개선된 사실성, 편향적이거나 해로운 콘텐츠 생성 감소가 포함됩니다. 그 채택은 고급 대화 에이전트부터 정교한 콘텐츠 생성 도구에 이르기까지 다양한 응용 프로그램에 걸쳐 있으며, AI 주도 자연어 처리 기술의 지속적인 발전을 강조합니다.

2023년 11월, 오픈AI는 Vision이 업데이트된 GPT-4 Turbo를 공개했습니다.

GPT-5
따라서, GPT-5는 아마도 Generative Pre-trained Transformer의 다음 버전을 대표할 것입니다.

잠재적인 다음 반복에 대한 정보는 거의 없지만, GPT-4가 그 전임자들, 특히 논리적 추론 능력에서 상당한 개선을 보여준 것을 알고 있습니다. 2023년 4월 이후의 사건을 인지하지 못함에도 불구하고, GPT-4는 여전히 더 넓은 일반 지식 베이스와 우리 세계에 대한 더 깊은 이해를 자랑합니다. 그러므로, 지금까지 모든 것이 GPT-5가 같은 추세를 따르고 현재 GPT-4 모델을 개선할 것임을 시사합니다.

GPT5 출시일은 언제?

2024년 1월 샘 알트먼과 빌 게이츠의 토론에서, 게이츠는 GPT-5 작업이 시작되었다는 확인을 받았지만, 출시 날짜에 대한 단서는 주어지지 않았습니다.

GPT-4와 함께 일어난 일을 고려해 보면, GPT-5의 출시가 어떻게 될지 예측해 볼 수 있습니다. ChatGPT 이후 몇 달 만에 OpeanAI가 GPT-4를 출시했음에도 불구하고, GPT-4의 개발 주기, 훈련 단계, 개발 및 테스팅을 포함하여 2년 이상 걸렸습니다.

따라서, GPT-5가 비슷한 일정을 따른다면, 그 출시는 2025년 말까지 이어질 수 있습니다. 이 새로운 출시가 멀게 느껴질 수 있지만, 이것이 반드시 오픈AI가 GPT-4를 계속 개선하지 않을 것이라는 의미는 아닙니다.

오픈AI는 GPT-4를 계속 개선할 가능성이 높으며, 우리는 이미 GPT-3.5와 마찬가지로 중간 업데이트인 GPT-4.5의 도입을 볼 수 있습니다.

 

다른 기사에서는 2024년 3월 기준 GPT5를 시연 중이라고 하고 있고, 올해 안에 선보일 수도 있다고 합니다.

 

GPT5의 성능은 어떨까?

GPT-5의 출시가 아마도 1년 또는 2년 후일 것임을 고려할 때, 그 발전에 대한 대부분의 예측은 구글 및 오픈소스 AI 이니셔티브에 의해 형성된 현재의 추세에 기반을 두고 있습니다. 이러한 발전은 우리에게 산업의 미래 방향에 대한 귀중한 통찰력을 제공합니다.

그러나 오픈AI 핵심 팀에서 직접 나오는 몇 가지 첫 번째 단서가 있습니다. 게이츠의 인터뷰 중 알트먼은 오픈AI의 노력이 추론 능력 향상과 비디오 처리 기능 통합에 집중될 것임을 강조했습니다.

그럼 이 모든 것을 조금 정리해 보고 GPT-5에서 예상되는 몇 가지 주요 개선 사항에 대해 논의해 봅시다.

매개변수 크기
GPT-4의 정확한 매개변수 크기는 여전히 비밀에 부쳐져 있지만, 더 복잡하고 능력 있는 모델을 향한 지속적인 추세가 있습니다. 대부분의 출처는 그 숫자가 약 1.5조 매개변수일 것이라고 가리킵니다.

이 추세가 계속된다면, GPT-5는 현재 LLM의 한계를 재정의할 수 있으며, 전례 없는 크기를 제공할 수 있습니다.


다중 모달성
기존의 GPT-4 모델이 이미 음성 및 이미지 기능을 지원하고 있으므로, 비디오 처리 통합은 GPT-5에 대한 자연스러운 진전으로 보입니다. 우리는 이미 구글이 자사의 제미나이 모델에서 이 기능을 실험하기 시작한 것을 보았으므로, 경쟁이 오픈AI를 혁신으로 밀어붙일 때까지 시간 문제일 뿐입니다.

따라서, GPT-5는 현재 GPT-4의 다중 모달 기능을 개선하고 비디오 통합과 같은 새로운 기능을 추가하여, 우리가 AI와 상호 작용하는 방식에 결정적인 변화를 가져올 수 있습니다. 이는 더 자연스럽고 다양한 형태의 커뮤니케이션을 가능하게 합니다.

챗봇에서 에이전트로
챗봇에서 완전 자율적 에이전트로의 전환은 또 다른 흥미로운 전선입니다. GPT 기반 앱에 사소한 작업이나 일을 맡길 수 있다면 어떨까요? 이것은 실제로 오픈AI가 제3자 서비스를 계속 통합함에 따라 현실이 될 수 있습니다. 우리는 이미 커스텀 GPT의 도입을 보았으며, 이는 계속 발전할 가능성이 높습니다.

이 새로운 기능은 GPT-5가 다양한 서비스에 연결하고 사용자를 대신하여 세상에서 작업을 수행할 수 있게 해줄 것입니다. 예를 들어, 우리 자신의 식단 선호도에 기반하여 우리의 장보기를 자동 에이전트에게 맡길 수 있습니다.

더 나은 정확도
각 반복마다 GPT 모델의 정확도가 향상되어, 맥락을 더 신뢰할 수 있게 이해하고 적절한 응답을 생성하게 만들었습니다. GPT 모델의 다음 세대는 그 훈련 데이터셋 크기와 다양성을 증가시킬 것을 의미합니다.

현재 GPT-4 모델은 전임자 GPT-3보다 40% 더 나은 성능을 보이므로, GPT-5는 이 추세를 계속 이어가 오류를 줄이고 상호 작용의 충실도를 향상시킬 것으로 예상됩니다.

더 많은 텍스트 생성량
현재 모델의 한계 중 하나는 응답을 생성하기 위해 고려할 수 있는 텍스트 생성량입니다. GPT-5가 더 많은 데이터로 훈련될 것으로 예상되므로, 더 많은 텍스트 생성량을 가질 것으로 예상되며, 이는 더 일관되고 문맥상 관련된 출력을 가능하게 할 것입니다.

오픈AI API의 비용 효율적 사용
새로운 모델이 등장함에 따라, 우리는 또한 오픈AI API 사용 비용의 감소를 기대할 수 있으며, 이는 GPT-4와 GPT-3.5와 같은 기술을 더 접근하기 쉽게 만들 것입니다. GPT-5의 출시는 GPT-4가 더 접근하기 쉽고 저렴하게 사용될 수 있음을 의미할 수 있습니다.

이러한 접근은 혁신의 물결을 촉발할 수 있으며, 더 넓은 범위의 개발자와 조직이 고급 AI를 자신의 응용 프로그램에 통합할 수 있게 할 것입니다.

더 저렴하고 접근하기 쉬워지면, GPT 모델은 코딩이나 연구와 같은 복잡한 작업을 수행하는 데 더 능숙해질 수 있습니다. 아직 오픈AI의 API를 시도해 보지 않았다면, DataCamp의 오픈AI API 가이드를 따라 해보는 것을 강력히 추천합니다.

 

결론

우리가 GPT-5에 대한 구체적인 세부 사항을 간절히 기다리는 동안, 현재의 논의가 역사적 사실, AI 일반 추세, 그리고 오픈AI 팀이 공유하는 몇 가지 작은 단서에 기반한 추측과 순수한 예측에 뿌리를 두고 있다는 것을 기억하는 것이 중요합니다.

역사는 우리에게 GPT-5의 도착 전에 GPT-4.5와 같은 점진적 업데이트를 볼 수 있다고 제안합니다.

타임라인에 관계없이, GPT 시리즈의 진화는 상상력을 사로잡고, 우리가 그것의 응용을 상상할 수 있는 한도 내에서만 AI의 잠재력이 제한될 미래를 약속합니다.

일론 머스크가 이끄는 AI 스타트업 X.ai는 최근 그들의 새로운 생성 AI 모델인 Grok-1.5를 공개했습니다. 이 모델은 조만간 소셜 네트워크 X의 Grok 챗봇을 구동할 예정이며, 현재 공개된 벤치마크 결과와 사양을 기준으로 할 때, 이전 모델인 Grok-1에 비해 상당한 업그레이드가 이루어진 것으로 보입니다.

Grok-1.5의 주요 개선 사항

  • 향상된 추론 능력: 특히 코딩 및 수학 관련 작업에서 눈에 띄는 개선이 있었습니다. Grok-1.5는 인기 있는 수학 벤치마크인 MATH에서 Grok-1의 점수를 두 배 이상 향상시켰으며, 프로그래밍 언어 생성 및 문제 해결 능력을 평가하는 HumanEval 테스트에서도 10% 이상 높은 점수를 얻었습니다.
  • 컨텍스트 이해력의 증가: Grok-1.5는 최대 128,000개의 토큰을 처리할 수 있으며, 이는 Grok-1에 비해 상당히 늘어난 수치입니다. 이로 인해 모델은 훨씬 긴 문서에서 정보를 활용할 수 있고, 더 길고 복잡한 프롬프트를 처리하면서도 지시사항을 따를 수 있습니다.

Grok 모델의 독특한 특징

  • 제한된 주제에 대한 반응: X.ai의 Grok 모델은 다른 생성 AI 모델들이 일반적으로 다루지 않는 음모론이나 논란이 되는 정치적 아이디어에 대해 응답합니다. 또한, 요청에 따라 "반항적인 기질"을 가진 답변을 하거나 심지어 무례한 언어를 사용하기도 합니다.

Grok-1.5의 새로운 기능과 미래 계획

  • 초기 테스터를 위한 출시: Grok-1.5는 곧 X의 초기 테스터들에게 공개될 예정이며, 여러 새로운 기능이 함께 제공될 것입니다. 일론 머스크는 스레드와 답글을 요약하고, 게시물에 대한 컨텐츠를 제안하는 기능에 대해 암시한 바 있습니다.
  • 더 많은 사용자들에게의 접근성 확대: 최근 X.ai는 Grok-1을 오픈소스화했으며, X의 프리미엄 플랜 사용자들에게 Grok 챗봇에 대한 접근 권한을 확대할 계획입니다. 이는 월 8달러의 프리미엄 플랜 사용자들뿐만 아니라, 월 16달러의 프리미엄+ 플랜 사용자들에게도 해당됩니다.

Grok-1.5의 출시는 AI 기술의 발전과 사용자 경험의 향상을 위한 X.ai의 지속적인 노력을 보여줍니다. 업그레이드된 모델이 실제 사용 환경에서 어떤 성과를 보일지, 그리고 이 모델이 AI 분야에 어떤 새로운 가능성을 열어줄지 기대됩니다.

 

 아마존이 앤트로픽에 대한 40억 달러 규모의 투자를 마무리하면서, 전 세계의 다양한 규모와 산업을 가진 고객들이 아마존 베드락(Amazon Bedrock)에서 클로드(Claude)를 사용하여 사용자 경험을 재상상하고, 사업을 재창조하며, 생성적 AI 여정을 가속화하고 있습니다.

 

 앤트로픽과 아마존이 함께 세계적으로 가장 진보된 생성적 인공지능 기술을 고객에게 제공하기 위한 작업은 이제 막 시작되었습니다. 전략적 협업 계약의 일환으로, 앤트로픽은 안전 연구와 미래의 기초 모델 개발을 포함한 핵심적인 작업 부하에 대해 아마존 웹 서비스(AWS)를 주요 클라우드 제공업체로 사용한다고 발표했습니다.

 

앤트로픽은 AWS의 트레이니움(Trainium)과 인페런티아(Inferentia) 칩을 사용하여 미래 모델을 구축, 훈련 및 배포하며, 전 세계 AWS 고객에게 아마존 베드락에서 앤트로픽의 미래 세대 기초 모델에 대한 접근을 장기적으로 제공하기로 약속했습니다.

 

앤트로픽과 아마존의 협력으로 AI 혁신 가속화

이번 달 초, 우리는 아마존 베드락에서 가장 강력한 앤트로픽 AI 모델에 대한 접근을 발표했습니다. 클로드 3 가족 모델은 고급 지능, 거의 인간 수준의 반응성, 개선된 조종성 및 정확성, 그리고 새로운 시각 능력을 보여줍니다. 업계 벤치마크에 따르면, 가장 지능적인 모델인 클로드 3 오퍼스는 이성, 수학, 코딩 분야에서 오늘날 사용 가능한 다른 모델들을 포함하여 오픈AI의 GPT-4를 능가하는 새로운 표준을 설정했습니다.

 

아마존 베드락을 통한 다양한 산업의 AI 활용 사례

전 세계의 다양한 규모와 거의 모든 산업에 걸쳐 있는 글로벌 조직들이 이미 아마존 베드락을 사용하여 앤트로픽의 클로드 AI를 사용하여 생성적 AI 애플리케이션을 구축하고 있습니다. 이에는 델타 에어라인, KT, 화이자 등이 포함됩니다.

 

 

책임감 있는 AI 도입을 위한 협업 강화

AWS, 앤트로픽, 액센츄어는 특히 의료, 공공 부문, 은행, 보험과 같은 고도로 규제된 산업에서 생성적 AI 솔루션을 책임감 있게 도입하고 확장하는 데 도움이 되는 조직들을 지원하기 위해 협력하고 있습니다. 이 협력을 통해, 조직들은 앤트로픽의 최고 수준의 모델, 아마존 베드락에서만 사용할 수 있는 광범위한 기능 세트, 그리고 액센츄어, 앤트로픽, AWS의 업계 전문 지식을 활용하여 특정 사용 사례에 맞춤화된 생성적 AI 애플리케이션을 구축하고 확장할 수 있게 됩니다.

 

앤트로픽에 대한 아마존의 투자 업데이트

생성적 AI의 발전에 대한 우리의 약속을 심화시키기 위해, 우리는 앤트로픽에 최대 40억 달러를 투자하기로 한 발표에 대한 업데이트를 가지고 있습니다. 지난 9월, 우리는 12억 5천만 달러의 초기 투자를 진행했습니다. 오늘, 우리는 추가로 27억 5천만 달러를 투자하여 앤트로픽에 대한 총 투자액을 40억 달러로 끌어올렸습니다.

 
 
 
 

 

X 플랫폼의 새 전략: 그록 챗봇 확대 제공

엘론 머스크의 최신 발표에 따르면, 그의 회사 xAI는 곧 그록(Grok) 챗봇을 더 많은 프리미엄 구독자들에게 제공할 예정입니다. 이번 주부터 프리미엄+, 즉 상위 구독 티어에만 제공되던 그록이 이제는 프리미엄 구독자들에게도 제공됩니다.

 

경쟁과 구독자 수 증가 목표

이번 움직임은 OpenAI의 ChatGPT나 앤트로픽의 클로드3와 같은 인기 있는 챗봇과의 직접적인 경쟁을 원한다는 신호일 수 있습니다. 하지만, 동시에 X가 구독자 수를 늘리려는 의도도 있을 것으로 보입니다. 특히, 최근 센서 타워(Sensor Tower)의 데이터에 따르면 X 사용자 수가 감소하고 있으며, 이는 머스크의 인수 이후 더욱 두드러졌습니다.

 

광고주 이탈과 수익성 문제

머스크의 광고주에 대한 전쟁은 회사의 수익성에도 영향을 미쳤습니다. 센서 타워의 조사에 따르면, 2022년 10월 기준 X 플랫폼의 상위 100대 미국 광고주 중 75곳이 더 이상 광고 예산을 지출하지 않고 있습니다.

 

AI 챗봇의 잠재력

그록 챗봇을 제공함으로써 X는 사용자들이 다른 플랫폼으로 이탈하는 것을 막을 수 있습니다. 머스크는 그록이 다른 AI 챗봇에서는 금지된 주제에 대해서도 응답할 수 있으며, "반항적인 기질"로 대답할 것이라고 설명했습니다. 또한, 그록은 경쟁사가 제공할 수 없는 실시간 X 데이터에 접근할 수 있는 능력을 가지고 있습니다.

 

프리미엄 구독 옵션과 가격

X 프리미엄은 웹에서 월 $8 또는 연 $84의 가격으로 시작하는 중간 티어 구독입니다. 이전에는 그록이 프리미엄+ 구독자들에게만 제공되었으며, 이는 월 $16 또는 연 $168의 비용이 들었습니다.

결론

엘론 머스크의 이번 결정은 X 플랫폼의 사용자 기반을 유지하고 확장하기 위한 전략적인 움직임입니다. AI 챗봇, 특히 그록과 같은 고급 기능을 제공함으로써, X는 기존 사용자를 유지하고 새로운 구독자를 유치하는 데 성공할 수 있을지 지켜볼 일입니다.

 

'AI 기사' 카테고리의 다른 글

업그레이드된 X.AI의 챗봇, 그록 Grok-1.5 곧 출시 예정  (0) 2024.04.06
아마존, GPT4 보다 우수한 클로드3 개발사 앤트로픽에 40억 달러 투자  (0) 2024.03.31
그림 AI '30배' 빨라진다. DALL·E3, 스테이블 디퓨전에 적용 가능  (0) 2024.03.28
AI 시대 필수요소. '더 많은 OO'. 최고의 AI사들이 투자하는 이곳  (0) 2024.03.26
코딩까지 AI로? 개발자 "망했다." 코그니션의 '데빈' 소개  (0) 2024.03.25

 

인공지능과 기계학습의 새로운 도약: 분포 일치 증류(DMD)

최근 몇 년 동안 인공지능과 기계학습은 엄청난 발전을 이루었습니다. 한때 과학 소설처럼 여겨졌던 것들이 이제는 현실이 되었으며, 언어를 이해하고 이미지를 생성할 수 있는 지능형 시스템이 등장했습니다. 하지만 항상 높은 품질과 복잡한 모델을 요구하는 대가로 엄청난 계산력과 시간이 필요했습니다. MIT의 연구팀이 분포 일치 증류(DMD)라는 혁신적인 새 기술로 이 문제를 해결했을 수 있습니다.

기존 이미지 생성기의 문제점

Stable Diffusion과 DALL-E와 같은 기존 AI 이미지 생성기는 놀라운 능력으로 세상을 놀라게 했습니다. 그러나 뒤에서는 각 이미지를 생성하기 위해 복잡하고 반복적인 과정이 필요했습니다. 전통적인 확산 모델은 노이즈로 시작하여 점차 더 많은 구조를 추가하며, 각 단계에서 이미지를 더 세밀하게 다듬어 나갑니다. 이 과정은 단일 고해상도 이미지를 생성하는 데 수백 단계가 필요할 수 있습니다.

 

분포 일치 증류 소개(DMD)

MIT CSAIL의 연구자들이 분포 일치 증류(DMD)라는 완전히 새로운 접근법을 소개했습니다. 이 방법은 생성 과정을 단일 단계로 단순화하면서 이미지 품질을 유지하거나 심지어 향상시킵니다.

 

학생 모델 훈련

DMD의 핵심 통찰력은 더 복잡한 "교사" 확산 모델의 행동을 모방하도록 단순한 "학생" 모델을 훈련시키는 것입니다. 이는 교사의 지식이 학생에게 전달되는 "증류" 과정을 통해 이루어집니다.

 

분포 발산 최소화

학생을 훈련시키기 위해 DMD는 두 가지 주요 손실을 사용합니다. 첫째, 회귀 손실은 훈련 중 이미지 공간의 기본 조직을 보장합니다. 둘째, 분포 일치 손실은 생성된 이미지의 확률이 교사 모델에 의해 학습된 실제 세계 빈도와 일치하도록 보장합니다.

30배 빠른 생성

반복적인 세밀화 과정을 우회함으로써, 이미지는 이제 훈련된 학생 모델을 통해 단일 전달로 생성될 수 있습니다. 실험에서 DMD는 기준 확산 모델보다 30배 더 빠른 생성 속도를 달성했으며, 비교할 수 있는 이미지 품질을 유지했습니다.

 

DMD의 테스트

DMD의 효과를 평가하기 위해 연구자들은 표준 이미지 생성 벤치마크에서 상위 확산 모델과 광범위한 비교를 수행했습니다.

 

무한한 응용분야

분포 일치 증류는 생성 품질과 속도 사이의 절충이 더 이상 필요 없음을 증명하는 주요 돌파구를 나타냅니다. 이는 끝없는 응용 분야를 가집니다:

DMD는 인공지능 시스템이 계속해서 발전함에 따라 우리가 아직 상상조차 못한 완전히 새로운 응용 프로그램 분야를 위한 길을 열어주고 있습니다. 이는 더 빠르고 고품질의 AI 이미지 생성의 도래를 알리며, 앞으로 수년 동안 혁신을 주도할 것입니다.

'AI 기사' 카테고리의 다른 글

아마존, GPT4 보다 우수한 클로드3 개발사 앤트로픽에 40억 달러 투자  (0) 2024.03.31
일론 머스크 xAI 챗봇 '그록'. 챗GPT, 클로드 의식했나? 프리미엄 구독자에게도 개방  (0) 2024.03.28
AI 시대 필수요소. '더 많은 OO'. 최고의 AI사들이 투자하는 이곳  (0) 2024.03.26
코딩까지 AI로? 개발자 "망했다." 코그니션의 '데빈' 소개  (0) 2024.03.25
클로드 3: 인공지능 경쟁의 새로운 경쟁자, 그 성능과 가격 분석  (0) 2024.03.24

 

실리콘밸리의 혁신 기업들과 억만장자 투자자들이 지속 가능한 미래를 위한 핵심 해법으로 핵 에너지에 대한 관심을 높여가고 있습니다. 최근에는 인공지능(AI)의 발전이라는 새로운 동력을 얻으며, 이 분야에 대한 투자 열기가 더욱 뜨거워지고 있습니다.


AI의 환경적 대가와 핵 에너지의 역할


AI 기술은 매혹적인 속도로 발전을 거듭하고 있지만, 그 과정에서 발생하는 환경적 비용 역시 만만치 않습니다. 특히, AI에 필요한 대량의 에너지 소비가 온실가스 배출량 증가로 이어지며, 이는 핵 에너지가 해결해야 할 시급한 과제로 떠올랐습니다.

AI Now Institute의 관리 이사인 Sarah Myers West는 "대규모 언어 모델 같은 AI 기술이 표준 검색 엔진에 비해 환경에 미치는 영향이 5배 높다"고 지적했습니다. 또한, 일부 AI 서버는 연간 85테라와트시가 넘는 전력을 소비할 것으로 예상되는데, 이는 일부 국가의 연간 에너지 사용량을 초과하는 수준입니다.

실리콘밸리의 대표적인 핵 에너지 투자 사례로는, OpenAI의 CEO인 샘 알트만이 지원하는 오클로와 같은 핵 스타트업이 있습니다. 알트만은 AI와 핵 에너지를 "풍요로운 미래를 위한 필수적인 조합"이라고 강조했습니다. 실제로 그는 핵융합 스타트업인 Helion Energy에 거액을 투자하며, 지능과 에너지를 현대 사회의 두 가지 핵심 자원으로 꼽았습니다.


핵 에너지 분야 규제와 도전


하지만, 핵 에너지 분야의 발전은 엄격한 규제와 안전 문제로 인해 느린 편입니다. 오클로는 데이터 센터와 산업 시설에 전력을 공급하기 위한 소규모 핵 파워하우스 건설을 계획 중이지만, 규제 기관의 승인을 얻는 것이 큰 도전으로 다가오고 있습니다.

미국이 전기차 도입과 탈탄소화를 추진함에 따라, 오클로의 공동 창립자인 Jacob DeWitte는 "이러한 변화 과정에서 필요한 에너지의 양이 엄청나며, 난방과 요리를 전기화하기 위해 더 많은 에너지가 필요하다"고 말했습니다.

 

핵 에너지 산업에서 혁신을 도모하는 오클로社는 기술적 진보보다 규제 승인 과정에서 더 큰 장애물에 직면해 왔습니다. 특히, 2022년에는 연방 핵규제위원회(NRC)가 아이다호주에 위치한 "오로라" 파워하우스 프로젝트의 설계 신청을 거부한 사례가 이를 증명합니다. NRC는 오클로가 제공한 안전 관련 정보가 충분치 않다는 이유를 들어 이 같은 결정을 내렸습니다. 또한, 지난 10월에는 미 공군이 알래스카 기지에 전력을 공급할 목적으로 계획된 마이크로리액터 파일럿 프로그램에 대한 계약 의향서를 철회하기도 했습니다.

 

오클로의 최고경영자인 DeWitte는 이러한 상황에 대해 "새로운 물리학의 적용, 새로운 모델의 사용 등 NRC가 익숙하지 않은 다양한 과제에 직면해 있다"고 설명하며, 현재 회사가 규제 기관의 기준을 충족시키기 위한 노력을 기울이고 있음을 밝혔습니다.

 

이러한 상황은 핵 에너지 분야에서의 혁신이 기술적인 문제뿐만 아니라 규제적인 어려움을 어떻게 극복해야 하는지에 대한 중요한 사례로 남게 되었습니다. 오클로와 같은 기업들이 직면한 도전은 핵 에너지의 미래를 모색하는 과정에서 반드시 넘어서야 할 관문으로, 규제 기관과의 긴밀한 협력과 이해의 폭을 넓히는 노력이 더욱 요구되고 있습니다.

'AI 기사' 카테고리의 다른 글

일론 머스크 xAI 챗봇 '그록'. 챗GPT, 클로드 의식했나? 프리미엄 구독자에게도 개방  (0) 2024.03.28
그림 AI '30배' 빨라진다. DALL·E3, 스테이블 디퓨전에 적용 가능  (0) 2024.03.28
코딩까지 AI로? 개발자 "망했다." 코그니션의 '데빈' 소개  (0) 2024.03.25
클로드 3: 인공지능 경쟁의 새로운 경쟁자, 그 성능과 가격 분석  (0) 2024.03.24
앤스로픽, '클로드 3' 출시 GPT, 제미나이보다 월등함 인증  (0) 2024.03.24

 

인공지능(AI)과 소프트웨어 개발의 급속한 진화 속에서, 혁신적인 발표가 코그니션, 첨단 AI 스타트업으로부터 이루어졌습니다. 피터 틸의 파운더스 펀드 및 기술 산업의 주요 인물들, 예를 들어 전 트위터 집행 임원 엘라드 길과 도어대시 공동 창립자 토니 쉬의 지원을 받는 코그니션이 “데빈”이라는 완전 자율적인 AI 소프트웨어 엔지니어를 소개했습니다. 이 혁신적인 AI는 AI 보조 개발의 기준을 재정의하며, 기존 코딩 보조 도구의 기능을 크게 뛰어넘는 포괄적인 프로젝트 관리 능력을 제공할 것으로 예상됩니다.

데빈이란?

데빈은 무엇이 특별한가?

기존 코딩 보조 도구와 달리, 데빈은 프로젝트의 시작부터 코드 작성, 관련 버그의 식별 및 수정, 최종 실행에 이르기까지 전체 개발 프로젝트를 관리하는 독특한 능력을 자랑합니다. 데빈의 기능은 전통적인 AI 조종사를 넘어서서 엔지니어들에게 실제 AI 작업자를 제공합니다.

아직은 사용 불가!

현재 데빈은 공개되지 않았으나, 선택된 고객 그룹에게 테스트 및 피드백을 위해 접근성을 제공하고 있습니다. 이들 중 하나는 데빈을 사용한 첫손 경험을 공유한 블룸버그 기자 애슐리 밴스입니다.

데빈은 어디까지 가능한가?

"코딩 거의 모든 것이 가능하다."

데빈은 앱 배포, 웹사이트 개선, 버그 수정부터 대형 언어 모델의 설정 및 미세 조정에 이르기까지 다양한 개발 작업을 처리할 수 있는 것으로 자리매김합니다. 새로운 기술을 학습하고 적응하는 능력은 그것이 단독 개발자로서의 다양성과 잠재력을 더욱 강조합니다.

데빈은 무엇으로 작동하는가?

데빈을 지원하는 핵심 기술은 공개되지 않았지만, 코그니션이 장기적 사고와 계획에서의 진보를 활용해 이러한 놀라운 기능을 달성했다는 것은 분명합니다. 이는 다양한 분야에 대한 이러한 기술의 잠재적 응용 가능성에 대한 호기심과 기대를 불러일으킵니다.

소프트웨어 개발 X AI = ?!

소프트웨어 엔지니어링의 새로운 패러다임

데빈은 소프트웨어 개발과 컴퓨터 관련 작업이 접근될 수 있는 방식에서 패러다임 전환을 나타냅니다. 데빈과 같은 AI 작업자가 중요한 작업을 맡음으로써, 인간 엔지니어는 더 창의적이고 지적으로 요구되는 작업에 집중할 수 있어, 빠른 혁신과 생산성 향상을 이끌 수 있습니다.

코딩분야를 넘보는 데빈

코그니션은 AI 기능을 코딩을 넘어 다양한 전문적 작업에 활용할 가능성을 시사합니다. 이 넓은 비전은 다양한 산업과 분야에 변혁적인 영향을 미칠 수 있는 것을 나타냅니다.

결론

코그니션에 의한 데빈의 출시는 AI와 소프트웨어 개발의 교차점에서 중요한 이정표입니다. 완전한 개발 프로젝트를 처리할 수 있는 완전 자율적인 AI를 제공함으로써, 데빈은 AI 보조 작업에서 가능한 것의 새로운 기준을 설정합니다. 코그니션이 데빈의 기능을 확장하고 더 넓은 접근성을 제공함에 따라, 기술 산업은 이 혁신이 소프트웨어 엔지니어링과 그 너머의 풍경을 어떻게 재편할지 주목하고 있습니다.

 

'AI 기사' 카테고리의 다른 글

그림 AI '30배' 빨라진다. DALL·E3, 스테이블 디퓨전에 적용 가능  (0) 2024.03.28
AI 시대 필수요소. '더 많은 OO'. 최고의 AI사들이 투자하는 이곳  (0) 2024.03.26
클로드 3: 인공지능 경쟁의 새로운 경쟁자, 그 성능과 가격 분석  (0) 2024.03.24
앤스로픽, '클로드 3' 출시 GPT, 제미나이보다 월등함 인증  (0) 2024.03.24
일론 머스크의 xAI가 자사의 LLM 그록-1을 오픈 소스로 공개  (0) 2024.03.24

 

올해의 AI 군비 경쟁은 멈출 기미가 보이지 않는 가운데, 인류학 분야의 최신 대형 언어 모델(LLM)인 클로드 3가 시장에 출시되며 큰 관심을 받고 있습니다. 아티스틱의 새로운 프리미엄 AI 모델 클로드 3 오퍼스, 접근성 높은 클로드 3 소네트, 그리고 빠른 속도의 클로드 3 하이쿠까지, 클로드 3의 다양한 버전이 어떤 특징과 성능을 보이는지, 그리고 경쟁 모델인 GPT-4와의 비교를 통해 그 가치와 가능성을 탐구합니다.

클로드 3의 등장 배경과 기대
클로드 3는 인공지능 스타트업 휴머니틱이 아마존의 지원을 받아 40억 달러의 예산으로 개발한 최신 대형 언어 모델(LLM)입니다. 이 모델은 안전하고 책임 있는 방식으로 AI 기술을 개발하려는 회사의 목표 아래, 주주들과 대중에게 이익을 제공하고자 하는 목적으로 탄생했습니다. 클로드 3의 세 가지 버전인 오퍼스, 소네트, 하이쿠는 각각 다른 사용자층을 타깃으로 하며, 특히 오퍼스는 GPT-4를 능가하는 성능을 자랑합니다.

클로드 3 모델별 특징 및 성능 비교
클로드 3 오퍼스는 프리미엄 사용자를 위한 모델로, 뛰어난 추론 능력과 대학원 수준의 테스트에서 높은 점수를 얻었습니다. 클로드 3 소네트는 더 넓은 사용자층에게 접근성을 제공하는 모델로, 여전히 우수한 성능을 자랑합니다. 마지막으로 클로드 3 하이쿠는 속도를 중시하는 기업용 모델로, 거의 즉각적인 반응 속도를 제공합니다.

가격 정책 및 사용 방법
클로드 3 오퍼스의 가격은 월 20달러로, 사용량에 따라 추가 비용이 발생합니다. 반면, 클로드 3 소네트는 일부 무료 사용이 가능하며, 기업 사용자를 위한 클로드 3 하이쿠는 매우 저렴한 토큰 가격을 제공합니다. 사용자는 인류학 웹사이트를 통해 쉽게 클로드 3를 시도하고 경험할 수 있습니다.

클로드 3 vs GPT-4: 첫인상
아티스틱은 클로드 3와 GPT-4 및 기타 경쟁 모델과의 성능 비교를 통해 클로드 3의 우수성을 주장하고 있습니다. 하지만 이러한 비교는 아직 초기 단계이며, 사용자와 전문가들의 광범위한 테스트를 통해 더 명확한 평가가 이루어질 것입니다.



3줄 요약

1. 클로드 3는 아티스틱이 개발한 새로운 LLM으로, 프리미엄 오퍼스, 소네트, 기업용 하이쿠 등 다양한 버전으로 출시되어 AI 군비 경쟁에 새로운 바람을 일으키고 있습니다.
2. 각 버전은 사용자의 다양한 요구를 충족시키기 위해 설계되었으며, 특히 오퍼스는 GPT-4를 능가하는 성능을 자랑합니다.
3. 클로드 3의 사용과 가격 정책은 사용자 친화적이며, 인류학 웹사이트를 통해 쉽게 접근할 수 있습니다, 이로써 AI 기술의 민주화에 기여할 전망입니다.

'AI 기사' 카테고리의 다른 글

그림 AI '30배' 빨라진다. DALL·E3, 스테이블 디퓨전에 적용 가능  (0) 2024.03.28
AI 시대 필수요소. '더 많은 OO'. 최고의 AI사들이 투자하는 이곳  (0) 2024.03.26
코딩까지 AI로? 개발자 "망했다." 코그니션의 '데빈' 소개  (0) 2024.03.25
앤스로픽, '클로드 3' 출시 GPT, 제미나이보다 월등함 인증  (0) 2024.03.24
일론 머스크의 xAI가 자사의 LLM 그록-1을 오픈 소스로 공개  (0) 2024.03.24

앤스로픽은 지능형 클래스에서 가장 빠르고 가장 저렴한 인공지능 모델인 클로드 3 하이쿠를 출시했다. 최첨단 비전 능력과 업계 벤치마크에서 강력한 성능을 자랑하는 하이쿠는 광범위한 엔터프라이즈 애플리케이션을 위한 다용도 솔루션으로 선전되고 있다.

이 모델은 현재 클로드 API와 클로드 프로 구독자를 위해 Claude.ai 에서 앤스로픽의 소네트와 오퍼스 모델과 함께 제공된다.

"대규모 데이터 세트를 신속하게 분석하고 고객 지원과 같은 작업을 위해 적시에 출력을 생성해야 하는 엔터프라이즈 사용자에게 속도는 필수적입니다."라고 인류학 대변인은 말했습니다.

클로드3 하이쿠는 대부분의 워크로드에 대해 동급보다 3배 빠른 속도로 초당 21K 토큰(~30페이지)을 32K 토큰 이하의 프롬프트로 처리한다

하이쿠는 신속한 출력을 생성할 수 있도록 설계되어 반응이 빠르고 매력적인 채팅 경험과 많은 작은 작업을 동시에 실행할 수 있다.



하이쿠에 대한 앤스로픽의 가격 책정 모델은 입력 대 출력 토큰 비율이 1:5이며, 종종 더 긴 프롬프트를 수반하는 엔터프라이즈 워크로드를 위해 명시적으로 설계되었다. 이 회사는 기업들이 하이쿠에 의존하여 분기별 서류 제출, 계약서 또는 법률 사건과 같은 대량의 문서를 신속하게 분석할 수 있으며, 이를 성능 계층의 다른 모델에 비해 절반의 비용으로 사용할 수 있다고 말한다.

예를 들어 클로드 3 하이쿠는 단 1달러로 400건의 대법원 판례 또는 2,500건의 이미지를 처리하고 분석할 수 있다.

속도와 경제성뿐만 아니라, 어셔니스트는 클로드 3 하이쿠가 엔터프라이즈급 보안과 견고성을 우선시한다고 말합니다. 이 회사는 유해한 출력물과 탈옥 가능성을 줄이기 위해 엄격한 테스트를 수행합니다. 추가 보안 계층에는 지속적인 시스템 모니터링, 엔드포인트 강화, 보안 코딩 관행, 강력한 데이터 암호화 프로토콜 및 엄격한 액세스 제어가 포함됩니다.

또한, 어인틱은 정기적인 보안 감사를 수행하고 경험이 풍부한 침투 테스터와 협력하여 취약점을 사전에 파악하고 해결합니다.

고객들은 오늘부터 클로드3 하이쿠를 앤스로픽의 API 또는 클로드 프로 구독을 통해 사용할 수 있다. 하이쿠는 아마존 베드락에서 사용할 수 있으며 구글 클라우드 버텍스 AI에 곧 출시될 예정이다.


3줄 요약

1. 앤스로픽은 지능형 클래스에서 가장 빠르고 가장 저렴한 인공지능 모델인 클로드 3 하이쿠를 출시했다.
2. 클로드 3 하이쿠는 업계 벤치마크에서 강력한 성능을 자랑하며, 대규모 데이터 세트를 신속하게 분석하고 적시에 출력을 생성하는 데 필수적인 속도를 제공한다.
3. 이 모델은 엔터프라이즈급 보안과 견고성을 우선시하며, 클로드 프로 구독자를 위해 클로드 API와 클로드.ai에서 이용할 수 있다.

'AI 기사' 카테고리의 다른 글

그림 AI '30배' 빨라진다. DALL·E3, 스테이블 디퓨전에 적용 가능  (0) 2024.03.28
AI 시대 필수요소. '더 많은 OO'. 최고의 AI사들이 투자하는 이곳  (0) 2024.03.26
코딩까지 AI로? 개발자 "망했다." 코그니션의 '데빈' 소개  (0) 2024.03.25
클로드 3: 인공지능 경쟁의 새로운 경쟁자, 그 성능과 가격 분석  (0) 2024.03.24
일론 머스크의 xAI가 자사의 LLM 그록-1을 오픈 소스로 공개  (0) 2024.03.24

일론 머스크의 xAI가 그록의 AI 모델 코드와 가중치를 공개하며 과정에서 OpenAI를 조롱했다.

 

GitHub과 BitTorrent를 통한 이번 공개는 전 세계의 연구자들과 개발자들이 3140억 개의 파라미터를 활용해 건설하고 반복 작업을 할 수 있게 했는데, 이는 GPT-3보다 약 1500억 개가 더 많다.

 

xAI는 고급 LLM 기술에 대한 접근을 민주화하기 위해 그록의 원시, 정제되지 않은 버전을 제공함으로써 어떤 용도로든 — 심지어 상업적으로도 — 실험을 준비했다.

머스크는 물론 그록의 오픈 소싱에 대해 조금의 (친하지 않은) 농담을 참을 수 없었다. ChatGPT X 계정이 그록의 위의 게시물에 "내 전체 농담을 훔쳤다"고 댓글을 달았고, 머스크는 "OpenAI의 ‘Open’ 부분에 대해 더 말해보세요…"라고 재치 있게 대꾸했다.

머스크와 OpenAI의 창립자 샘 알트만, 그렉 브록맨은 OpenAI가 비영리 오픈 소스 연구 회사에서 마이크로소프트의 수익 창출 부문으로 극적으로 진화한 것에 대해 법적 소송과 토론에 휘말려 있다.

 

그록은 최근 Anthropic의 인상적인 Claude 3 Opus와 Google의 Gemini가 출시됨에 따라 여러 방면에서 압력을 받고 있는 OpenAI에 또 다른 골칫거리다. 심지어 애플도 자체 MM1을 출시하며 LLM 경쟁에 합류했다.

 

그러나 그록은 대화형 AI 애플리케이션에 즉시 사용할 준비가 되어 있지 않다.

 

우선, 모델은 대화 시스템에서 최적으로 작동하도록 특정 지시나 데이터셋으로 미세 조정되지 않았다. 이는 대화형 AI 개발에 관심 있는 사람들에게 도전 과제를 제시할 수 있으며 그록의 기능을 활용하기 위한 추가적인 노력과 자원이 필요함을 의미한다.

 

또한, 모델의 가중치 크기가 무려 296GB에 달하기 때문에 모델을 실행하려면 상당한 계산 자원이 필요하며, 고급 데이터센터급 하드웨어를 포함한다.

 

그러나 AI 커뮤니티는 그록을 최적화하기 위한 잠재적인 노력을 기대하고 있으며, 이는 모델의 크기와 계산 요구 사항을 줄여서 생성적 AI 친화적 장비를 가진 이들을 넘어서 접근성을 높일 수 있다.

 

그록은 진정한 오픈 소스다 그록의 공개에서 가장 중요한 측면 중 하나는 xAI가 Apache 2.0 라이선스를 사용하기로 한 선택이다, Mistral의 7B와 같이.

 

소프트웨어의 사용, 수정, 배포에 더 제한적인 조건을 부과하는 일부 라이선스와 달리, Apache 2.0 라이선스는 소프트웨어를 사용, 수정, 배포하는 방법에 있어 광범위한 자유를 허용한다.

모든 실행 가능한 오픈 소스 모델은 OpenAI와 Anthropic 같은 폐쇄 소스 개발자의 수익을 침식할 위협이 된다.

이는 상업적 용도를 포함하여, 그록을 자신들의 제품이나 서비스에 구축하거나 통합하려는 기업과 개인에게 매력적인 기반을 제공한다.

대체로, 그록의 가중치와 아키텍처를 자유롭게 사용할 수 있게 함으로써, xAI는 머스크의 오픈 AI에 대한 비전을 진전시키고 AI 커뮤니티 전반에 도전장을 내민다.

Anthropic, Google, 그리고 이제 xAI로부터의 최근 발전에 의해 OpenAI는 아마도 흔들리고 있을 것이다.

커뮤니티는 GPT-5나 Sora 출시와 같은 어떤 형태로든 상위 손을 다시 취할 것으로 기대하며 준비하고 있다.

'AI 기사' 카테고리의 다른 글

그림 AI '30배' 빨라진다. DALL·E3, 스테이블 디퓨전에 적용 가능  (0) 2024.03.28
AI 시대 필수요소. '더 많은 OO'. 최고의 AI사들이 투자하는 이곳  (0) 2024.03.26
코딩까지 AI로? 개발자 "망했다." 코그니션의 '데빈' 소개  (0) 2024.03.25
클로드 3: 인공지능 경쟁의 새로운 경쟁자, 그 성능과 가격 분석  (0) 2024.03.24
앤스로픽, '클로드 3' 출시 GPT, 제미나이보다 월등함 인증  (0) 2024.03.24
1

+ Recent posts