모든 면에서 2024년은 적어도 기술의 상용화에 관해서는 인공 지능에 있어 가장 큰 해였습니다.
2022년 말 ChatGPT의 출시로 촉발된 대규모 언어 모델(LLM) 붐은 OpenAI와 Microsoft, Meta, Google과 같은 기술 대기업뿐만 아니라 수십 개의 다른 스타트업 및 개인 개발자가 수많은 새로운 LLM을 도입하면서 둔화될 기미를 보이지 않았습니다.
또한 대부분의 대형 LLM을 뒷받침하는 트랜스포머 아키텍처를 넘어서는 Liquid AI의 Liquid Foundation Model과 같은 새로운 기술이 등장하기 시작했습니다.
마지막으로, 기업들은 AI에 대한 "에이전트" 접근 방식을 완전히 수용하기 시작했으며, 특정 문제에 대해 독립적으로 또는 일반적인 LLM 챗봇보다 적은 인력 관리로 작업할 수 있는 특정 AI 기반 봇, 애플리케이션 및 워크플로를 개발하기 시작했습니다.
올해부터 가장 큰 영향을 미칠 것은 다음과 같습니다.
1. OpenAI, ChatGPT를 넘어 광범위하게 확장
AI 세대의 시대를 여는 데 가장 큰 책임이 있다고 할 수 있는 이 회사는 신생 기업과 레거시 기술, 심지어 자체 투자자이자 파트너인 Microsoft와의 경쟁이 심화되고 있음에도 불구하고 올해 한 치의 변화도 놓치지 않았습니다.
(o1 모델) OpenAI는 GPT 시리즈를 넘어 복잡한 프롬프트를 처리하는 데 더 많은 시간을 할당하여 정확도를 높이는 o1 "reasoning" 시리즈를 넘어 처음으로 새로운 대형 범용 모델 제품군을 출시했습니다. 특히 과학, 코딩 및 추론 작업에 효과적입니다.
(o3 모델) 9월의 o1 모델에 이어 연말에 훨씬 더 발전된 o3 모델을 발표하는 블록버스터급 모델입니다. 이것은 2025년 초까지 공개적으로 또는 제3자에게 제공되지 않을 것이지만 OpenAI가 월계관에 안주하지 않고 있음을 보여줍니다.
(ChatGPT 검색) 처음에 SearchGPT라는 초대 전용 독립 실행형 제품으로 출시된 이 기능은 ChatGPT 내에서 보다 많은 실시간 웹 정보 검색과 검색 결과의 세련된 프레젠테이션을 가능하게 하여 최신 쿼리에 대한 유용성을 높이고 Google, Bing 및 신규 이민자 Perplexity와 정면으로 대결합니다.
(캔버스(Canvas)) 지난 10월 선보인 캔버스(Canvas)는 챗GPT 인터페이스를 대화형 인터페이스를 넘어 문서 편집이나 프로젝트 코딩 등 사용자의 요청에 따라 콘텐츠를 동적으로 업데이트할 수 있는 워크스테이션과 같은 창으로 확장했습니다.
(Sora) 거의 1년 동안 철저하게 보호되는 비디오 생성기 모델로 우리를 놀린 후, 12월 초 OpenAI는 마침내 Sora를 대중에게 출시했으며, 독특하고 세심하게 설계된 인터페이스와 스토리보드 기능으로 경쟁이 치열한 AI 비디오 공간에서 차별화를 모색하면서 다양한 반응을 빠르게 불러일으켰습니다.
2. 오픈 소스 AI의 도약
(라마 3 및 3.1) 메타는 지난 4월 라마 3를 선보이며 오픈소스 AI 성능의 새로운 기준을 제시했고, 7월에는 4,050억 개의 매개변수를 가진 라마 3.1을 출시했습니다. 라마 3.1 버전은 왓츠앱(WhatsApp), 메신저(Messenger), 인스타그램(Instagram), 페이스북(Facebook)과 같은 플랫폼에 통합된 회사의 비서인 메타(Meta)의 비서인 메타(Meta) AI를 구동하는 데 사용되었으며, 가장 널리 사용되는 AI 비서가 되는 것을 목표로 합니다.
(라마 3.3) 2024년 12월에 출시된 라마 3.3은 대형 모델과 비슷한 성능을 제공하면서도 컴퓨팅 비용은 훨씬 적어 엔터프라이즈 애플리케이션에서 더 쉽게 액세스할 수 있습니다.
한편, 알리바바의 Qwen-2.5 제품군과 DeepSeek의 새로운 V2.5 및 R1-Lite Preview와 같은 중국 모델은 일부 벤치마크 차트에서 상위권을 차지할 정도로 난데없이 나타났고, Nvidia는 그래픽 카드와 소프트웨어 아키텍처 공급을 넘어 자체 오픈 소스의 강력한 Nemotron-70B 모델을 출시했습니다.
샌프란시스코의 소규모 기업인 누스 리서치(Nous Research)는 보다 개인화되고 덜 제한적인 AI 모델을 오픈 소스로 제공하는 것을 목표로 하며, 몇 가지 멋진 새로운 아이디어를 선보였습니다.
그리고 프랑스의 미스트랄(Mistral)은 자체 오픈 소스 및 독점 AI 제품을 빠르게 확장했습니다.
3. Google의 Gemini 시리즈는 사용가능한 최고의 경쟁자가 되었습니다
올해의 컴백 스토리에서는 한때 이상한 이미지 생성으로 조롱당하고 지나치게 "깨어 있다"는 비판을 받았던 Google의 Gemini AI 모델 시리즈가 이제 타사 성능 벤치마크 차트에서 1위를 차지하고 개발자와 비즈니스에 점점 더 어필하고 있는 새롭고 더 강력한 버전으로 포효하며 돌아왔습니다.
Google은 스트리밍 비디오 분석을 지원하고 화면에서 무엇을 하고 있는지 보고 지시할 수 있는 멀티모달 AI 모델인 Gemini 2.0 Flash를 소개한 데 이어 OpenAI의 o1 및 o3 추론 모델과 경쟁하는 Gemini 2.0 Flash Thinking을 출시했습니다.
4. 에이전트 AI가 기업을 휩쓸었습니다
한 해가 지나면서 "에이전트" AI는 화제의 세계에서 최고의 기업가 소프트웨어 공급업체의 주요 제품 발표 및 이니셔티브의 실제 시리즈로 변모했습니다. 예를 들면 다음과 같습니다.
(Salesforce의 Agentforce 2.0) Salesforce는 몇 일 전 CRM 및 영업 제품과 Slack 전반에 걸쳐 추론, 통합 및 사용자 정의 기능을 향상시켜 엔터프라이즈 생산성 도구를 크게 개선하는 고급 AI 에이전트 프로그램인 Agentforce 2.0을 공개했습니다.
(SAP의 Joule) SAP는 Joule 챗봇을 오픈 소스 대규모 언어 모델(LLM) 기반 AI 에이전트로 전환하여 엔터프라이즈 환경에서 혁신과 효율성을 주도했습니다.
(Google의 Project Astra) Gemini 2.0 이니셔티브의 일환으로 Google은 사용자 생산성과 의사 결정을 향상시키는 것을 목표로 Google의 서비스 제품군을 활용하여 실시간 상황에 맞는 응답을 제공하도록 설계된 AI 비서인 Project Astra를 출시했습니다.
2025년에 대한 나의 큰 예측 - AI 생성 콘텐츠가 최고로 군림할 것입니다
이러한 발전을 바탕으로 2025년은 특히 OpenAI에서 Meta, Google, Microsoft, Apple, 심지어 Elon Musk의 xAI에 이르기까지 모든 기업이 AI 이미지 생성기를 내장하고 있기 때문에 비즈니스 및 소비자 도메인 전반에 걸쳐 AI 생성 콘텐츠의 확산을 목격할 준비가 되어 있습니다.
이 확장은 콘텐츠 제작을 간소화하고 개인화를 강화하며 다양한 부문에서 효율성을 높일 것입니다.
또한 대규모 언어 모델(LLM)과 생성형 AI 기반 로보틱스가 상업 및 소비자 환경 모두에서 초기에 대규모로 배포되어 자동화 및 인간-로봇 상호 작용에 혁명을 일으킬 것으로 예상됩니다.
이상의 기사는 2024년 12월 23일 VentureBeat에서 게재한 “The 4 biggest AI stories from 2024 and one key prediction for 2025”제목의 기사내용을 편집하여 작성하였습니다.
* 원문정보 출처 : The 4 biggest AI stories from 2024 and one key prediction for 2025 | VentureBeat
저작권자 ⓒ 창조아고라, 무단 전재 및 재배포 금지