최신 뉴스 요약

[주요 소식] 엔비디아도 'KV 캐시' 해결... '트라이어텐션'으로 메모리 10배 절감

도실아오 2026. 4. 9. 18:21

🚀 최신 뉴스 요약

2026년 04월 09일

오늘은 모델 성능보다도, 긴 추론을 어떻게 더 가볍게 돌리느냐가 핵심인 소식이었어요. 엔비디아가 공개한 TriAttention은 결국 LLM의 오래된 병목인 KV 캐시 메모리 부담을 정면으로 건드린 접근이었고요.

이번 뉴스레터에서는 이 변화가 왜 중요한지, 기술 포인트만 짧게 정리했어요

🤖 AI & IT 동향

오픈AI, 알츠하이머 연구 이니셔티브 가동...연구 기관에 1500억 지원

2026년 04월 09일 • AI★★★★★

오픈AI는 알츠하이머병 연구를 위해 1억 달러 이상을 투자하여 신규 데이터 생성과 신약 개발 등 다양한 분야에 지원하겠다고 밝혔다. 이 투자는 단기적인 효과뿐만 아니라 2026년 이후까지 지속되어 장기적인 치료법 개발에 초점을 맞추고 있다. 알츠하이머병은 전 세계적으로 수백만 명에게 영향을 미치는 치명적인 질환으로, 가족까지 포괄한 종합적인 대응이 요구된다.

자세히 보기 →

오픈AI, 아동 성 문제 대응 위한 안전 청사진 발표

2026년 04월 09일 • AI★★★★★

오픈AI는 AI 악용 아동 착취 범죄 대응을 위한 '아동 안전 청사진'을 발표했습니다. 이 청사진은 신속한 탐지, 강화된 신고 시스템, 수사 효율성 향상을 목표로 하며, 아동 성범죄 증가 추세에 따른 조치입니다. 특히 미국 내 아동 보호 강화에 초점을 맞추고 있습니다.

자세히 보기 →

LG, 멀티모달 AI ‘엑사원 4.5’ 공개…”텍스트-이미지 동시 처리”

2026년 04월 09일 • AI★★★★★

LG AI연구원이 멀티모달 AI 모델 '엑사원 4.5'를 오픈 소스로 공개했습니다. 이 모델은 이미지와 텍스트를 동시에 처리하고 학습하는 비전언어모델(VLM)로, 이전 버전인 엑사원 1.0에서 발전된 기술을 기반으로 합니다. 엑사원 4.5는 한국어와 다섯 가지 언어를 지원하며, 글로벌 시장 진출을 겨냥하고 있습니다.

자세히 보기 →

대동, 국내 최초 AI트랙터 출시…농업 '필드로봇' 시대 개막

2026년 04월 09일 • AI★★★★★

대동은 농촌의 인력 부족과 고령화 문제 해결을 위해 비전 인공지능 기술이 탑재된 무인 자율작업 AI트랙터를 출시한다. 이 제품은 반복적이고 힘든 농작업을 자동화하여 농업 생산성을 향상시키고 농부의 노동 부담을 경감시키는 데 초점을 맞추고 있다.

자세히 보기 →

알리바바, 자체 개발 칩 1만개 탑재한 데이터센터 구축

2026년 04월 09일 • AI★★★★★

알리바바와 차이나 텔레콤이 중국 광둥성 사오관에 최첨단 AI 데이터센터를 구축하여 글로벌 수준의 고성능 AI 인프라를 구축하고 있습니다. 이 센터는 알리바바의 '전우' 칩 1만 개를 활용해 대규모 매개변수를 가진 AI 모델을 지원할 예정이며, 차이나 텔레콤이 운영을 담당합니다. 이 프로젝트는 중국의 자국산 AI 기술 자립을 가속화하는 중요한 단계입니다.

자세히 보기 →

퍼플렉시티, AI 에이전트로 사업 방향 전환 후 월 매출 50% 급증

2026년 04월 09일 • AI★★★★★

퍼플렉시티는 에이전트 중심 전략으로 매출이 급증하며 가파른 성장을 이어가고 있다. 새로운 에이전트 'Computer' 출시 이후 한 달 만에 매출이 50% 상승했으며, 연간 반복매출(ARR)이 6월 기준으로 4억5천만 달러에서 5억 달러로 확대되었다. 사용량 기반 요금제 도입이 핵심 동력으로 작용했다. 이 전략 변화는 기존 챗봇 서비스에 대한 새로운 접근법을 시사한다.

자세히 보기 →

앤트로픽, 에이전트 개발·배포를 위한 '클로드 매니지드 에이전트' 공개

2026년 04월 09일 • AI★★★★★

앤트로픽이 클라우드 기반 AI 에이전트 개발 및 관리의 복잡성을 크게 줄이는 새로운 플랫폼 '클로드 매니지드 에이전트'를 출시하여 기업용 AI 시장 진출을 가속화하고 있습니다. 이 플랫폼은 보안 설정부터 모델 업데이트까지의 작업을 간소화하는 컴포저블 API를 통해 사용자 친화적인 개발 환경을 제공합니다. 현재 퍼블릭 베타 형태로 운영되고 있어 기업들이 쉽게 접근할 수 있습니다.

자세히 보기 →

CDMA 신화 이끈 SKT, 다음 30년은 'AI 네트워크'가 게임체인저

2026년 04월 09일 • Tech★★★★★

1996년 CDMA 상용화는 대한민국을 IT 강국으로 도약시켰으며, 향후 30년 동안 AI 기반 지능형 네트워크가 국가 경쟁력의 핵심이 될 것으로 전망됩니다.

자세히 보기 →

가비아, 국산 NPU 기반 클라우드 서비스 출시

2026년 04월 09일 • AI★★★★★

가비아는 AI 반도체 기업 리벨리온의 NPU 기반 클라우드 서비스 'NPUaaS'를 출시하여 기업들이 NPU 인프라를 구독 방식으로 쉽게 접근할 수 있게 했습니다. 이 서비스는 AI 컴퓨팅 성능을 향상시키는 데 초점을 맞추고 있습니다.

자세히 보기 →

메타, 초지능팀 첫 AI 모델 '뮤즈 스파크' 공개

2026년 04월 09일 • AI★★★★☆

메타가 이끄는 MSL 팀이 첫 AI 모델 '뮤즈 스파크'를 출시하여 경쟁사 수준의 성능을 보여주었다. 알렉산더 왕 CAIO의 주도 하에 이루어진 이 성과는 메타의 초거대 인공지능 기술 경쟁에서 중요한 발판이 되었다. 이 모델은 현지 날짜로 8일에 공개되었다.

자세히 보기 →

메타, 첫 폐쇄형 모델 '뮤즈 스파크' 출시…경쟁에는 합류·정상과는 격차

2026년 04월 09일 • AI★★★★☆

메타의 슈퍼인텔리전스 랩이 처음으로 프론티어 모델 경쟁에 참가하는 '뮤즈 스파크(Muse Spark)'를 공개했다. 구글, 오픈AI, 앤트로픽 모델에 이어 순위를 세웠지만, 아직 최상급 성능에는 미치지 못하는 것으로 평가된다. 메타는 공식 채널을 통해 배포하며 일부 사용자에게는 비공개 API를 제공하고 있다. 출시 모델은 이전 이름 '아보카도'와 관련 없이 폐쇄형으로 공개되었다.

자세히 보기 →

엔비디아도 'KV 캐시' 해결... '트라이어텐션'으로 메모리 10배 절감

2026년 04월 08일 • AI★★★★☆

엔비디아는 기존 모델 대비 메모리 사용량을 획기적으로 줄인 혁신적인 기술을 발표했다. 이 기술은 '트라이어텐션(TriAttention)'으로 알려진 메모리 캐시 문제 해결에 초점을 맞추고 있으며, 기존 구글의 터보퀀트 압축 대비 메모리 사용량을 10.7배 줄이는 성과를 보였다. 특히, 대형 언어 모델의 성능 향상과 효율성 개선에 중점을 두고 있다.

자세히 보기 →

지푸, 자율 작업 8시간까지 늘린 오픈소스 'GLM-5.1' 출시

2026년 04월 08일 • AI★★★★☆

지푸 AI는 인간 개입 없이 장기간 지속 가능한 차세대 모델 GLM-5.1을 공개했다. 이 모델은 수백 번의 반복 작업과 수천 번의 도구 호출을 통해 자체 성능을 향상시키는 혁신적인 기능을 갖추고 있으며, 오픈소스로 공개되어 허깅페이스와 모델스코프에서 다운로드 가능하다. 약 7540억 개의 매개변수를 가진 전문가 혼합 구조로 설계되어 있다.

자세히 보기 →

깃허브, 에이전트 접속 폭증으로 트래픽 급증·서비스 중단 사태 발생

2026년 04월 08일 • AI★★★★☆

마이크로소프트의 깃허브 플랫폼에서 AI 코딩 에이전트의 활용 확대로 인해 연간 커밋 수가 10억건을 돌파한 지 불과 며칠 만에 주당 2억7500만건까지 급증했으며, 올해 총 140억건에 달할 것으로 예상된다. 이는 전년 대비 약 14배의 급격한 증가를 나타낸다. 이러한 성장은 AI 코딩 도구의 확산에 크게 기인한다.

자세히 보기 →

알리바바, 완성형 영상 제작 가능한 AI '완2.7-비디오' 출시

2026년 04월 08일 • AI★★★★☆

알리바바가 '완2.7-비디오'를 출시하여 AI 기술로 완성된 영상 제작을 가능하게 했습니다. 이 모델은 콘텐츠 생성을 넘어 연출 수준까지 제어할 수 있는 종합적인 영상 제작 도구로, 복잡한 스토리텔링까지 지원합니다.

자세히 보기 →

메타, 스마트폰용 소형 비전 인코더 'EUPE' 출시

2026년 04월 08일 • AI★★★★☆

메타가 스마트폰 등 제한된 자원 환경에서도 효율적으로 다양한 시각 인식 작업을 수행할 수 있는 소형 비전 인코더 'EUPE'를 개발하여 공개했습니다. 기존의 대규모 매개변수 모델과 달리 크기가 작아도 높은 성능을 유지하는 혁신적인 접근법을 제시했습니다. 이는 모바일 기기 및 증강현실 분야의 컴퓨팅 부담을 크게 줄이는 데 기여합니다.

자세히 보기 →

수노, 주요 음반사들과 AI 음악 협상 난항...'폐쇄형vs개방형' 생태계 충돌 

2026년 04월 08일 • AI★★★★☆

수노와 주요 음반사들이 저작권료 협상을 넘어 플랫폼 운영 방식의 차이로 인해 계약 협상이 교착 상태에 빠졌다. 최근 몇 달간 유니버설 뮤직과 소니 등 주요 음반사와의 협의는 진전 없이 진행 중이다. 협상팀은 현재 제안에도 불구하고 합의 도달이 어려울 것으로 전망하고 있다.

자세히 보기 →

중국, 세계 첫 수중 데이터센터 공개..."기술적·상업적 타당성 검증 시험"

2026년 04월 08일 • Tech★★★★☆

중국은 작년에 상하이 자유무역지대에 세계 최초로 해양 풍력 발전과 연계된 수중 데이터센터(UDC)를 구축하고 가동을 시작했다. 이 시설은 상하이 하이클라우드 테크놀로지가 건설했으며, 총 투자액은 약 3454억원(16억위안)에 달한다. 위치는 수심 10m 해역에 있으며, 해상 통신과 항해 장비에 중요한 데이터 처리 역할을 담당한다.

자세히 보기 →

머스크, 오픈AI 비영리 부문 이사회에서 알트먼·브록먼 해임 추진

2026년 04월 08일 • AI★★★★☆

일론 머스크가 오픈AI의 경영진을 해임하고 비영리 조직으로 되돌리기 위해 소송을 강화하고 있다. 수정 소장을 통해 샘 알트먼과 그록 브록먼의 이사회 해임을 요구하며 공익 가치 훼손을 주장하고 있다. 머스크는 소송 승소 시 오픈AI의 구조 변경까지 추진할 것으로 보인다.

자세히 보기 →

앤트로픽, AI 인프라 확장 위해 MS 출신 임원 영입

2026년 04월 08일 • AI★★★★☆

앤트로픽은 급증하는 AI 수요에 대응하기 위해 에릭 보이드를 인프라 총괄 책임자로 임명했다. 보이드는 마이크로소프트에서 LLM 경험을 쌓은 전문가로, 글로벌 인프라 확장을 주도할 예정이다. 이 인사는 앤트로픽이 전 세계적인 기술 수요를 효과적으로 처리하는 데 중추적인 역할을 담당하게 될 것으로 기대된다.

자세히 보기 →

AI 해킹 시대…노드VPN, '커피값 보안'으로 韓 공략

2026년 04월 08일 • AI★★★☆☆

AI 기반 해킹이 증가하면서 보안 솔루션 경쟁이 치열해지는 가운데, 노드VPN은 저렴한 가격과 뛰어난 성능으로 한국 B2C 개인 거래 보안 시장에 진출하고 있습니다. 무료 백신 트렌드에 대응하여 차별화된 접근법을 제시하며 업계 주목을 받고 있습니다.

자세히 보기 →

베이조스의 비밀 AI 스타트업, 오픈AI에서 인프라 담당 인재 영입

2026년 04월 08일 • AI★★★☆☆

아마존의 제프 베이조스가 이끄는 비밀 AI 스타트업 프로메테우스가 핵심 인재 영입과 막대한 투자로 산업용 AI 시장 진출을 가속화하고 있다. 최근 카일 코식을 영입하여 오픈AI에서의 경험을 바탕으로 AI 인프라 구축에 힘쓰고 있으며, 이는 프로메테우스의 성장 전략 강화에 기여하고 있다.

자세히 보기 →

IEA의 경고 "중국발 희토류 통제로 글로벌 경제 6.5조달러 위험"

2026년 04월 08일 • AI★★★☆☆

국제에너지기구(IEA)는 희토류 공급 불안정 문제 해결을 위해 신규 프로젝트 참여와 국제 협력 강화, 정책적 지원이 필수적임을 강조했다. 전기차, AI, 로봇 기술 등에서 희토류 수요 증가 추세가 가속화되고 있으며, 특히 네오디뮴, 프라세오디뮴, 디스프로슘, 터븀 등 핵심 원소의 수급 위기가 심각하다. 이로 인해 2030년까지 추가적인 수요 증가가 예상된다.

자세히 보기 →

더 많은 정보를 원하시거나 공유하고 싶은 소식이 있다면
언제든지 댓글 남겨주세요. 😊

도실아오 테크로그