Meta의 Muse Spark: 개인 초지능을 위한 새로운 멀티모달 AI

title: "Meta의 Muse Spark: 개인 초지능을 위한 새로운 멀티모달 AI" slug: "introducing-muse-spark-msl" date: "2026-04-09" lang: "ko" source: "https://ai.meta.com/blog/introducing-muse-spark-msl/" category: "AI 모델" keywords:

Meta AI
Muse Spark
멀티모달 AI
개인 초지능
AI 모델
AI 연구
도구 활용 AI
시각적 사고 사슬
다중 에이전트 오케스트레이션
강화 학습
AI 스케일링
최첨단 AI meta_description: "Meta는 고급 추론, 도구 활용 및 다중 에이전트 오케스트레이션 기능을 갖춘 획기적인 멀티모달 AI 모델 Muse Spark를 소개하며, 개인 초지능 시대를 열고 있습니다." image: "/images/articles/introducing-muse-spark-msl.png" image_alt: "멀티모달 AI 기능과 'Muse Spark' 텍스트를 상징하는 얽힌 추상적인 형태의 Muse Spark 로고" quality_score: 94 content_score: 93 seo_score: 95 companies:
Meta schema_type: "NewsArticle" reading_time: 7 faq:
question: "Muse Spark는 무엇이며, 무엇이 특별한가요?" answer: "Muse Spark는 Meta Superintelligence Labs에서 개발한 'Muse' 제품군의 Meta의 첫 번째 모델입니다. 이 모델은 본질적으로 멀티모달 추론 모델로서, 텍스트와 시각과 같은 다양한 양식의 정보를 완벽하게 통합하고 처리한다는 점에서 두각을 나타냅니다. 고유한 기능으로는 강력한 도구 활용 기능, 복잡한 문제 해결을 위한 시각적 사고 사슬, 그리고 정교한 다중 에이전트 오케스트레이션이 포함되어 있어 여러 AI 에이전트를 조율하여 향상된 성능을 제공할 수 있습니다. 이 모델은 Meta가 개인 초지능 개발을 향한 야심 찬 여정에서 중요한 단계를 나타내며, 사용자 세계를 깊이 개인적인 수준에서 이해하고 상호작용하는 것을 목표로 합니다. 그 도입은 Meta의 AI 노력을 근본적으로 재정비한 것을 기반으로 하는 Meta AI 전략의 근본적인 변화를 의미합니다."
question: "Muse Spark의 핵심 기능, 특히 '사고 모드(Contemplating mode)'는 무엇인가요?" answer: "Muse Spark는 멀티모달 인식, 복잡한 추론 작업, 건강 관련 응용 프로그램, 정교한 에이전트 워크플로우를 포함한 광범위한 영역에서 경쟁력 있는 성능을 제공합니다. 특히 눈에 띄는 기능은 AI 추론에서 중요한 도약을 나타내는 '사고 모드(Contemplating mode)'입니다. 이 모드는 여러 AI 에이전트를 조율하여 병렬로 추론하게 함으로써, Muse Spark가 매우 어려운 문제를 향상된 깊이와 정확성으로 해결할 수 있게 합니다. 이 병렬 처리 능력은 Muse Spark가 다른 최첨단 모델에서 발견되는 극단적인 추론 모드와 경쟁할 수 있도록 포지셔닝하며, 'Humanity’s Last Exam'에서 58%, 'FrontierScience Research'에서 38%라는 인상적인 점수로 입증되었습니다. 이 모드는 고급 인지 기능을 달성하는 데 필수적인 더욱 신중하고 철저한 문제 해결을 가능하게 합니다."
question: "Muse Spark는 실생활 시나리오에서 멀티모달 기능을 어떻게 적용하나요?" answer: "Muse Spark는 자체적인 멀티모달 통합을 활용하여 매우 상호작용적이고 실용적인 애플리케이션을 만듭니다. 예를 들어, 시각 정보를 동적으로 분석하고 상호작용하여 가전제품 문제를 해결하고, 바운딩 박스 하이라이트와 단계별 지침이 포함된 대화형 튜토리얼을 제공할 수 있습니다. 건강 분야에서는 음식 품목이나 운동 루틴의 시각 데이터를 처리하여 영양 성분, 근육 활성화, 심지어 정당화된 건강 점수와 같은 개인 맞춤형 통찰력을 의료 전문가와 협력하여 제공할 수 있습니다. 이러한 기능은 Muse Spark가 즉각적인 환경을 분석하고, 건강을 지원하며, 미니 게임과 같은 매력적인 대화형 경험을 생성하여 AI를 일상생활에서 더욱 직관적이고 유용하게 만듭니다."
question: "Meta는 Muse Spark 및 미래 AI 모델의 확장을 위해 어떤 전략적 투자를 했나요?" answer: "Muse Spark 및 후속 모델의 지속적인 확장을 지원하기 위해 Meta는 전체 AI 스택에 걸쳐 전략적 투자를 단행했습니다. 여기에는 연구 방법론의 포괄적인 개편, 모델 훈련 파이프라인 최적화, 그리고 Hyperion 데이터 센터 개발을 통한 인프라의 상당한 업그레이드가 포함됩니다. 이러한 투자의 핵심 측면은 사전 학습 스택의 완전한 재구축이며, 이는 모델 아키텍처, 최적화 알고리즘 및 데이터 큐레이션 기술의 상당한 개선으로 이어졌습니다. 이러한 발전은 Meta의 AI 개발 효율성을 극적으로 증가시켜, 모든 컴퓨팅 단위에서 더 큰 기능을 추출하고 개인 초지능이라는 목표를 향해 예측 가능하고 효율적인 확장을 보장합니다."
question: "Meta는 이전 모델에 비해 Muse Spark로 어떻게 상당한 컴퓨팅 효율성을 달성했나요?" answer: "Meta는 사전 학습 스택의 엄격한 재정비를 통해 Muse Spark로 놀라운 컴퓨팅 효율성을 달성했습니다. 모델 아키텍처, 최적화 전략 및 데이터 큐레이션의 개선을 구현함으로써, 이제 동일한 양의 컴퓨팅 리소스에서 훨씬 더 많은 기능을 추출할 수 있습니다. 평가 결과 Muse Spark는 Meta의 이전 모델인 Llama 4 Maverick에 비해 10배 이상 적은 컴퓨팅으로 동일한 성능 수준에 도달할 수 있음을 보여주었습니다. 이러한 효율성 향상은 혁신적인 엔지니어링의 증거일 뿐만 아니라 Muse Spark를 다른 주요 기본 모델에 비해 리소스 활용 측면에서 매우 경쟁력 있는 모델로 자리매김하게 합니다. 이 돌파구는 더 크고 강력한 모델의 개발을 가속화하는 데 중요합니다."
question: "Muse Spark 개발에서 강화 학습(RL)의 역할은 무엇인가요?" answer: "강화 학습(RL)은 사전 학습 후 Muse Spark의 기능을 증폭시키는 데 중요한 역할을 합니다. 대규모 RL과 관련된 내재된 불안정성에도 불구하고, Meta의 새로운 스택은 원활하고 예측 가능한 이득을 보장합니다. RL은 훈련 데이터의 pass@1 및 pass@16 지표에서 로그-선형 성장을 통해 입증되었듯이, 모델의 신뢰성과 추론 다양성을 체계적으로 향상시킵니다. 결정적으로, 이러한 개선은 보지 못했던 작업으로 효과적으로 일반화되어, RL로 인한 이득이 단순한 암기가 아니라 진정한 능력 향상임을 보여줍니다. RL 컴퓨팅의 이러한 예측 가능한 스케일링은 Muse Spark가 복잡한 작업을 수행하는 능력을 지속적으로 향상시켜, 모델이 적응력을 유지하고 초기 훈련 범위를 훨씬 뛰어넘는 성능을 발휘하도록 보장합니다."
question: "Muse Spark의 추론 시점에 '사고 압축'과 '다중 에이전트 오케스트레이션'은 무엇인가요?" answer: "Muse Spark의 추론 시점에서 '사고 압축'은 RL 훈련 중 '사고 시간 패널티'에 의해 유발되는, 훨씬 적은 토큰을 사용하여 문제를 해결하기 위해 모델이 추론 과정을 압축하는 능력을 의미합니다. 초기에는 모델이 개선을 위해 '더 오래 생각'할 수 있지만, 패널티가 증가함에 따라 더 간결하게 유사하거나 더 나은 결과를 달성하는 방법을 학습합니다. 이 압축 단계 이후에는 더욱 강력한 성능을 위해 솔루션을 확장할 수 있습니다. '다중 에이전트 오케스트레이션'은 지연 시간을 크게 늘리지 않고 추론 시점 추론을 확장하는 기술입니다. 단일 에이전트가 더 오래 생각하는 대신, 여러 병렬 에이전트가 협력하여 복잡한 문제를 해결함으로써 Muse Spark가 비슷한 응답 시간으로 우수한 성능을 달성할 수 있습니다. 두 가지 방법 모두 토큰당 및 시간 단위당 지능을 극대화하여 AI를 효율적이고 반응적으로 만드는 것을 목표로 합니다."
question: "사용자는 Muse Spark에 어떻게 접근할 수 있으며, Meta의 향후 계획은 무엇인가요?" answer: "Muse Spark는 meta.ai 및 Meta AI 앱을 통해 오늘부터 일반 대중에게 제공됩니다. 또한 Meta는 개인 API 미리보기를 통해 일부 사용자에게 접근 권한을 확대하여 개발자와 연구자들이 Muse Spark의 고급 기능을 통합하고 실험할 수 있도록 합니다. Muse 제품군의 첫 번째 모델인 Muse Spark는 '개인 초지능' 달성을 향한 Meta의 야심 찬 스케일링 사다리의 초기 단계를 나타냅니다. Meta는 Spark의 기반 위에 더 크고 더 유능한 모델을 개발하기 위해 계속해서 막대한 투자를 하고 있으며, 장기 에이전트 시스템 및 복잡한 코딩 워크플로우와 같은 분야의 현재 성능 격차를 해결하는 데 중점을 둔 연구를 진행하고 있습니다. '사고 모드(Contemplating mode)' 또한 모든 사용자에게 점진적으로 출시될 예정입니다."

Meta의 Muse Spark: 개인 초지능을 향한 도약

오늘 Meta Superintelligence Labs에서 정교하게 개발된 Meta의 야심 찬 Muse 제품군의 첫 번째 모델인 Muse Spark가 소개되면서 인공지능 진화의 중요한 순간을 맞이했습니다. Muse Spark는 단순한 AI 모델이 아닙니다. AI가 세상과 상호작용하고 이해하는 방식에 있어 근본적인 변화를 나타냅니다. 본질적으로 멀티모달 추론 모델로서, 텍스트에서 복잡한 시각 정보에 이르기까지 다양한 유형의 데이터를 완벽하게 통합하고 처리하여 믿을 수 없을 정도로 다재다능하고 강력한 도구가 됩니다.

Muse Spark의 핵심 기능은 외부 시스템 및 환경과 상호작용할 수 있도록 하는 강력한 도구 활용 지원과 더욱 투명하고 정교한 문제 해결을 가능하게 하는 혁신적인 시각적 사고 사슬 처리입니다. 또한, 고급 다중 에이전트 오케스트레이션은 여러 AI 에이전트를 조율하여 복잡한 작업을 협력적으로 처리할 수 있도록 지원합니다. 이번 출시는 Meta의 AI 전략을 포괄적으로 재정비한 것의 첫 번째 가시적인 결과물이며, 근본적인 연구 및 모델 훈련에서부터 Hyperion 데이터 센터와 같은 최첨단 인프라에 이르기까지 전체 AI 스택에 걸쳐 상당한 전략적 투자가 뒷받침되었습니다. Muse Spark는 meta.ai 및 Meta AI 앱을 통해 즉시 사용할 수 있으며, 일부 사용자에게는 비공개 API 미리보기가 제공됩니다.

Muse Spark의 능력으로 고급 추론 잠금 해제

Muse Spark는 멀티모달 인식, 복잡한 추론, 건강 애플리케이션 및 정교한 에이전트 워크플로우를 포함한 광범위한 AI 작업에서 경쟁력 있는 성능을 보여줍니다. Meta는 장기 에이전트 시스템 및 복잡한 코딩 워크플로우와 같이 현재 성능 격차가 있는 영역에 대한 지속적인 투자를 인정하지만, 초기 결과는 새로운 스케일링 스택의 효율성을 입증합니다. **사고 모드(Contemplating mode)**의 도입은 Muse Spark의 추론 능력을 더욱 향상시킵니다. 이 혁신적인 모드는 여러 AI 에이전트를 조율하여 병렬로 추론하게 하는 전략으로, 어려운 작업에서 성능을 크게 향상시킵니다.

사고 모드(Contemplating mode)는 "Humanity’s Last Exam"에서 58%, "FrontierScience Research"에서 38%라는 놀라운 점수를 달성하여 Muse Spark가 Gemini Deep Think 및 GPT Pro와 같은 선도적인 최첨단 모델의 극단적인 추론 능력과 경쟁할 수 있도록 포지셔닝합니다. 이 병렬 추론 접근 방식은 모델이 솔루션을 위한 여러 경로를 동시에 탐색할 수 있도록 하여 더욱 강력하고 정확한 결과를 얻을 수 있도록 합니다. meta.ai에서 사고 모드(Contemplating mode)가 점진적으로 출시됨에 따라 이러한 고급 기능이 사용자에게 점차적으로 제공되어 개인 초지능의 미래를 엿볼 수 있게 될 것입니다.

실제 적용 사례: Muse Spark의 활약

Muse Spark는 개인 초지능의 약속을 일상생활로 가져와 사용자를 매우 개인화된 방식으로 이해하고 지원하도록 설계되었습니다. 고급 추론 및 멀티모달 기능은 수많은 실제 응용 프로그램을 가능하게 합니다.

멀티모달 상호작용

멀티모달 통합을 위해 처음부터 구축된 Muse Spark는 다양한 도메인과 도구에서 시각 정보를 처리하는 데 탁월합니다. 시각적 STEM 질문, 엔티티 인식 및 지역화에서 강력한 성능을 달성합니다. 이러한 강점은 이전에는 불가능했던 대화형 경험을 가능하게 합니다.

대화형 학습: Muse Spark에게 복잡한 다이어그램을 재미있는 미니 게임으로 바꾸거나 가전제품 문제를 해결해달라고 요청하는 것을 상상해 보세요. 구성 요소를 식별하고, 대화형 튜토리얼을 만들고, 단계 위로 마우스를 가져갈 때 동적 주석으로 특정 영역을 강조할 수 있습니다.
프롬프트 예시: "커피 머신과 그라인더의 핵심 구성 요소를 식별하고, 이 기계를 사용하여 간단한 웹 페이지로 라떼를 만드는 대화형 튜토리얼을 만들어 줘. 단계를 마우스 오버하면 구성 요소의 바운딩 박스가 강조되어야 해."

개인 맞춤형 건강 통찰력

개인 초지능의 중요한 응용 프로그램은 개인이 자신의 건강을 더 잘 이해하고 관리할 수 있도록 돕는 데 있습니다. 사실적이고 포괄적인 응답을 보장하기 위해 Meta는 1,000명 이상의 의사와 협력하여 Muse Spark의 건강 추론 능력을 위한 전문 훈련 데이터를 큐레이션했습니다. 이를 통해 모델은 다음을 수행할 수 있습니다.

건강 정보 설명: 다양한 식품의 영양 성분이나 특정 운동 중 활성화되는 근육과 같은 건강 데이터를 분석하고 설명하는 대화형 디스플레이를 생성합니다.
개인 맞춤형 식단 안내: 이미지 속 음식 품목에 개인화된 권장 사항 및 건강 점수를 시각적으로 주석을 달아 개인의 건강 프로필에 따른 맞춤형 식단 조언을 제공합니다.
프롬프트 예시: "저는 고콜레스테롤을 가진 페스코 채식주의자입니다. 추천하는 음식에는 녹색 점을, 추천하지 않는 음식에는 빨간 점을 찍어주세요. 점이 중복되지 않도록 하고, 점이 적절한 위치에 표시되도록 해주세요. 점을 마우스 오버할 때, 칼로리, 탄수화물, 단백질, 지방과 함께 개인화된 근거와 10점 만점의 '건강 점수'를 보여주세요. 건강 점수 숫자는 마우스 오버하지 않고도 점 바로 위에 나타나야 합니다. 마우스 오버 시 표시되는 설명은 다른 모든 점 위에 나타나야 합니다."
피트니스 피드백: 운동 자세를 분석하고, 스트레칭되는 근육 그룹을 식별하며, 난이도를 평가하고, 실시간으로 자세에 대한 피드백을 제공하고, 파트너와의 성과를 비교할 수도 있습니다.
프롬프트 예시: "두 이미지 모두에서 어떤 근육이 스트레칭되는지, 그리고 그 난이도를 보여주세요. 점을 마우스 오버할 때, 자세를 교정하는 방법에 대한 근육 그룹에 대해 더 자세히 알려주세요. 저는 요가를 더 잘하고 싶습니다. 파트너와 나란히 놓고 우리 둘의 점수를 1점에서 10점 사이로 평가해 주세요."

스케일링 축: Muse Spark 성장의 원동력

Meta가 개인 초지능을 추구하는 것은 모델을 예측 가능하고 효율적으로 확장하는 데 달려 있습니다. Muse Spark의 개발은 사전 학습, 강화 학습 및 추론 시점 추론이라는 세 가지 중요한 스케일링 축에 대한 귀중한 통찰력을 제공했습니다.

사전 학습 효율성

사전 학습 단계는 Muse Spark가 기본 멀티모달 이해, 추론 및 코딩 능력을 확립하는 곳입니다. 지난 9개월 동안 Meta는 모델 아키텍처, 최적화 기술 및 데이터 큐레이션의 상당한 개선을 포함하여 사전 학습 스택을 완전히 재구축했습니다. 이러한 발전은 각 컴퓨팅 단위에서 파생되는 능력을 총체적으로 향상시킵니다. 일련의 소규모 모델에 대한 스케일링 법칙을 사용하여 엄격한 평가를 한 결과, 획기적인 효율성을 발견했습니다. Muse Spark는 이전 모델인 Llama 4 Maverick보다 10배 이상 적은 컴퓨팅으로 동일한 능력을 달성할 수 있습니다. 이는 Muse Spark를 기존의 선도적인 기본 모델보다 훨씬 더 효율적으로 만듭니다.

지표	Llama 4 Maverick (기준)	Muse Spark (컴퓨팅 효율성)	개선 계수
역량당 컴퓨팅	X FLOPs	< 0.1X FLOPs	> 10배
성능 등가	기준 달성	기준 달성	해당 없음

강화 학습(RL) 이점

사전 학습 후, 강화 학습은 Muse Spark의 기능을 확장 가능한 방식으로 증폭시키는 데 중요한 역할을 합니다. 대규모 RL과 관련된 내재된 불안정성에도 불구하고, Meta의 새로운 스택은 원활하고 예측 가능한 이득을 제공합니다. 이를 보여주는 플롯은 훈련 데이터의 pass@1 및 pass@16 (16번의 시도 중 최소 1번의 성공적인 시도)과 같은 지표에서 로그-선형 성장을 보여주며, 추론 다양성을 손상시키지 않으면서 모델 신뢰도가 향상됨을 나타냅니다. 중요하게도, 보류된 평가 세트에서의 정확도 성장은 이러한 RL 이득이 예측 가능하게 일반화됨을 확인합니다. 이는 Muse Spark가 훈련 중에 명시적으로 보지 못한 작업에서도 원활하게 개선됨을 의미합니다. 이는 모델의 개선 사항이 견고하고 광범위하게 적용 가능하도록 보장합니다.

추론 시점 최적화

수십억 명의 사용자에게 지능을 효율적으로 제공하기 위해 Muse Spark의 추론 시점 추론은 최적화되어야 합니다. Meta는 두 가지 주요 전략을 사용합니다.

사고 시간 패널티 및 사고 압축: RL 훈련 중에는 더 긴 사고 시간에 대한 패널티가 적용되어 모델이 토큰 사용을 최적화하면서 정확도를 극대화하도록 장려합니다. 특정 평가에서는 이것이 "상전이"로 이어집니다. 모델이 더 오래 생각하여 개선되는 초기 기간 후에 길이 패널티는 사고 압축을 유도합니다. Muse Spark는 추론을 압축하여 훨씬 적은 토큰으로 문제를 해결하는 방법을 학습합니다. 이 압축 후에는 모델이 솔루션을 다시 확장하여 훨씬 더 강력한 성능을 달성할 수 있으며, 추론 효율성에서 놀라운 적응성을 보여줍니다.
다중 에이전트 오케스트레이션: 지연 시간을 급격히 늘리지 않고 추론 시점 추론을 늘리기 위해 Meta는 협력하는 병렬 에이전트의 수를 확장합니다. 표준 추론 시점 스케일링은 단일 에이전트가 더 오래 생각하는 것을 포함하지만, Muse Spark의 다중 에이전트 접근 방식은 비슷한 응답 시간으로 우수한 성능을 허용합니다. 이 병렬 처리 능력은 사용자 친화적인 속도로 복잡한 추론을 제공하는 데 중요합니다.

Meta의 비전: 개인 초지능으로 가는 길

Muse Spark의 출시는 Meta의 개인 초지능 창출이라는 장기 비전에서 기념비적인 단계를 나타냅니다. 근본적인 연구 및 인프라에서 고급 훈련 기술에 이르기까지 AI 스택의 각 계층을 꼼꼼하게 다듬음으로써 Meta는 AI가 인간의 능력을 심오하게 이해하고 증강할 수 있는 미래를 구축하고 있습니다. Muse Spark는 멀티모달 추론, 고급 도구 활용 및 효율적인 스케일링을 통해 미래의 훨씬 더 큰 모델을 위한 견고한 기반을 마련하여 진정으로 개인화되고 지능적인 AI 동반자에 더 가까이 다가갈 수 있도록 할 것입니다. 확장 가능하고 지능적인 AI에 대한 이러한 헌신은 앞으로 몇 년 동안 우리가 기술 및 세상과 상호작용하는 방식을 형성하여 모두를 위한 AI 확장의 잠재력을 현실로 만들 것입니다.

원본 출처

https://ai.meta.com/blog/introducing-muse-spark-msl/

자주 묻는 질문

What is Muse Spark and what makes it unique?

Muse Spark is Meta's inaugural model in the 'Muse' family, developed by Meta Superintelligence Labs. It stands out as a natively multimodal reasoning model, meaning it seamlessly integrates and processes information from various modalities like text and vision. Its unique capabilities include robust tool-use functionality, visual chain of thought for complex problem-solving, and sophisticated multi-agent orchestration, enabling it to coordinate multiple AI agents for enhanced performance. This model marks a significant step in Meta's ambitious journey towards developing personal superintelligence, aiming to understand and interact with users' worlds on a deeply personal level. Its introduction signifies a foundational shift in Meta's AI strategy, built on a ground-up overhaul of their AI efforts.

What are the core capabilities of Muse Spark, particularly 'Contemplating mode'?

Muse Spark offers competitive performance across a wide array of domains, including multimodal perception, complex reasoning tasks, health-related applications, and sophisticated agentic workflows. A standout feature is its 'Contemplating mode,' which represents a significant leap in AI reasoning. This mode orchestrates multiple AI agents to reason in parallel, allowing Muse Spark to tackle highly challenging problems with enhanced depth and accuracy. This parallel processing capability positions Muse Spark to compete with the extreme reasoning modes found in other frontier models, demonstrated by its impressive scores of 58% on 'Humanity’s Last Exam' and 38% on 'FrontierScience Research.' This mode allows for more deliberate and thorough problem-solving, crucial for achieving advanced cognitive functions.

How does Muse Spark apply its multimodal capabilities in real-world scenarios?

Muse Spark leverages its native multimodal integration to create highly interactive and practical applications. For instance, it can dynamically analyze and interact with visual information to troubleshoot home appliances, offering interactive tutorials with bounding box highlights and step-by-step guidance. In the realm of health, it can process visual data of food items or exercise routines to provide personalized insights, such as nutritional content, muscle activation, and even health scores with justifications, curated in collaboration with medical professionals. These capabilities enable Muse Spark to analyze immediate environments, support wellness, and generate engaging interactive experiences like mini-games, making AI more intuitive and helpful in daily life.

What strategic investments has Meta made to scale Muse Spark and future AI models?

To support the continued scaling of Muse Spark and its successors, Meta has undertaken strategic investments across its entire AI stack. This includes a comprehensive overhaul of its research methodologies, optimizing model training pipelines, and significantly upgrading its infrastructure, notably through the development of the Hyperion data center. A key aspect of these investments is a complete rebuild of the pretraining stack, which has led to substantial improvements in model architecture, optimization algorithms, and data curation techniques. These advancements have dramatically increased the efficiency of Meta's AI development, allowing them to extract greater capabilities from every unit of computational power and ensure predictable, efficient scaling towards the goal of personal superintelligence.

How has Meta achieved significant compute efficiency with Muse Spark compared to previous models?

Meta has achieved remarkable compute efficiency with Muse Spark through a rigorous overhaul of its pretraining stack. By implementing improvements in model architecture, optimization strategies, and data curation, they can now extract significantly more capability from the same amount of computational resources. Evaluations have shown that Muse Spark can reach the same performance levels with over an order of magnitude less compute compared to Meta's previous model, Llama 4 Maverick. This efficiency gain is not only a testament to their innovative engineering but also positions Muse Spark as a highly competitive model in terms of resource utilization against other leading base models. This breakthrough is critical for accelerating the development of larger, more powerful models.

Explain the role of Reinforcement Learning (RL) in Muse Spark's development.

Reinforcement Learning (RL) plays a crucial role in amplifying Muse Spark's capabilities post-pretraining. Despite the inherent instability often associated with large-scale RL, Meta's new stack ensures smooth and predictable gains. RL systematically improves the model's reliability and reasoning diversity, as evidenced by log-linear growth in pass@1 and pass@16 metrics on training data. Crucially, these improvements generalize effectively to unseen tasks, demonstrating that the gains from RL are not merely rote memorization but true capability enhancements. This predictable scaling of RL compute allows Muse Spark to continuously improve its ability to perform complex tasks, ensuring the model remains adaptable and performs well beyond its initial training scope.

What is 'thought compression' and 'multi-agent orchestration' in the context of Muse Spark's test-time reasoning?

In Muse Spark's test-time reasoning, 'thought compression' refers to the model's ability to condense its reasoning process to solve problems using significantly fewer tokens, driven by 'thinking time penalties' during RL training. Initially, the model might 'think longer' to improve, but as penalties increase, it learns to achieve similar or better results more concisely. After this compression phase, it can then extend its solutions for even stronger performance. 'Multi-agent orchestration' is a technique to scale test-time reasoning without drastically increasing latency. Instead of a single agent thinking longer, multiple parallel agents collaborate to solve complex problems, allowing Muse Spark to achieve superior performance with comparable response times. Both methods aim to maximize intelligence per token and per unit of time, making the AI efficient and responsive.

How can users access Muse Spark, and what are Meta's future plans for it?

Muse Spark is available today to the general public via [meta.ai](https://meta.ai/) and the Meta AI app. Additionally, Meta is extending access to select users through a private API preview, allowing developers and researchers to integrate and experiment with its advanced capabilities. As the first model in the Muse family, Muse Spark represents an initial step on Meta's ambitious scaling ladder towards achieving 'personal superintelligence.' Meta continues to invest heavily in developing larger, more capable models building upon Spark's foundation, with ongoing research focused on addressing current performance gaps in areas like long-horizon agentic systems and complex coding workflows. The 'Contemplating mode' will also be rolling out gradually to all users.