GPT-4o(오픈AI), 클로
그 결과 그록3가 GPT-4o(오픈AI), 클로드 3.
5 소네트(앤트로픽), V3(딥시크) 등 경쟁 모델보다 수학, 과학, 코딩벤치마크에서 높은 성과를 보였다는 게 머스크 CEO의 주장이다.
'미국 수학경시대회(AIME) 2024' 문제로 모델을 평가한 결과 딥시크 V3는 39%, 클로드 3.
5 소네트는 26% 등의 정답률을 기록한 반면.
글로벌 채권 금리벤치마크인 미 국채 10년물 금리는 전거래일 보다 4bp(1bp=0.
51%, 통화정책에 민감한 미 국채 2년물 금리는 2bp 상승한 4.
유럽 정상들이 군비 지출 확대에 나설 것이란 전망에 국채 금리가 오르고, 그 여파로 미 국채 금리도 상승세다.
그록 3는 최신벤치마크테스트에서 기존 AI 모델들을 압도하는 성능을 보여주며 그 잠재력을 입증했다.
특히 미국 수학경시대회(AIME) 문제를 활용한 테스트에서 52점을 기록, 제미나이 2 프로(Gemini 2 Pro, 36점), 딥시크 V3(DeepSeek V3, 39점), GPT-4o(9점)를 크게 앞질렀다.
최신벤치마크테스트(출처:발표.
블룸버그통신에 따르면 xAI는 이날 라이브스트림으로 진행된 발표회에서 그록3가 수학, 과학, 코딩벤치마크테스트에서 알파벳의 구글 제미나이, 딥시크의 V3 모델, 앤스로픽의 클로드, 오픈AI의 GPT-4o를 능가한다고 설명했다.
일론 머스크 테슬라 최고경영자(오른쪽)가 18일(현지시간) 자신이 이끄는.
자율성 확대되는 AI 에이전트.
2024년 말 급격히 증가 허깅페이스(Hugging Face)의 연구진들이 발표한 논문에 따르면, 대규모 언어모델(LLM)의벤치마크정확도가 급격히 향상되면서 2024년 말부터 자율적이고 목표 지향적인 시스템인 'AI 에이전트'가 차세대 AI 기술로 부상하고 있다.
현재 많은 AI 에이전트들은 LLM을.
xAI는 현지시간 17일 라이브 스트리밍으로 중계된 발표에서 그록 3이 수학과 과학, 코딩벤치마크테스트에서 오픈AI의 GPT-4o와 중국의 딥시크의 V3 모델 등을 앞섰다고 설명했습니다.
이 회사의 엔지니어 3명과 함께 등장한 머스크는 그록 3이 "지구에서 가장 똑똑한 AI"라며 특히 연산 능력이 이전 버전.
xAI 측은 그록3 기본 모델이 수학, 과학 및 코딩벤치마크(성능 평가 지표) 전반에서 구글 제미나이 2.
0 프로, 딥시크 V3, 앤스로픽의 클로드 3.
5 소네트, 오픈AI의 GTP-4o를 능가했다고 밝혔다.
그록3 추론형 모델 역시 오픈AI의 최신 추론 모델 ‘o3-미니 하이’와 딥시크 ‘R1’보다 미국 수학경시대회인 AIME.
xAI는 '그록3'가 수학과 과학, 코딩벤치마크테스트에서 오픈AI의 'GPT-4o'와 중국의 딥시크의 'V3' 모델 등을 앞섰다고 설명했습니다.
이 회사의 엔지니어 3명과 함께 등장한 머스크는 '그록3'가 "지구에서 가장 똑똑한 AI"라며 특히 연산 능력이 이전 버전 대비 10배가 넘는다고 주장했습니다.
xAI가 발표한 그록3의벤치마크테스트 결과.
[사진=xAI]벤치마크점수 '최상위권' 막대한 자원을 활용한 만큼 성능도 뛰어난 것으로 보인다.
이들에 따르면, 그록 3는 △일반적인 수학적 추론 능력 △과학 및 STEM(과학·기술·공학·수학) 분야 지식 △컴퓨터 과학 코딩 능력 등 3가지 핵심 영역에서.
하루 전 시진핑 주석과 기업 지도자들간의 회동으로 올랐던 중국 본토의벤치마크주가 지수와 홍콩 기술 주식은 3년만의 최고치에서 하락으로 돌아섰다.
IG 마켓의 분석가 토니 시커모어는 "유럽의 방위비가 GDP 대비 5% 목표에 근접하면 라인메탈, SAAB, BAE 시스템스, 티센크룹프, 탈레스 같은 방위 기업들의.