xAIAugust 13, 2024· Multimodal

Grok 2

Name: Grok 2
Author: xAI

Trained on Colossus, xAI's 100K GPU cluster, first competitive Grok

BENCHMARKS

Benchmark	Score	Rank
ARC-C Grade-school science questions requiring reasoning	96.4%	#26 / 40
HumanEval Coding ability - generating correct Python functions	88.4%	#35 / 50
MMLU Tests knowledge across 57 subjects from STEM to humanities	87.5%	#36 / 54
MATH Competition-level mathematics problems	76.1%	#37 / 50
MMMUvals.ai College-level multimodal reasoning across 30+ disciplines	57.3%	#42 / 46
Arena Elo Human preference ranking via blind comparisons	1256	#45 / 51
GPQA PhD-level science questions even experts struggle with	56%	#64 / 73