Atlas Graph Explorer

eval-run:gpqa.claude-haiku-4-5.2025-10

EvalRunbenchmarks/eval-runs/eval-runs-anthropic.yaml·Open in Graph →

{
  "id": "eval-run:gpqa.claude-haiku-4-5.2025-10",
  "_kind": "EvalRun",
  "_file": "benchmarks/eval-runs/eval-runs-anthropic.yaml",
  "_cluster": "benchmarks",
  "attributes": {
    "target": "model:claude-haiku-4-5@current",
    "benchmarkId": "benchmark:mmlu",
    "testSetId": "test-set:swe-bench-verified-2024-12",
    "targetId": "model:claude-haiku-4-5@current",
    "runAt": "2025-10-15T00:00:00Z",
    "runBy": "anthropic",
    "configHash": "sha256:placeholder-claude-haiku-4-5-gpqa"
  },
  "outgoingEdges": [
    {
      "from": "eval-run:gpqa.claude-haiku-4-5.2025-10",
      "to": "model:claude-haiku-4-5@current",
      "kind": "evaluates_target"
    },
    {
      "from": "eval-run:gpqa.claude-haiku-4-5.2025-10",
      "to": "benchmark:mmlu",
      "kind": "for_benchmark"
    }
  ],
  "incomingEdges": [
    {
      "from": "eval-result:gpqa.claude-haiku-4-5.001",
      "to": "eval-run:gpqa.claude-haiku-4-5.2025-10",
      "kind": "belongs_to_eval_run"
    }
  ]
}