Atlas Graph Explorer

eval-result:human-eval.llama-3-3-70b.001

EvalResultbenchmarks/eval-results/eval-results-meta.yaml·Open in Graph →

{
  "id": "eval-result:human-eval.llama-3-3-70b.001",
  "_kind": "EvalResult",
  "_file": "benchmarks/eval-results/eval-results-meta.yaml",
  "_cluster": "benchmarks",
  "attributes": {
    "evalRunId": "eval-run:human-eval.llama-3-3-70b.2024-12",
    "metricName": "pass@1",
    "score": 0.884,
    "unit": "fraction",
    "passFail": "pass",
    "reportedAt": "2024-12-06T00:00:00Z"
  },
  "outgoingEdges": [
    {
      "from": "eval-result:human-eval.llama-3-3-70b.001",
      "to": "eval-run:human-eval.llama-3-3-70b.2024-12",
      "kind": "belongs_to_eval_run"
    }
  ],
  "incomingEdges": []
}