Agentic AI Atlas

Agentic AI Atlasby a5c.ai

GitHub Docs Discord

Dark mode

iiRecord

Agentic AI Atlas · eval-run:swe-bench.llama-3-1-405b.2024-07

eval-run:swe-bench.llama-3-1-405b.2024-07a5c.ai

II.

EvalRun overview

eval-run:swe-bench.llama-3-1-405b.2024-07

Reference · live

eval-run:swe-bench.llama-3-1-405b.2024-07 overview

Inspect the raw attributes, linked wiki pages, and inbound or outbound graph edges for eval-run:swe-bench.llama-3-1-405b.2024-07.

EvalRunOutgoing · 3Incoming · 1

Attributes

target

model:llama-3-1-405b-instruct@current

benchmarkId

benchmark:swe-bench-verified

testSetId

test-set:swe-bench-verified-2024-12

targetId

model:llama-3-1-405b-instruct@current

runAt

2024-07-23T00:00:00Z

runBy

artificial-analysis

configHash

sha256:placeholder-llama-3-1-405b-swebench

Outgoing edges

evaluates_target1

model:llama-3-1-405b-instruct@current·ModelVersionLlama 3.1 405B Instruct

for_benchmark1

benchmark:swe-bench-verified·BenchmarkSWE-bench Verified

uses_test_set1

test-set:swe-bench-verified-2024-12·TestSetSWE-bench Verified 2024-12

Incoming edges

belongs_to_eval_run1

eval-result:swe-bench.llama-3-1-405b.001·EvalResult