ValiantLabs
/

Llama3.1-8B-Cobalt

Model card Files Files and versions Community

sequelbox commited on Oct 3

Commit

5cee3b3

•

1 Parent(s): 51c6fd5

eval

Files changed (1) hide show

README.md +6 -6

README.md CHANGED Viewed

@@ -37,7 +37,7 @@ model-index:
         num_few_shot: 0
     metrics:
     - type: inst_level_strict_acc and prompt_level_strict_acc
-      value: 73.94
       name: strict accuracy
     source:
       url: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=ValiantLabs/Llama3.1-8B-Cobalt
@@ -52,7 +52,7 @@ model-index:
         num_few_shot: 3
     metrics:
     - type: acc_norm
-      value: 27.53
       name: normalized accuracy
     source:
       url: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=ValiantLabs/Llama3.1-8B-Cobalt
@@ -67,7 +67,7 @@ model-index:
         num_few_shot: 4
     metrics:
     - type: exact_match
-      value: 15.48
       name: exact match
     source:
       url: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=ValiantLabs/Llama3.1-8B-Cobalt
@@ -82,7 +82,7 @@ model-index:
         num_few_shot: 0
     metrics:
     - type: acc_norm
-      value: 4.47
       name: acc_norm
     source:
       url: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=ValiantLabs/Llama3.1-8B-Cobalt
@@ -97,7 +97,7 @@ model-index:
         num_few_shot: 0
     metrics:
     - type: acc_norm
-      value: 5.08
       name: acc_norm
     source:
       url: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=ValiantLabs/Llama3.1-8B-Cobalt
@@ -114,7 +114,7 @@ model-index:
         num_few_shot: 5
     metrics:
     - type: acc
-      value: 29.56
       name: accuracy
     source:
       url: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=ValiantLabs/Llama3.1-8B-Cobalt

         num_few_shot: 0
     metrics:
     - type: inst_level_strict_acc and prompt_level_strict_acc
+      value: 71.68
       name: strict accuracy
     source:
       url: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=ValiantLabs/Llama3.1-8B-Cobalt
         num_few_shot: 3
     metrics:
     - type: acc_norm
+      value: 27.24
       name: normalized accuracy
     source:
       url: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=ValiantLabs/Llama3.1-8B-Cobalt
         num_few_shot: 4
     metrics:
     - type: exact_match
+      value: 15.33
       name: exact match
     source:
       url: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=ValiantLabs/Llama3.1-8B-Cobalt
         num_few_shot: 0
     metrics:
     - type: acc_norm
+      value: 4.81
       name: acc_norm
     source:
       url: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=ValiantLabs/Llama3.1-8B-Cobalt
         num_few_shot: 0
     metrics:
     - type: acc_norm
+      value: 4.7
       name: acc_norm
     source:
       url: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=ValiantLabs/Llama3.1-8B-Cobalt
         num_few_shot: 5
     metrics:
     - type: acc
+      value: 29.59
       name: accuracy
     source:
       url: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=ValiantLabs/Llama3.1-8B-Cobalt