Spaces:

CoreyMorris
/

MMLU-by-task-Leaderboard

Running

Corey Morris commited on Sep 30, 2023

Commit

1a1910c

•

1 Parent(s): d96fdf9

WIP. Loading data from csv

Files changed (2) hide show

app.py CHANGED Viewed

@@ -9,19 +9,8 @@ from streamlit.components.v1 import html
 st.set_page_config(layout="wide")
-# Google Analytics code snippet
-google_analytics_code = """
-<!-- Google tag (gtag.js) -->
-<script async src="https://www.googletagmanager.com/gtag/js?id=G-MT9QYR70MC"></script>
-<script>
-  window.dataLayer = window.dataLayer || [];
-  function gtag(){dataLayer.push(arguments);}
-  gtag('js', new Date());
-  gtag('config', 'G-MT9QYR70MC');
-</script>
-"""
-html(google_analytics_code, height=0)
 def plot_top_n(df, target_column, n=10):
@@ -135,6 +124,10 @@ st.markdown("""
             [Preliminary analysis of MMLU-by-Task data](https://coreymorrisdata.medium.com/preliminary-analysis-of-mmlu-evaluation-data-insights-from-500-open-source-models-e67885aa364b)
             """)
 filters = st.checkbox('Select Models and/or Evaluations')
 # Initialize selected columns with "Parameters" and "MMLU_average" if filters are checked

 st.set_page_config(layout="wide")
+def load_csv_data(file_path):
+    return pd.read_csv(file_path)
 def plot_top_n(df, target_column, n=10):
             [Preliminary analysis of MMLU-by-Task data](https://coreymorrisdata.medium.com/preliminary-analysis-of-mmlu-evaluation-data-insights-from-500-open-source-models-e67885aa364b)
             """)
+# Load the data into memory
+data_path = "result_data.csv"  # Replace with your actual file path
+data_df = load_csv_data(data_path)
 filters = st.checkbox('Select Models and/or Evaluations')
 # Initialize selected columns with "Parameters" and "MMLU_average" if filters are checked

result_data_processor.py CHANGED Viewed

@@ -156,6 +156,10 @@ class ResultDataProcessor:
         data = self.manual_removal_of_models(data)
         return data
     def manual_removal_of_models(self, df):

         data = self.manual_removal_of_models(data)
+        # save to csv with the current date as part of the filename
+        data.to_csv(f'processed_data_{pd.Timestamp.now().strftime("%Y-%m-%d")}.csv')
         return data
     def manual_removal_of_models(self, df):