updated evaluation fucntion to pass

HarrySu123 · HarrySu123 · commit a7a6f3547025 · 2026-02-08T23:19:18.000Z
diff --git a/evaluation_function/evaluation.py b/evaluation_function/evaluation.py
@@ -1,7 +1,7 @@
 from typing import Any
 from lf_toolkit.evaluation import Result, Params
 
-from evaluation_function.domain.evaluators import *
+from evaluation_function.domain.evaluators import _extract_atoms, EquivalenceEvaluator, SatisfiabilityEvaluator, TautologyEvaluator
 from evaluation_function.domain.formula import *
 
 from evaluation_function.parsing.parser import formula_parser
@@ -40,7 +40,16 @@ def evaluation_function(
 
 
     if not isinstance(answer, str):
-        raise Exception("Answer must be a string/text.")
+        return Result(
+            is_correct=False,
+            feedback_items=[("incorrect input", "missing answer object")]
+        )
+
+    if not isinstance(response, dict):
+        return Result(
+            is_correct=False,
+            feedback_items=[("incorrect input", "missing response object")]
+        )
 
         
     response_formula = response.get("formula", None)
diff --git a/evaluation_function/evaluation_test.py b/evaluation_function/evaluation_test.py
@@ -22,60 +22,142 @@ class TestEvaluationFunction(unittest.TestCase):
     """
 
     def test_evaluation_default(self):
-        response, answer, params = "Hello, World", "Hello, World", Params()
+        response = {"formula": "Hello, World"}
+        answer = "Hello, World"
+        params = Params()
 
         result = evaluation_function(response, answer, params).to_dict()
 
         self.assertEqual(result.get("is_correct"), False)
-        self.assertFalse(len(result.get("feedback", [])) == 0)
 
     def test_check_tautology(self):
-        
-        response, answer, params = "p ∨ ¬p", "", {"tautology": True}
+        response = {"formula": "p ∨ ¬p"}
+        answer = ""
+        params = {"tautology": True}
 
         result = evaluation_function(response, answer, params).to_dict()
 
         self.assertTrue(result.get("is_correct"))
 
     def test_check_tautology_fail(self):
-        
-        response, answer, params = "p ∧ ¬p", "", {"tautology": True}
+        response = {"formula": "p ∧ ¬p"}
+        answer = ""
+        params = {"tautology": True}
 
         result = evaluation_function(response, answer, params).to_dict()
 
         self.assertFalse(result.get("is_correct"))
 
-    
     def test_check_satisfiability(self):
-        
-        response, answer, params = "p ∧ q", "", {"satisfiability": True}
+        response = {"formula": "p ∧ q"}
+        answer = ""
+        params = {"satisfiability": True}
 
         result = evaluation_function(response, answer, params).to_dict()
 
         self.assertTrue(result.get("is_correct"))
     
     def test_check_satisfiability_fail(self):
-        
-        response, answer, params = "p ∧ ¬p", "", {"satisfiability": True}
+        response = {"formula": "p ∧ ¬p"}
+        answer = ""
+        params = {"satisfiability": True}
 
         result = evaluation_function(response, answer, params).to_dict()
 
         self.assertFalse(result.get("is_correct"))
 
-    
     def test_check_equivalence(self):
-        
-        response, answer, params = "p ∧ q", "p ∧ (q ∨ q)", {"equivalence": True}
+        response = {"formula": "p ∧ q"}
+        answer = "p ∧ (q ∨ q)"
+        params = {"equivalence": True}
 
         result = evaluation_function(response, answer, params).to_dict()
 
         self.assertTrue(result.get("is_correct"))
     
     def test_check_equivalence_fail(self):
-        
-        response, answer, params = "p ∧ q", "p", {"equivalence": True}
+        response = {"formula": "p ∧ q"}
+        answer = "p"
+        params = {"equivalence": True}
 
         result = evaluation_function(response, answer, params).to_dict()
 
         self.assertFalse(result.get("is_correct"))
-    
+
+    def test_truth_table_valid(self):
+        response = {
+            "formula": "p ∧ q",
+            "truthTable": {
+                "variables": ["p", "q", "p ∧ q"],
+                "cells": [
+                    ["tt", "tt", "tt"],
+                    ["tt", "ff", "ff"],
+                    ["ff", "tt", "ff"],
+                    ["ff", "ff", "ff"]
+                ]
+            }
+        }
+        answer = "p ∧ q"
+        params = {"equivalence": True}
+
+        result = evaluation_function(response, answer, params).to_dict()
+
+        self.assertTrue(result.get("is_correct"))
+
+    def test_truth_table_invalid(self):
+        response = {
+            "formula": "p ∧ q",
+            "truthTable": {
+                "variables": ["p", "q", "p ∧ q"],
+                "cells": [
+                    ["tt", "tt", "ff"],  # Wrong value
+                    ["tt", "ff", "ff"],
+                    ["ff", "tt", "ff"],
+                    ["ff", "ff", "ff"]
+                ]
+            }
+        }
+        answer = "p ∧ q"
+        params = {"equivalence": True}
+
+        result = evaluation_function(response, answer, params).to_dict()
+
+        self.assertFalse(result.get("is_correct"))
+
+    def test_invalid_response_type(self):
+        response = "just a string"  # Invalid type
+        answer = "p"
+        params = {"tautology": True}
+
+        result = evaluation_function(response, answer, params).to_dict()
+
+        self.assertFalse(result.get("is_correct"))
+        self.assertIn("feedback", result)
+
+    def test_missing_formula_field(self):
+        response = {"wrongField": "p"}
+        answer = "p"
+        params = {"tautology": True}
+
+        result = evaluation_function(response, answer, params).to_dict()
+
+        self.assertFalse(result.get("is_correct"))
+
+    def test_no_params_selected(self):
+        response = {"formula": "p"}
+        answer = "p"
+        params = {}
+
+        result = evaluation_function(response, answer, params).to_dict()
+
+        self.assertFalse(result.get("is_correct"))
+
+    def test_multiple_params_selected(self):
+        response = {"formula": "p"}
+        answer = "p"
+        params = {"tautology": True, "satisfiability": True}
+
+        result = evaluation_function(response, answer, params).to_dict()
+
+        self.assertFalse(result.get("is_correct"))
+
diff --git a/evaluation_function/truth_table/truth_table_evaluate_tests.py b/evaluation_function/truth_table/truth_table_evaluate_tests.py
@@ -181,6 +181,33 @@ def test_complex_formula(self):
         result = evaluate_truth_table(variables, cells, 2)
         self.assertTrue(result.is_correct)
 
+    def test_three_atoms(self):
+        """Test a valid truth table with three atoms"""
+        variables = ["p", "q", "r", "p ∧ q ∧ r"]
+        cells = [
+            ["tt", "tt", "tt", "tt"],
+            ["tt", "tt", "ff", "ff"],
+            ["tt", "ff", "tt", "ff"],
+            ["tt", "ff", "ff", "ff"],
+            ["ff", "tt", "tt", "ff"],
+            ["ff", "tt", "ff", "ff"],
+            ["ff", "ff", "tt", "ff"],
+            ["ff", "ff", "ff", "ff"]
+        ]
+        result = evaluate_truth_table(variables, cells, 3)
+        self.assertTrue(result.is_correct)
+
+    def test_only_atoms(self):
+        """Test truth table with only atom columns"""
+        variables = ["p", "q"]
+        cells = [
+            ["tt", "tt"],
+            ["tt", "ff"],
+            ["ff", "tt"],
+            ["ff", "ff"]
+        ]
+        result = evaluate_truth_table(variables, cells, 2)
+        self.assertTrue(result.is_correct)
 
 if __name__ == '__main__':
     unittest.main()