Add configurable prefetch limit and score threshold for mem0

- Add prefetch_limit config (default: 3) to control max memories returned - Add prefetch_score_threshold config (default: 60%) to filter low-similarity results - Add error messages when Mem0 API is unavailable - Fix circuit breaker to not trip on successful API calls with no matching memories - Properly type-convert config values from JSON
2026-04-12 17:12:02 +02:00
parent e517b25360
commit 7d4cd463d7
1 changed files with 55 additions and 8 deletions
@@ -46,6 +46,8 @@ def _load_config() -> dict:
        "agent_id": os.environ.get("MEM0_AGENT_ID", "hermes"),
        "rerank": True,
        "timeout": 10.0,
+        "prefetch_limit": 3,
+        "prefetch_score_threshold": 60,
    }

    config_path = get_hermes_home() / "mem0-local.json"
@@ -146,6 +148,8 @@ class Mem0LocalMemoryProvider(MemoryProvider):
        self._user_id = "hermes-user"
        self._agent_id = "hermes"
        self._rerank = True
+        self._prefetch_limit = 3
+        self._prefetch_score_threshold = 60
        self._prefetch_result = ""
        self._prefetch_lock = threading.Lock()
        self._prefetch_thread = None
@@ -206,6 +210,16 @@ class Mem0LocalMemoryProvider(MemoryProvider):
                "description": "Request timeout in seconds",
                "default": "10.0",
            },
+            {
+                "key": "prefetch_limit",
+                "description": "Max memories to prefetch (pre-LLM hook)",
+                "default": "3",
+            },
+            {
+                "key": "prefetch_score_threshold",
+                "description": "Min similarity score % to include memory (0-100)",
+                "default": "60",
+            },
        ]

    def _get_client(self) -> LocalMem0Client:
@@ -219,6 +233,10 @@ class Mem0LocalMemoryProvider(MemoryProvider):
                self._user_id = self._config.get("user_id", "hermes-user")
                self._agent_id = self._config.get("agent_id", "hermes")
                self._rerank = self._config.get("rerank", True)
+                self._prefetch_limit = int(self._config.get("prefetch_limit", 3))
+                self._prefetch_score_threshold = int(
+                    self._config.get("prefetch_score_threshold", 60)
+                )
            base_url = self._config.get("base_url", "http://localhost:8000")
            timeout = float(self._config.get("timeout", 10.0))
            self._client = LocalMem0Client(base_url, timeout=timeout)
@@ -267,6 +285,10 @@ class Mem0LocalMemoryProvider(MemoryProvider):
        )
        self._agent_id = self._config.get("agent_id", "hermes")
        self._rerank = self._config.get("rerank", True)
+        self._prefetch_limit = int(self._config.get("prefetch_limit", 3))
+        self._prefetch_score_threshold = int(
+            self._config.get("prefetch_score_threshold", 60)
+        )

    def system_prompt_block(self) -> str:
        return (
@@ -290,27 +312,39 @@ class Mem0LocalMemoryProvider(MemoryProvider):
            self._prefetch_result = ""
        if not result:
            return ""
+        # Check if it's an error message
+        if result.startswith("ERROR:"):
+            return f"## Mem0 Error\n{result[6:]}"
        return f"## Mem0 Memory\n{result}"

    def queue_prefetch_and_get(self, query: str) -> str:
        """Sync prefetch for pre_llm_call hook - returns memory context immediately."""
        if self._is_breaker_open():
-            return ""
+            return (
+                "ERROR:Memory service temporarily unavailable. Please try again later."
+            )
        try:
            client = self._get_client()
            results = client.search(
                query=query,
                user_id=self._user_id,
-                limit=5,
+                limit=self._prefetch_limit,
            )
-            if results:
-                formatted = self._format_search_results(results)
+            # Filter by score threshold
+            threshold = self._prefetch_score_threshold / 100.0
+            filtered = [r for r in results if r.get("score", 0) >= threshold]
+            if filtered:
+                formatted = self._format_search_results(filtered)
                if formatted:
                    self._record_success()
                    return formatted
+            self._record_success()
        except Exception as e:
            self._record_failure()
            logger.debug("Mem0 prefetch failed: %s", e)
+            return (
+                "ERROR:Memory service temporarily unavailable. Please try again later."
+            )
        return ""

    def queue_prefetch(self, query: str, *, session_id: str = "") -> None:
@@ -321,6 +355,8 @@ class Mem0LocalMemoryProvider(MemoryProvider):
            session_id: Unused. Kept for API compatibility.
        """
        if self._is_breaker_open():
+            with self._prefetch_lock:
+                self._prefetch_result = "ERROR:Memory service temporarily unavailable. Please try again later."
            return

        def _run():
@@ -329,16 +365,24 @@ class Mem0LocalMemoryProvider(MemoryProvider):
                results = client.search(
                    query=query,
                    user_id=self._user_id,
-                    limit=5,
+                    limit=self._prefetch_limit,
                )
-                if results:
-                    formatted = self._format_search_results(results)
+                # Filter by score threshold
+                threshold = self._prefetch_score_threshold / 100.0
+                filtered = [r for r in results if r.get("score", 0) >= threshold]
+                if filtered:
+                    formatted = self._format_search_results(filtered)
                    with self._prefetch_lock:
                        self._prefetch_result = formatted
+                else:
+                    with self._prefetch_lock:
+                        self._prefetch_result = ""
                self._record_success()
            except Exception as e:
                self._record_failure()
                logger.debug("Mem0 prefetch failed: %s", e)
+                with self._prefetch_lock:
+                    self._prefetch_result = "ERROR:Memory service temporarily unavailable. Please try again later."

        self._prefetch_thread = threading.Thread(
            target=_run, daemon=True, name="mem0-local-prefetch"
@@ -504,7 +548,10 @@ def register(ctx) -> None:
        try:
            results = provider.queue_prefetch_and_get(user_message)
            if results:
-                return {"context": results}
+                # Error messages get their own header, memories get standard header
+                if results.startswith("ERROR:"):
+                    return {"context": f"## Mem0 Error\n{results[6:]}"}
+                return {"context": f"## Mem0 Memory\n{results}"}
        except Exception as e:
            logger.debug("Mem0 pre_llm_call hook failed: %s", e)
        return {}