copy googles changes. Fix tests. Improve LLM file (#1737)

* copy googles changes. Fix tests. Improve LLM file * Fix type issue
2026-01-10 00:28:31 +00:00 · 2024-12-10 11:14:37 -05:00
parent 7d85046eb6
commit e2f71464ed
2 changed files with 39 additions and 6 deletions
--- a/src/crewai/llm.py
+++ b/src/crewai/llm.py
@@ -43,6 +43,10 @@ LLM_CONTEXT_WINDOW_SIZES = {
    "gpt-4-turbo": 128000,
    "o1-preview": 128000,
    "o1-mini": 128000,
+    # gemini
+    "gemini-1.5-pro": 2097152,
+    "gemini-1.5-flash": 1048576,
+    "gemini-1.5-flash-8b": 1048576,
    # deepseek
    "deepseek-chat": 128000,
    # groq
@@ -61,6 +65,9 @@ LLM_CONTEXT_WINDOW_SIZES = {
    "mixtral-8x7b-32768": 32768,
 }

+DEFAULT_CONTEXT_WINDOW_SIZE = 8192
+CONTEXT_WINDOW_USAGE_RATIO = 0.75
+

@contextmanager
 def suppress_warnings():
@@ -124,6 +131,7 @@ class LLM:
        self.api_version = api_version
        self.api_key = api_key
        self.callbacks = callbacks
+        self.context_window_size = 0
        self.kwargs = kwargs

        litellm.drop_params = True
@@ -191,7 +199,16 @@ class LLM:

    def get_context_window_size(self) -> int:
        # Only using 75% of the context window size to avoid cutting the message in the middle
-        return int(LLM_CONTEXT_WINDOW_SIZES.get(self.model, 8192) * 0.75)
+        if self.context_window_size != 0:
+            return self.context_window_size
+
+        self.context_window_size = int(
+            DEFAULT_CONTEXT_WINDOW_SIZE * CONTEXT_WINDOW_USAGE_RATIO
+        )
+        for key, value in LLM_CONTEXT_WINDOW_SIZES.items():
+            if self.model.startswith(key):
+                self.context_window_size = int(value * CONTEXT_WINDOW_USAGE_RATIO)
+        return self.context_window_size

    def set_callbacks(self, callbacks: List[Any]):
        callback_types = [type(callback) for callback in callbacks]