adding in lorenze feedback

2026-01-09 08:08:32 +00:00 · 2024-11-07 12:10:09 -05:00
parent 86ede8344c
commit 7b59c5b049
3 changed files with 83 additions and 85 deletions
--- a/src/crewai/agent.py
+++ b/src/crewai/agent.py
@@ -126,7 +126,7 @@ class Agent(BaseAgent):
        default="safe",
        description="Mode for code execution: 'safe' (using Docker) or 'unsafe' (direct execution).",
    )
-    # TODO: We need to add in knowledge config (score, top_k, etc)
+    # TODO: Lorenze add knowledge_embedder. Support direct class or config dict.
    _knowledge: Optional[Knowledge] = PrivateAttr(default=None)
    @model_validator(mode="after")
@@ -279,10 +279,8 @@ class Agent(BaseAgent):
        if self._knowledge:
            # Query the knowledge base for relevant information
            knowledge_snippets = self._knowledge.query(query=task.prompt())
            print("knowledge_snippets", knowledge_snippets)
            if knowledge_snippets:
                formatted_knowledge = "\n".join(knowledge_snippets)
                print("formatted_knowledge", formatted_knowledge)
                task_prompt += f"\n\nAdditional Information:\n{formatted_knowledge}"
        tools = tools or self.tools or []
--- a/src/crewai/knowledge/embedder/ollama.py
+++ b/src/crewai/knowledge/embedder/ollama.py
@@ -0,0 +1,82 @@
 import os
 from typing import List, Optional
 import numpy as np
 from openai import OpenAI
 from .base_embedder import BaseEmbedder
 class OllamaEmbedder(BaseEmbedder):
    """
    A wrapper class for text embedding models using Ollama's API
    """
    def __init__(
        self,
        model_name: str,
        api_key: Optional[str] = None,
        base_url: str = "http://localhost:11434/v1",
    ):
        """
        Initialize the embedding model
        Args:
            model_name: Name of the model to use
            api_key: API key (defaults to 'ollama' or environment variable 'OLLAMA_API_KEY')
            base_url: Base URL for the Ollama API (default is 'http://localhost:11434/v1')
        """
        self.model_name = model_name
        self.api_key = api_key or os.getenv("OLLAMA_API_KEY") or "ollama"
        self.base_url = base_url
        self.client = OpenAI(base_url=self.base_url, api_key=self.api_key)
    def embed_chunks(self, chunks: List[str]) -> List[np.ndarray]:
        """
        Generate embeddings for a list of text chunks
        Args:
            chunks: List of text chunks to embed
        Returns:
            List of embeddings
        """
        return self.embed_texts(chunks)
    def embed_texts(self, texts: List[str]) -> List[np.ndarray]:
        """
        Generate embeddings for a list of texts
        Args:
            texts: List of texts to embed
        Returns:
            List of embeddings
        """
        embeddings = []
        max_batch_size = 2048  # Adjust batch size if necessary
        for i in range(0, len(texts), max_batch_size):
            batch = texts[i : i + max_batch_size]
            response = self.client.embeddings.create(input=batch, model=self.model_name)
            batch_embeddings = [np.array(item.embedding) for item in response.data]
            embeddings.extend(batch_embeddings)
        return embeddings
    def embed_text(self, text: str) -> np.ndarray:
        """
        Generate embedding for a single text
        Args:
            text: Text to embed
        Returns:
            Embedding array
        """
        return self.embed_texts([text])[0]
    @property
    def dimension(self) -> int:
        """Get the dimension of the embeddings"""
        # Embedding dimensions may vary; we'll determine it dynamically
        test_embed = self.embed_text("test")
        return len(test_embed)
--- a/src/crewai/knowledge/embedder/ollama_embedder.py
+++ b/src/crewai/knowledge/embedder/ollama_embedder.py
@@ -1,82 +0,0 @@
 import os
 from typing import List, Optional
 import numpy as np
 from openai import OpenAI
 from .base_embedder import BaseEmbedder
 class OllamaEmbedder(BaseEmbedder):
    """
    A wrapper class for text embedding models using Ollama's API
    """
    def __init__(
        self,
        model_name: str,
        api_key: Optional[str] = None,
        base_url: str = "http://localhost:11434/v1",
    ):
        """
        Initialize the embedding model
        Args:
            model_name: Name of the model to use
            api_key: API key (defaults to 'ollama' or environment variable 'OLLAMA_API_KEY')
            base_url: Base URL for the Ollama API (default is 'http://localhost:11434/v1')
        """
        self.model_name = model_name
        self.api_key = api_key or os.getenv("OLLAMA_API_KEY") or "ollama"
        self.base_url = base_url
        self.client = OpenAI(base_url=self.base_url, api_key=self.api_key)
    def embed_chunks(self, chunks: List[str]) -> List[np.ndarray]:
        """
        Generate embeddings for a list of text chunks
        Args:
            chunks: List of text chunks to embed
        Returns:
            List of embeddings
        """
        return self.embed_texts(chunks)
    def embed_texts(self, texts: List[str]) -> List[np.ndarray]:
        """
        Generate embeddings for a list of texts
        Args:
            texts: List of texts to embed
        Returns:
            List of embeddings
        """
        embeddings = []
        max_batch_size = 2048  # Adjust batch size if necessary
        for i in range(0, len(texts), max_batch_size):
            batch = texts[i : i + max_batch_size]
            response = self.client.embeddings.create(input=batch, model=self.model_name)
            batch_embeddings = [np.array(item.embedding) for item in response.data]
            embeddings.extend(batch_embeddings)
        return embeddings
    def embed_text(self, text: str) -> np.ndarray:
        """
        Generate embedding for a single text
        Args:
            text: Text to embed
        Returns:
            Embedding array
        """
        return self.embed_texts([text])[0]
    @property
    def dimension(self) -> int:
        """Get the dimension of the embeddings"""
        # Embedding dimensions may vary; we'll determine it dynamically
        test_embed = self.embed_text("test")
        return len(test_embed)