manticoresoftware
diff --git a/‎cmake/build_embeddings.cmake‎
Lines changed: 19 additions & 12 deletions b/‎cmake/build_embeddings.cmake‎
Lines changed: 19 additions & 12 deletions
diff --git a/‎embeddings/src/model/create_model_test.rs‎
Lines changed: 77 additions & 0 deletions b/‎embeddings/src/model/create_model_test.rs‎
Lines changed: 77 additions & 0 deletions
diff --git a/‎embeddings/src/model/jina.rs‎
Lines changed: 54 additions & 19 deletions b/‎embeddings/src/model/jina.rs‎
Lines changed: 54 additions & 19 deletions
diff --git a/‎embeddings/src/model/mod.rs‎
Lines changed: 50 additions & 16 deletions b/‎embeddings/src/model/mod.rs‎
Lines changed: 50 additions & 16 deletions
@@ -50,20 +50,27 @@ function(build_embeddings_lib)
 	set(ENV{GIT_COMMIT_ID} "${GIT_COMMIT_ID}")
 	set(ENV{GIT_TIMESTAMP_ID} "${GIT_TIMESTAMP_ID}")
 
-	# Enable platform-specific BLAS acceleration for candle when available
-	set(EMBEDDINGS_CARGO_FEATURES "")
-	if(APPLE)
-		set(EMBEDDINGS_CARGO_FEATURES "--features" "accelerate")
-	elseif(UNIX)
-		# MKL provides multi-threaded BLAS on Linux; skip if not available
-		execute_process(COMMAND pkg-config --exists mkl-dynamic-lp64-seq RESULT_VARIABLE MKL_FOUND OUTPUT_QUIET ERROR_QUIET)
-		if(MKL_FOUND EQUAL 0)
-			set(EMBEDDINGS_CARGO_FEATURES "--features" "mkl")
-		endif()
-	endif()
+	# EMBEDDINGS_CARGO_FEATURES may be set externally (e.g., parent CMake) to inject
+	# extra cargo features. If unset, default to platform-specific BLAS acceleration
+	# for candle: accelerate on macOS, mkl on Linux when available.
+	if (NOT DEFINED EMBEDDINGS_CARGO_FEATURES OR "${EMBEDDINGS_CARGO_FEATURES}" STREQUAL "")
+		if (APPLE)
+			set(EMBEDDINGS_CARGO_FEATURES "accelerate")
+		elseif (UNIX)
+			execute_process(COMMAND pkg-config --exists mkl-dynamic-lp64-seq RESULT_VARIABLE MKL_FOUND OUTPUT_QUIET ERROR_QUIET)
+			if (MKL_FOUND EQUAL 0)
+				set(EMBEDDINGS_CARGO_FEATURES "mkl")
+			endif ()
+		endif ()
+	endif ()
+
+	set(EMBEDDINGS_CARGO_FEATURE_ARGS "")
+	if (NOT "${EMBEDDINGS_CARGO_FEATURES}" STREQUAL "")
+		set(EMBEDDINGS_CARGO_FEATURE_ARGS --features ${EMBEDDINGS_CARGO_FEATURES})
+	endif ()
 
 	execute_process (
-			COMMAND cargo build --manifest-path ${CMAKE_SOURCE_DIR}/embeddings/Cargo.toml --lib --release ${EMBEDDINGS_CARGO_FEATURES} --target-dir ${CMAKE_CURRENT_BINARY_DIR}/embeddings
+			COMMAND cargo build --manifest-path ${CMAKE_SOURCE_DIR}/embeddings/Cargo.toml --lib --release ${EMBEDDINGS_CARGO_FEATURE_ARGS} --target-dir ${CMAKE_CURRENT_BINARY_DIR}/embeddings
 			RESULT_VARIABLE CMD_RESULT
 	)
 
 
@@ -0,0 +1,77 @@
+use super::{create_model, Model, ModelOptions};
+
+#[test]
+fn test_create_model_allows_custom_openai_model_when_custom_api_url_is_set() {
+    let model = create_model(ModelOptions {
+        model_id: "openai/rubert-tiny-turbo".to_string(),
+        cache_path: None,
+        api_key: Some("test-key".to_string()),
+        api_url: Some("http://localhost:8080/v1/embeddings".to_string()),
+        api_timeout: None,
+        use_gpu: None,
+    });
+
+    assert!(model.is_ok());
+
+    match model.unwrap() {
+        Model::OpenAI(model) => assert_eq!(model.model, "rubert-tiny-turbo"),
+        _ => panic!("expected OpenAI model"),
+    }
+}
+
+#[test]
+fn test_create_model_with_custom_url_still_uses_prefixed_jina_as_remote_signal() {
+    let model = create_model(ModelOptions {
+        model_id: "jina/custom-model".to_string(),
+        cache_path: None,
+        api_key: Some("test-key".to_string()),
+        api_url: Some("http://localhost:8080/v1/embeddings".to_string()),
+        api_timeout: None,
+        use_gpu: None,
+    });
+
+    assert!(model.is_ok());
+
+    match model.unwrap() {
+        Model::Jina(model) => assert_eq!(model.model, "custom-model"),
+        _ => panic!("expected Jina model"),
+    }
+}
+
+#[test]
+fn test_create_model_supports_explicit_openai_colon_syntax() {
+    let model = create_model(ModelOptions {
+        model_id: "openai:openai/text-embedding-ada-002".to_string(),
+        cache_path: None,
+        api_key: Some("test-key".to_string()),
+        api_url: Some("http://localhost:8080/v1/embeddings".to_string()),
+        api_timeout: None,
+        use_gpu: None,
+    });
+
+    assert!(model.is_ok());
+
+    match model.unwrap() {
+        Model::OpenAI(model) => assert_eq!(model.model, "openai/text-embedding-ada-002"),
+        _ => panic!("expected OpenAI model"),
+    }
+}
+
+#[test]
+fn test_create_model_supports_explicit_openai_colon_syntax_with_simple_model() {
+    let model = create_model(ModelOptions {
+        model_id: "openai:text-embedding-ada-002".to_string(),
+        cache_path: None,
+        api_key: Some("test-key".to_string()),
+        api_url: Some("http://localhost:8080/v1/embeddings".to_string()),
+        api_timeout: None,
+        use_gpu: None,
+    });
+
+    assert!(model.is_ok());
+
+    match model.unwrap() {
+        Model::OpenAI(model) => assert_eq!(model.model, "text-embedding-ada-002"),
+        _ => panic!("expected OpenAI model"),
+    }
+}
@@ -1,13 +1,15 @@
-use super::TextModel;
+use super::{ModelValidationMode, TextModel};
 use crate::LibError;
 use reqwest::blocking::Client;
+use std::sync::Mutex;
 
 #[derive(Debug)]
 pub struct JinaModel {
     pub client: Client,
     pub model: String,
     pub api_key: String,
     pub api_url: Option<String>,
+    hidden_size_cache: Mutex<Option<usize>>,
 }
 
 pub fn validate_model(model: &str) -> Result<(), String> {
@@ -50,8 +52,32 @@ impl JinaModel {
         api_url: Option<&str>,
         api_timeout: Option<u64>,
     ) -> Result<Self, Box<dyn std::error::Error>> {
-        let model = model_id.trim_start_matches("jina/").to_string();
-        validate_model(&model).map_err(|_| LibError::RemoteUnsupportedModel { status: None })?;
+        let validation_mode = if api_url.is_some() {
+            ModelValidationMode::Passthrough
+        } else {
+            ModelValidationMode::StrictBuiltInList
+        };
+
+        Self::new_with_validation_mode(model_id, api_key, api_url, api_timeout, validation_mode)
+    }
+
+    pub fn new_with_validation_mode(
+        model_id: &str,
+        api_key: &str,
+        api_url: Option<&str>,
+        api_timeout: Option<u64>,
+        validation_mode: ModelValidationMode,
+    ) -> Result<Self, Box<dyn std::error::Error>> {
+        let model = if let Some(model) = model_id.strip_prefix("jina:") {
+            model.to_string()
+        } else {
+            model_id.trim_start_matches("jina/").to_string()
+        };
+
+        if validation_mode == ModelValidationMode::StrictBuiltInList {
+            validate_model(&model)
+                .map_err(|_| LibError::RemoteUnsupportedModel { status: None })?;
+        }
         // Only validate basic requirements (non-empty, no whitespace)
         // Real validation happens via actual API request in validate_api_key()
         validate_api_key_basic(api_key)
@@ -62,8 +88,26 @@ impl JinaModel {
             model,
             api_key: api_key.to_string(),
             api_url: api_url.map(|s| s.to_string()),
+            hidden_size_cache: Mutex::new(None),
         })
     }
+
+    fn known_hidden_size(&self) -> Option<usize> {
+        match self.model.as_str() {
+            "jina-embeddings-v4" => Some(2048), // 32K context, 2048 dimensions
+            "jina-clip-v2" => Some(1024),       // 8K context, 1024 dimensions, multimodal
+            "jina-embeddings-v3" => Some(1024), // 8K context, 1024 dimensions
+            "jina-colbert-v2" => Some(128),     // Multi-vector model, 8K context
+            "jina-clip-v1" => Some(768),        // 8K context, 768 dimensions, multimodal
+            "jina-colbert-v1-en" => Some(128),  // Multi-vector model, 8K context
+            "jina-embeddings-v2-base-es" => Some(768), // 8K context, 768 dimensions
+            "jina-embeddings-v2-base-code" => Some(768), // 8K context, 768 dimensions
+            "jina-embeddings-v2-base-de" => Some(768), // 8K context, 768 dimensions
+            "jina-embeddings-v2-base-zh" => Some(768), // 8K context, 768 dimensions
+            "jina-embeddings-v2-base-en" => Some(768), // 8K context, 768 dimensions
+            _ => None,
+        }
+    }
 }
 
 impl TextModel for JinaModel {
@@ -254,15 +298,17 @@ impl TextModel for JinaModel {
             }));
         }
 
+        let inferred_dim = embeddings[0].len();
+        *self.hidden_size_cache.lock().unwrap() = Some(inferred_dim);
+
         // Validate embedding dimensions and handle empty individual embeddings
-        let expected_dim = self.get_hidden_size();
         for embedding in embeddings.iter() {
             if embedding.is_empty() {
                 return Err(Box::new(LibError::RemoteHttpError {
                     status: status_code,
                 }));
             }
-            if embedding.len() != expected_dim {
+            if embedding.len() != inferred_dim {
                 // Some models might return different dimensions, but we should validate
                 // For now, we'll be lenient but could add stricter validation later
             }
@@ -272,20 +318,9 @@ impl TextModel for JinaModel {
     }
 
     fn get_hidden_size(&self) -> usize {
-        match self.model.as_str() {
-            "jina-embeddings-v4" => 2048,          // 32K context, 2048 dimensions
-            "jina-clip-v2" => 1024,                // 8K context, 1024 dimensions, multimodal
-            "jina-embeddings-v3" => 1024,          // 8K context, 1024 dimensions
-            "jina-colbert-v2" => 128,              // Multi-vector model, 8K context
-            "jina-clip-v1" => 768,                 // 8K context, 768 dimensions, multimodal
-            "jina-colbert-v1-en" => 128,           // Multi-vector model, 8K context
-            "jina-embeddings-v2-base-es" => 768,   // 8K context, 768 dimensions
-            "jina-embeddings-v2-base-code" => 768, // 8K context, 768 dimensions
-            "jina-embeddings-v2-base-de" => 768,   // 8K context, 768 dimensions
-            "jina-embeddings-v2-base-zh" => 768,   // 8K context, 768 dimensions
-            "jina-embeddings-v2-base-en" => 768,   // 8K context, 768 dimensions
-            _ => panic!("Unknown model"),
-        }
+        self.known_hidden_size()
+            .or_else(|| *self.hidden_size_cache.lock().unwrap())
+            .unwrap_or_else(|| panic!("Unknown model"))
     }
 
     fn get_max_input_len(&self) -> usize {
 
@@ -19,6 +19,9 @@ mod local_test;
 #[cfg(test)]
 mod ffi_test;
 
+#[cfg(test)]
+mod create_model_test;
+
 use std::error::Error;
 use std::path::PathBuf;
 
@@ -41,6 +44,12 @@ pub struct ModelOptions {
     pub use_gpu: Option<bool>,
 }
 
+#[derive(Debug, Clone, Copy, PartialEq, Eq)]
+pub enum ModelValidationMode {
+    StrictBuiltInList,
+    Passthrough,
+}
+
 /// Unified model enum
 ///
 /// Architecture:
@@ -96,34 +105,55 @@ impl TextModel for Model {
 
 pub fn create_model(options: ModelOptions) -> Result<Model, Box<dyn Error>> {
     let model_id = options.model_id.as_str();
+    let api_key = options.api_key.unwrap_or_default();
+    let api_url = options.api_url;
+    let api_timeout = options.api_timeout;
 
     // Remote providers (HTTP APIs)
-    if model_id.starts_with("openai/") {
-        let model = openai::OpenAIModel::new(
+    if model_id.starts_with("openai:") {
+        let model = openai::OpenAIModel::new_with_validation_mode(
             model_id,
-            options.api_key.unwrap_or_default().as_str(),
-            options.api_url.as_deref(),
-            options.api_timeout,
+            api_key.as_str(),
+            api_url.as_deref(),
+            api_timeout,
+            ModelValidationMode::Passthrough,
         )?;
 
         Ok(Model::OpenAI(Box::new(model)))
-    } else if model_id.starts_with("voyage/") {
-        let model = voyage::VoyageModel::new(
+    } else if model_id.starts_with("openai/") {
+        let model =
+            openai::OpenAIModel::new(model_id, api_key.as_str(), api_url.as_deref(), api_timeout)?;
+
+        Ok(Model::OpenAI(Box::new(model)))
+    } else if model_id.starts_with("voyage:") {
+        let model = voyage::VoyageModel::new_with_validation_mode(
             model_id,
-            options.api_key.unwrap_or_default().as_str(),
-            options.api_url.as_deref(),
-            options.api_timeout,
+            api_key.as_str(),
+            api_url.as_deref(),
+            api_timeout,
+            ModelValidationMode::Passthrough,
         )?;
 
         Ok(Model::Voyage(Box::new(model)))
-    } else if model_id.starts_with("jina/") {
-        let model = jina::JinaModel::new(
+    } else if model_id.starts_with("voyage/") {
+        let model =
+            voyage::VoyageModel::new(model_id, api_key.as_str(), api_url.as_deref(), api_timeout)?;
+
+        Ok(Model::Voyage(Box::new(model)))
+    } else if model_id.starts_with("jina:") {
+        let model = jina::JinaModel::new_with_validation_mode(
             model_id,
-            options.api_key.unwrap_or_default().as_str(),
-            options.api_url.as_deref(),
-            options.api_timeout,
+            api_key.as_str(),
+            api_url.as_deref(),
+            api_timeout,
+            ModelValidationMode::Passthrough,
         )?;
 
+        Ok(Model::Jina(Box::new(model)))
+    } else if model_id.starts_with("jina/") {
+        let model =
+            jina::JinaModel::new(model_id, api_key.as_str(), api_url.as_deref(), api_timeout)?;
+
         Ok(Model::Jina(Box::new(model)))
     } else {
         // Local models - auto-detect architecture from config
@@ -135,7 +165,11 @@ pub fn create_model(options: ModelOptions) -> Result<Model, Box<dyn Error>> {
                 .unwrap_or(String::from(".cache/manticore")),
         );
 
-        let hf_token = options.api_key.as_deref();
+        let hf_token = if api_key.is_empty() {
+            None
+        } else {
+            Some(api_key.as_str())
+        };
         let model = local::LocalModel::new(
             model_id,
             cache_path,