@@ -54,6 +54,7 @@ Rendimiento medido: **~18-20 tokens/s** generando con Qwen3-8B INT4 sobre la iGP
5454- [ OVMS como backend de Claude Code] ( #ovms-como-backend-de-claude-code )
5555- [ Memoria y rendimiento] ( #memoria-y-rendimiento )
5656- [ Estructura] ( #estructura )
57+ - [ Recursos Intel a tener en cuenta] ( #recursos-intel-a-tener-en-cuenta )
5758- [ Troubleshooting] ( #troubleshooting )
5859- [ Licencia] ( #licencia )
5960- [ Autor] ( #autor )
@@ -505,6 +506,73 @@ Sweet spot: pedirle "explica este fichero", "genera un test para esta función",
505506└── openwebui-data/ # estado persistente de Open WebUI
506507```
507508
509+ ## Recursos Intel a tener en cuenta
510+
511+ Lista corta y opinada de recursos upstream del lado Intel detrás de este stack
512+ — útil si quieres profundizar, cambiar componentes o contribuir.
513+
514+ ### Toolkit OpenVINO (el runtime debajo de todo)
515+
516+ - 📖 [ Documentación de OpenVINO] ( https://docs.openvino.ai/ ) — docs oficiales,
517+ la fuente autorizada para comportamiento de plugins, ops soportadas y
518+ hints de dispositivo.
519+ - 🐙 [ ` openvinotoolkit/openvino ` ] ( https://github.com/openvinotoolkit/openvino )
520+ — el runtime C++/Python. Echa un ojo al [ código fuente del plugin GPU] ( https://github.com/openvinotoolkit/openvino/tree/master/src/plugins/intel_gpu )
521+ cuando un compile GPU falle de forma rara (el error ` is_static() ` que
522+ tuvimos nosotros sale de ahí).
523+ - 🐙 [ ` openvinotoolkit/openvino.genai ` ] ( https://github.com/openvinotoolkit/openvino.genai )
524+ — la capa runtime específica para LLMs (continuous batching, KV cache,
525+ chat templates). Lo que OVMS usa por debajo.
526+ - 🐙 [ ` openvinotoolkit/nncf ` ] ( https://github.com/openvinotoolkit/nncf ) —
527+ Neural Network Compression Framework. Lee la
528+ [ documentación de weight compression] ( https://docs.openvino.ai/2024/openvino-workflow/model-optimization-guide/weight-compression.html )
529+ para entender qué hace realmente ` --weight-format int4 --group-size 64 ` .
530+
531+ ### OpenVINO Model Server (OVMS)
532+
533+ - 🐙 [ ` openvinotoolkit/model_server ` ] ( https://github.com/openvinotoolkit/model_server )
534+ — el servidor que usamos. El [ directorio de demos] ( https://github.com/openvinotoolkit/model_server/tree/main/demos )
535+ tiene ejemplos canónicos de ` graph.pbtxt ` para cada task (generación de
536+ texto, embeddings, rerank, generación de imagen, VLMs). Cuando dudes,
537+ copia de ahí.
538+ - 🛠 [ ` optimum-intel ` ] ( https://github.com/huggingface/optimum-intel ) — el
539+ puente con HuggingFace que convierte ` Qwen/Qwen3-8B ` en un IR de OpenVINO.
540+ Nuestro ` scripts/export-models.sh ` es esencialmente un wrapper de
541+ ` optimum-cli export openvino ` .
542+
543+ ### Modelos pre-convertidos
544+
545+ - 🤗 [ Organización ` OpenVINO ` en HuggingFace] ( https://huggingface.co/OpenVINO )
546+ — modelos IR pre-convertidos oficialmente (Qwen, Llama, Phi, Mistral,
547+ embeddings, etc.). Si no quieres esperar a la conversión local a INT4,
548+ bájate uno de ahí y sáltate ` scripts/export-models.sh ` .
549+
550+ ### Hardware
551+
552+ - 💻 [ Procesadores Intel Core Ultra (Series 2)] ( https://www.intel.com/content/www/us/en/products/details/processors/core-ultra.html )
553+ — la familia. Lunar Lake (Series 2) es para la que está tuneado este
554+ stack, pero el mismo compose funciona en Meteor Lake y Arrow Lake H/HX
555+ con la misma lógica de colocación iGPU/CPU.
556+ - 💻 [ Intel Arc Graphics] ( https://www.intel.com/content/www/us/en/products/details/discrete-gpus/arc.html )
557+ — la línea integrada (Arc 140V aquí) y la discreta hablan el mismo plugin
558+ de OpenVINO. Si tienes un Arc A770/B580 discreto, reutilizas este mismo
559+ stack con mucho más margen para modelos grandes.
560+
561+ ### Cloud / remoto (opcional)
562+
563+ - ☁️ [ Intel Tiber AI Cloud] ( https://www.intel.com/content/www/us/en/developer/tools/devcloud/services.html )
564+ — la cloud de desarrolladores de Intel (antes Intel Developer Cloud).
565+ Útil si quieres probar este mismo stack OVMS en una instancia mayor (Xeon
566+ + GPU) antes de comprar hardware.
567+
568+ ### Comunidad
569+
570+ - 📰 [ Blog de OpenVINO] ( https://blog.openvino.ai/ ) — release notes, números
571+ de rendimiento y anuncios de soporte de modelos. Suscríbete si vives en
572+ este ecosistema.
573+ - 🎥 [ Intel Developer en YouTube] ( https://www.youtube.com/@IntelSoftware ) —
574+ charlas técnicas sobre OpenVINO/OVMS y conferencias.
575+
508576## Troubleshooting
509577
510578- ** ` /dev/dri ` no existe en WSL** : actualiza Windows + drivers Intel Arc. Reinicia WSL: ` wsl --shutdown ` .
0 commit comments