Vision AI & Agentic RAG

Máquinas que
ven, razonan
y actúan.

Arquitecturas de inteligencia perceptiva para empresas que necesitan más que automatización: necesitan comprensión real del mundo visual y semántico.

Computer Vision AI
+120 Modelos evaluados
98.3% Precisión media CV
40ms Latencia media inferencia
Computer Vision Agentic RAG Multimodal Retrieval Object Detection Semantic Segmentation Vector Databases LLM Orchestration Visual Embeddings Foundation Models Real-time Inference Computer Vision Agentic RAG Multimodal Retrieval Object Detection SCAI Industrial OPC UA · MQTT Semantic Segmentation Vector Databases LLM Orchestration Visual Embeddings Foundation Models Real-time Inference
Laboratorio IA
Barcelona, ES
Est. 2019

Ingeniería de
percepción avanzada.

LAND NETWORKING S.L. es un laboratorio de ingeniería especializado en visión por computación y sistemas RAG agénticos. Nuestro equipo combina investigación aplicada con implementación de producción, desarrollando arquitecturas que transforman datos visuales y semánticos en inteligencia accionable.

No somos una consultora genérica de IA. Somos especialistas de dominio que comprenden cada capa del stack: desde la óptica del sensor hasta la toma de decisión del agente.

  • Equipo fundador con tesis doctorales en CV y NLP
  • Implementaciones en producción en 12 países
  • Colaboradores en proyectos H2020 y Horizon Europe
  • Contribuidores activos a PyTorch, Hugging Face y LangChain
  • Partners certificados: NVIDIA, Google Cloud, AWS

Nuestros
servicios

Desde la auditoría de viabilidad hasta el despliegue en producción. Construimos sistemas que funcionan en el mundo real, no solo en notebooks de investigación.

01
Computer Vision Systems

Diseño e implementación de pipelines de visión: detección, segmentación, clasificación, estimación de pose y reconstrucción 3D. Desde la cámara hasta la API.

YOLO SAM2 ViT DINO
02
Agentic RAG Architecture

Sistemas RAG de nueva generación con agentes orquestados: planificación multi-step, memoria episódica, retrieval adaptativo y razonamiento sobre contexto largo.

LangGraph LlamaIndex ColPali
03
Multimodal Retrieval

Sistemas de búsqueda que comprenden texto, imágenes, vídeo y audio de forma unificada. Embeddings multimodales, re-ranking cruzado y pipelines de fusión tardía.

CLIP ImageBind Weaviate
04
MLOps & Production

Infraestructura para llevar modelos a producción: optimización de inferencia, cuantización, serving distribuido, monitorización de drift y pipelines CI/CD para ML.

TensorRT Triton MLflow
05
Vector Infrastructure

Diseño y optimización de bases de datos vectoriales a escala: indexado ANN, filtrado de metadatos, sharding, replicación y estrategias de actualización incremental.

Qdrant Pinecone pgvector
06
Training & Fine-tuning

Entrenamiento supervisado y autosupervisado, fine-tuning eficiente con LoRA/QLoRA, síntesis de datos para CV, data augmentation domain-specific y evaluación adversarial.

LoRA PEFT DPO
07
Nuevo servicio
SCAI — SCADA + Inteligencia Artificial Industrial

Transformamos infraestructuras industriales con datos acumulándose en sistemas que observan, entienden, predicen y actúan. No es "meter IA a todo": es construir las cuatro capas correctas sobre las que la IA tiene sentido real.

El punto de partida no es un modelo. Es el modelo operacional: definir qué optimizar, con qué KPIs, a qué frecuencia y con qué coste del error. Sin eso, acabas con dashboards con curvas bonitas — el deporte favorito de media industria.

Pipeline de referencia
Sensores/PLC/Edge Broker/Normalización Historian + Contexto Reglas + ML/IA Alarmas + Acción
OPC UA MQTT InfluxDB Telegraf Node-RED PostgreSQL Grafana Mosquitto EMQX Modbus

SCAI: de datos
acumulados a sistemas
que actúan.

Si tienes sensores escribiendo en InfluxDB, ya tienes medio SCADA montado. Lo que falta es estructurar eso en cuatro capas limpias sobre las que la IA tenga sentido industrial real: captura fiable → contexto operativo → analítica y reglas → IA para decisión y optimización. Y encima, una HMI/SCADA que no sea un iframe de Grafana mal tuneado.

Primer entregable correcto
No es un modelo de IA. Es una tabla de objetivos y variables:
ObjetivoReducir kWh/unidad producida KPIkWh/lote · MTBF · pico demanda InputsPotencia, temp., turno, receta, clima Frecuencia1 min / 5 min AcciónCambio setpoint · parada carga Coste errorMedio / Alto
Arquitectura de referencia · 4 capas
Capa A
Adquisición
Industrial

Estandarización de la señal en el origen. OPC UA para interoperabilidad semántica máquina-empresa. MQTT para telemetría ligera en edge. Gateways para traducir Modbus, BACnet, CAN, PROFINET.

OPC UA MQTT 5.0 Modbus BACnet Edge Gateways
Capa B
Ingesta y
Normalización

Broker MQTT (Mosquitto/EMQX), collectors (Telegraf, Node-RED) y un normalizador que impone nombres canónicos, unidades, calidad de señal, timestamps consistentes y tags de contexto correctos. Los tags mal diseñados en InfluxDB son sufrimiento premium perpetuo.

Mosquitto EMQX Telegraf Node-RED
Capa C
Historian y
Contexto Operativo

InfluxDB 3 como historian de series temporales. PostgreSQL para activos, órdenes de trabajo, turnos, recetas, alarmas, coste energético y taxonomía de planta. Opcionalmente Neo4j para grafo de activos y análisis de causalidad entre eventos.

InfluxDB 3 PostgreSQL Neo4j
Capa D · Salida
Observabilidad
y HMI/SCADA

Grafana para dashboards, alerting sobre múltiples fuentes y análisis ad-hoc. HMI SCADA dedicada para sinópticos operativos de planta, línea y máquina. Paneles por energía, calidad, mantenimiento y alarmas. Aquí es donde la IA se vuelve visible: recomendaciones al operario, alertas tempranas, acciones supervisadas.

Grafana HMI SCADA Alerting
Qué optimiza la IA encima de ese stack
Consumo energético total y kWh por línea, turno, lote y máquina
Predicción y aplanamiento de picos de demanda
MTBF / MTTR: mantenimiento preventivo y predictivo
Detección temprana de anomalías y degradación de equipos
Optimización de calidad vs consumo energético por receta
Recomendaciones operativas al operario en tiempo real
Desplazamiento horario de cargas no críticas para optimizar tarifa
Nuestro enfoque · Lo que nos diferencia

No empezamos por el modelo de IA. Empezamos por el modelo operacional. Antes de entrenar nada, auditamos qué quieres optimizar exactamente, con qué variables y con qué consecuencias del error.

Si la adquisición está mal etiquetada, si los timestamps son inconsistentes, si no hay contexto operativo (turno, receta, estado máquina), el mejor modelo de IA producirá basura. La IA es la última capa, no la primera.

El resultado final no es un notebook en producción: es un sistema operativo industrial con alertas accionables, recomendaciones al operario y dashboards que un jefe de planta puede usar sin formación en ML.

4
capas de arquitectura
0
modelos sin objetivo definido
100%
transferencia a tu equipo
Hablar de tu SCADA →

Stack Map

El ecosistema que dominamos. Seleccionamos herramientas por madurez, rendimiento y mantenibilidad, no por hype.

Detection
YOLOv11
Detection
RT-DETR
Segmentation
SAM 2
Segmentation
Mask2Former
Foundation
DINOv2
Foundation
Grounding DINO
Multimodal
CLIP
Multimodal
ImageBind
Multimodal
ColPali
LLM
Llama 3.x
LLM
Mistral
LLM
Qwen-VL
Orchestration
LangGraph
Orchestration
LlamaIndex
Orchestration
CrewAI
Vector DB
Qdrant
Vector DB
Weaviate
Vector DB
pgvector
Inference
TensorRT
Inference
Triton
Inference
ONNX Runtime
Training
PyTorch 2.x
Training
Hugging Face
Training
Weights & Biases
MLOps
MLflow
MLOps
DVC
Infra
Kubernetes
Infra
Ray

Arquitecturas,
modelos y benchmarks.

Documentación técnica densa. Sin tutoriales de nivel 0. Directo a lo que importa: arquitecturas, trade-offs, resultados reales.

Agentic RAG
Agentic RAG · Guía técnica
Construir un sistema RAG agéntico con LangGraph: memoria, planificación y retrieval adaptativo

Un análisis profundo de cómo diseñar agentes que iteran sobre su propia recuperación de contexto, evalúan relevancia y reformulan queries de forma autónoma para respuestas más precisas.

Leer artículo →
YOLOv11
Computer Vision
YOLOv11 vs RT-DETR: benchmark real en edge devices

Comparativa exhaustiva de latencia, mAP y consumo energético en Jetson Orin, Raspberry Pi 5 y hardware cloud.

SAM2
Segmentación
SAM 2 en producción: casos límite, optimización y deployment

Cómo integrar Segment Anything Model 2 en pipelines industriales, gestionar prompts complejos y optimizar para vídeo en tiempo real.

ColPali
Multimodal RAG
ColPali: retrieval de documentos visuales sin OCR

Análisis de la arquitectura de ColPali, sus embeddings de página completa y cómo supera a los pipelines clásicos en documentos con tablas y gráficas.

Vector DB
Infraestructura
Qdrant vs Weaviate vs pgvector a escala: qué elegir y cuándo

Guía de selección de vector DB con benchmarks reales a 100M vectores: throughput, consistencia, filtrado y coste operativo.

Fine-tuning
Fine-tuning
LoRA para modelos de visión: cuándo funciona y cuándo no

Guía práctica de fine-tuning eficiente con LoRA en ViT y LLaVA. Análisis de rank, alpha, y estrategias de selección de capas para CV.

Inference
MLOps
TensorRT 10: optimización de modelos multimodales para producción

Workflow completo de exportación, cuantización INT8 y deployment con Triton Inference Server para modelos de visión y texto combinados.

Research
Digest

Papers relevantes de CV, RAG multimodal y sistemas agénticos. Seleccionados y comentados por nuestro equipo. Sin automatización.

Mar
2026
VideoRAG: Retrieval-Augmented Generation over Video Corpora with Temporal Awareness
Chen et al. · University of Hong Kong · arXiv:2603.04821
RAG + CV
Feb
2026
VisionAgent: Hierarchical Planning and Tool Use for Complex Visual Question Answering
Patel, Kumar et al. · CMU · arXiv:2602.11034
Agentes
Feb
2026
Grounded SAM 3: Universal Open-Vocabulary Segmentation with Spatial Reasoning
Meta AI Research · arXiv:2602.08841
Segmentación
Ene
2026
HybridRAG: Combining Sparse and Dense Retrieval with Cross-Modal Re-ranking at Scale
Zhang, Li et al. · Tsinghua · arXiv:2601.09234
Retrieval
Ene
2026
EfficientDINO: Distilling Vision Foundation Models for Edge Deployment
Martínez et al. · ETH Zurich · arXiv:2601.03718
Edge CV
Dic
2025
ColPali-v2: Efficient Document Retrieval through Late Interaction over Visual Tokens
Faysse et al. · CentraleSupélec · arXiv:2512.14312
Multimodal
Nov
2025
MRAG: Memory-Augmented Retrieval with Episodic and Semantic Stores for Long-Horizon Tasks
Wang, Zhao et al. · Stanford · arXiv:2511.07291
Memoria

Casos de uso.

Sistemas desplegados en entornos de producción. Arquitecturas reales, no demos de laboratorio.

Salud
Salud · Diagnóstico
Detección de anomalías en imágenes de radiología
CV + RAG multimodal · 94.2% sensibilidad
Industria
Manufactura · Quality
Inspección visual de defectos en línea de producción
Segmentación semántica · 40ms latencia
Retail
Retail · Inteligencia
Reconocimiento de producto y análisis de planograma
Object detection + RAG · escala nacional
Movilidad
Movilidad · ADAS
Percepción multimodal para vehículos autónomos de última milla
Fusión cámara-LiDAR · tiempo real

Cómo trabajamos.

01
Discovery & Feasibility Audit

Analizamos el problema de negocio, los datos disponibles y las restricciones técnicas. Producimos un informe de viabilidad con arquitecturas candidatas, estimación de coste computacional y métricas de éxito acordadas. Sin commitments ciegos.

02
Data & Baseline

Auditoría de datos existentes, diseño de estrategia de etiquetado, benchmark con modelos base (zero-shot / few-shot) para establecer el suelo. Si el baseline resuelve el problema, lo decimos. No inflamos proyectos.

03
Architecture & Experimentation

Diseño de la arquitectura final, experimentación sistemática con tracking completo (W&B), ablation studies y validación cruzada domain-specific. Entregamos notebooks reproducibles.

04
Production Deployment

Optimización para inferencia (TensorRT, ONNX, cuantización), containerización, despliegue cloud o edge, monitorización de drift y alertas. CI/CD para modelos incluido.

05
Knowledge Transfer

Documentación técnica exhaustiva, sesiones de formación para el equipo del cliente, playbooks de mantenimiento y acceso continuado a nuestra Knowledge Base. El objetivo es que el cliente sea independiente.

Personas que
construyen.

CEO
Carlos Carné
CEO & Computer Vision Lead

Ingeniero en Telecomunicaciones. 10 años en sistemas de percepción industrial.

CTO
Nestor Casado
CTO & RAG Systems Architect

Contribuidor de LangChain y LlamaIndex. Especialista en sistemas de retrieval a escala.

MLOps
Miquel Ferrer
Head of MLOps

Ingeniero de infraestructura ML en Amazon Science durante 5 años. Experto en serving distribuido y optimización de inferencia.

Research
Maria Flores
Research Lead

Postdoc en ETH Zurich en multimodal learning. Co-autora de 14 papers en CVPR, ICCV y NeurIPS. Dirige el Research Digest.

¿Tienes un problema
de visión o retrieval?
Hablemos.

Primera sesión técnica gratuita de 45 minutos. Sin decks de ventas. Analizamos tu problema y te decimos si tenemos algo que aporte valor real.

Solicitar sesión técnica →

Sin compromiso · Respuesta en 24h

Contacto.

Oficina
C/ Aragón, 186
28011 Barcelona, España
Teléfono
+34 902 40 40 17
Horario
Lun–Vie · 9:00 – 18:30 CET
Datos fiscales
LAND NETWORKING S.L.
CIF: B-63106900
RM Barcelona · T.2 · F.23235 · Insc.43