Videovigilancia y Seguridad con Inteligencia Artificial | cámaras + software de vigilancia con IA |

SEGURIDAD Y VIDEOVIGILANCIA EN EL HOGAR CON INTELIGENCIA ARTIFICIAL
Este hilo está enfocado a la seguridad y a la videovigilancia inteligente donde se aportarán software y técnicas de vigilancia en el hogar para el control de personas mayores, niños, animales o evitar robos, también es aplicable a empresas, masías, ámbito doméstico, etc... Se trata de buscar software inteligente que minimice el error en la detección y que sea capaz de reconocer eventos.
Imagen

Tengo una cámara cutre Xiaomi y la verdad que es bastante mala con las detecciones, siempre detecta falsos positivos y graba todo el rato cosas irrelevantes a lo que haya una luz o cualquier chorradilla, así que con el auge de la IA creo que tendrían que haber cosas mucho más sofisticadas para la detección de intrusos.

Me gustaría saber si hay cámaras sofisticadas con IA, que tengan algún modelo liviano de detección de personas que sea muy preciso y que lo pueda procesar, o algún software al que puedas enviar la imagen a un PC y el PC procese la imagen y valore si tiene o no que guardar la grabación, lo cual ahorraría mucho en espacio y en poder guardar los trozos más importantes.

Otra cosa interesante sería que por ejemplo, pongamos que vives en un bloque de 14 familias, y poder por ejemplo poner una foto de toda la gente del bloque que esté a favor para que el modelo no de tanta relevancia cuando alguien reconocible por la cámara sea del bloque, para que grabe principalmente a gente que no es del bloque o que no se vea su identidad, para que por ejemplo la gente del bloque sea enviada a una carpeta diferente para que esté diferenciada de la gente que no es del bloque, porque un vecino también puede robar o romper algo, cosas así, pero igual solo quieres ver intrusos externos.

A la par la IA podría también reconocer intrusos persistentes, por ejemplo, un amigo de un vecino que va cada viernes a su casa, o un vecino que se negó a dar una foto para el reconocimiento de gente del edificio, y escribir una descripción sobre eso para no darle tanta relevancia.

Algo que sería genial es que si la IA tiene claro que hay un intruso que esta pueda llamar a la policía automáticamente usando un LLM, pongamos que son las cuatro de la mañana y ve a alguien forzando una puerta, que esta entendiese que eso es un forcejeo de puerta y que quien lo hace lo hace a una hora de robos y que no es de la comunidad, porque por ejemplo, igual es el propio vecino que se ha dejado las llaves dentro, por eso dije lo de las fotos para reconocer a la gente del bloque, además de poder hablar con el LLM y poder preguntarle si ha visto algo relevante.

Otra cosa es el tema de sensores de luz que lleven wifi y puedan avisarte al teléfono, o comunicarse con la IA por si por ejemplo hay una cámara en un rail que se mueve mandar que se mueva para intentar mejorar el ángulo de visión en la zona donde se ha encendido la luz.

Estaría bien poder compartir software así, a poder ser gratuito, creo que a día de hoy deberían de haber cosas chulas, algunas son fumadas mías que tarde o temprano llegarán, de hecho no creo que sea imposible mucho de lo que he dicho contratando varios servicios cloud de IA e interconectando sus APIs, lo cual es un lio si eres un particular y no una empresa que se lucra con esto, lo suyo sería un modelo unificado o un software que unifique varios modelos para ese funcionamiento en local, pero empezando por algo, el tema de la detección eficiente y precisa para mi es lo más básico.


OPEN SOURCE Y GRATUITO
En este apartado añado software de videovigilancia y seguridad open source o gratuito, eso significa que lo tendremos que montar y gestionar nosotros mismos, buscar las cámaras, la máquina que lo procese, etc... 100% customizable.

➡️DEEPCAMERA + SHARPAI AEGIS hilo_videovigilancia-y-seguridad-con-inteligencia-artificial-camaras-software-de-vigilancia-con-ia_2525683#p1756598037
Es un software muy versátil que nos permite mezclar varios modelos de IA en función de nuestro hardware, uno es un LLM que nos hará un resumen de lo que se ha visto, este será capaz de describir eventos sucedidos y entender situaciones, es capaz de reconocer a personas familiares, de detectar sucesos de cualquier índole como una cañería rota, una persona que se ha desmayado, un perro que se ha escapado porque no aparece en cámara, además de apoyo necesita una IA visual para interpretar las imágenes de las cámaras.

LOCAL DE PAGO
En este apartado añado software de videovigilancia y seguridad de pago pero en local, que lo podemos ejecutar en casa y no estamos anclados a un servicio mensual, aunque el control y la gestión dependerá de nosotros; esto incluye en muchos casos tener que comprar hardware propietario como cámaras, sistema operativo, hardware para mover el sistema, etc....

➡️UNIFY PROTECT hilo_videovigilancia-y-seguridad-con-inteligencia-artificial-camaras-software-de-vigilancia-con-ia_2525683#p1756348424
Ofrece buen un ecosistema de pago que obliga a comprar un hardware que tiene un software propietario y que gestiona las grabaciones, es como un ordenador, tienen diferentes gamas en función de las cámaras que necesites, incluso tienen uno que es cloud. Además de ese Hardware lo que también tienes que pagar son sus cámaras, que llevan IA incorporada y son capaces de reconocer todo tipo de elementos.

SERVICIO DE PAGO
En este apartado iría software o servicios de pago donde no ejecutaríamos en general el sistema de vigilancia en local, este se ejecutaría en la nube o sería una empresa la que lo gestionaría.


HARDWARE | CÁMARAS - SENSORES - ALARMAS - DETECTORES DE HUMO |

Imagen
ECOSISTEMA UNIFI PROTECT SOFTWARE Y HARDWARE PARA SEGURIDAD CON IA
https://ui.com/eu/en
https://eu.store.ui.com/eu/en?a_aid=TechFlow
El ecosistema de Unifi Protect para seguridad nos proporciona detección por IA 100% en local con su hardware, además de su software para gestionar el hardware.

Imagen

https://youtu.be/yAJUPTdNW_c

El software en principio viene con una consola de Unifi, no es posible tenerlo en Windows, así que hay que adquirir una.
Imagen

Entorno doméstico/económico:
-UniFi Cloud Key Gen2 Plus: Es la opción más asequible para “consola” doméstica para usar Protect. Según la ficha técnica puede soportar hasta ~20 cámaras en modo exclusivo Protect.
-UniFi UNVR (estándar): Un NVR dedicado de Unifi, para grabación. Buena opción si solo quieres almacenamiento centralizado de cámaras.
-UniFi Dream Machine Pro: Consola más potente, “todo‐en‐uno” con funciones de red + protección + almacenamiento. Mayor coste.

Aquí ya sería más para entorno profesional:
-UniFi UNVR‑Pro: Versión más premium del NVR, para muchos más canales/cámaras, pero ya quizá exceso para un hogar.
-UniFi Dream Machine Special Edition: Top gama consola doméstica/semiprofesional. Más caro.
-UniFi UNVR (versión 2): Variante estándar de NVR para grabación Unifi.
-UniFi UNVR‑Instant: Opción “ultra entrada” o para muy pocos canales.
-UniFi Unifi Protect Network Video Recorder: Otro modelo de grabador/vídeo para cámaras Unifi.


¿Quién hace la detección con IA? Las cámaras UniFi con chip de IA integrado son las que realizan el procesamiento directamente en el borde (“on-device AI”). Si quieres aprovechar la IA de verdad (detección precisa, menos falsas alarmas), asegúrate de comprar cámaras G5 o AI Series, ya que los modelos más antiguos solo hacen detección básica de movimiento.

Esto significa:
-La cámara analiza el video en tiempo real.
-Identifica personas, vehículos, animales, matrículas, según el modelo.
-Solo envía los metadatos (no todo el video) al sistema UniFi Protect, que luego gestiona alertas y grabaciones.

Aquí hay algunas cámaras como la Unifi G5 PTZ ( 300 euros )
Imagen

La más económica por lo que he visto es la G5 Turret Ultra, que puede encontrarse por 100 euros o incluso menos. https://eu.store.ui.com/eu/es/products/ ... rret-ultra



Es posible marcar zonas en cada cámara, por ejemplo, en una parte de la cámara que no identifique nada, en otra coches y animales, en otra solo humanos, bastante chulo la verdad.
Imagen

Este es capaz de identificar elementos y clasificarlos
Imagen


Muy recomendado este vídeo, explica todo:


Podemos crear perfiles de las personas grabadas, para que las ponga como seguras, o todo lo contrario, para que nos alarme cuando la cámara detecta a determinada persona. También podemos crear como un dataset con imágenes de un delincuente, y la cámara nos avisaría de que lo ha detectado, pongamos que es una persona buscada por la justicia y pasa por nuestra cámara.
Imagen

AI PORT Aparato de IA que mejora cualquier cámara UniFi o de terceros con capacidades de detección, clasificación y reconocimiento de IA.
https://eu.store.ui.com/eu/es/products/up-ai-port
Una buena review, se ve la calidad de las cámaras y sus funciones


REPETIDOR PoE
https://store.ui.com/us/en/category/all-wifi
Aquí conectaríamos nuestras cámaras por puertos PoE, los puertos PoE son puertos LAN que transmiten energía, esto hace que las cámaras puedan ser alimentadas por el mismo cable que transmite la información, por lo que nos tendremos que hacer con un dispositivo PoE para transmitir a nuestra red los datos de la cámara a la vez que la alimentamos.
No lleva detección por IA, a ver si la implementan, así nos ahorraremos sistemas exclusivos y caros, hay muchos modelos open source que podrían implementar que son de detección precisa de elementos.

Es de pago.
SECURITY EYE 4.7 https://www.security-eye-software.com/
Imagen
Security Eye es un sistema de vigilancia personal que permite monitorear múltiples cámaras IP o webcams directamente desde su computadora de escritorio o portátil.. El software ofrece grabación por detección de movimiento, continua y programada. Si utiliza la detección de movimiento, grabará automáticamente (o tomará instantáneas) al detectar movimiento, tomará fotos y, opcionalmente, activará una alarma y le enviará una notificación por correo electrónico o SMS.


Es compatible con más de 1200 modelos de cámaras IP y prácticamente todas las cámaras web. Puede ver la transmisión de video simultáneamente desde 64 fuentes diferentes. Además, tiene acceso a la transmisión en vivo a través de su navegador, lo que le permite vigilar su hogar, etc., desde cualquier lugar.

La configuración de Security Eye consiste en seleccionar la cámara por dirección IP o fabricante y modelo. Puede elegir el tipo de vigilancia: detección de movimiento, programada, manual, etc. También puede determinar los tipos de alarma, como audible local, SMS y SMS.

Security Eye es perfecto para quienes buscan seguridad doméstica potente y sencilla, vigilancia para bebés, monitoreo de negocios y monitoreo de mascotas.

Limitaciones:
Durante la instalación, se le solicitará que instale el códec Xvid MPEG-4, necesario para el correcto funcionamiento de Security Eye. Prueba gratuita de 2 horas, sin posibilidad de guardar.

Características de Security Eye

-Videovigilancia: Security Eye, instalado en su PC, utiliza cámaras IP y webcams para una monitorización de video inigualable. El programa es compatible con más de 1200 modelos de cámaras IP y prácticamente todas las webcams. Puede ver la transmisión de video desde 64 fuentes simultáneamente. También puede ver la transmisión en vivo a través del navegador, ¡desde cualquier lugar del mundo!
-Detector de movimiento: el detector de movimiento es una de las principales herramientas disponibles en Security Eye. Se basa en un algoritmo de análisis de fotogramas de vídeo. Puede usarlo para proteger su hogar o empresa de intrusos. El sensor de movimiento y la herramienta de enmascaramiento son totalmente personalizables, lo que le garantiza evitar falsas alertas.
-Programador de Tareas: la grabación de video y la monitorización de movimiento son útiles cuando las necesitas. El software te permite configurar periodos del día y fechas especiales para estas tareas. Por ejemplo, puedes empezar a monitorizar tu casa al principio de tu jornada laboral y terminar la tarea por la noche. O, si eres jefe, puedes programar la grabación de video en tu oficina solo durante el horario laboral y verla más tarde para asegurarte de que tus empleados cumplan con su trabajo.
-Grabación de video: el software utiliza el motor de codificación xVid para una grabación de video de alta calidad. Puede grabar lo que ocurre en su casa, oficina o tienda mientras está fuera. El reproductor de video integrado, fácil de usar, le permite reproducir el video grabado en cualquier momento y a cualquier velocidad. Puede grabar en momentos específicos del día y de la semana.
-Alertas por correo electrónico y SMS: si Security Eye detecta movimiento, puede activar una sirena. También puede enviarte un mensaje de alerta a tu correo electrónico con fotos de las cámaras adjuntas. También puede enviar SMS a tu celular.
-Capturar el incidente: no solo es importante identificar la amenaza de seguridad, sino también capturar la evidencia. Cuando el programa detecta movimiento, puede tomar instantáneas con las cámaras y grabar videos. Los archivos multimedia capturados se guardan en la carpeta local o en la nube.
-Seguridad en el hogar: vigila tu casa cuando no estás. Simplemente instala el software Security Eye y usa la cámara web USB que tengas conectada a tu ordenador. ¡Tu sistema de seguridad está completo! En caso de intrusión, recibirás alertas instantáneas con fotos de los ladrones enviadas a tu correo electrónico y móvil.
-Monitoreo empresarial.
Además de su hogar, su oficina o tienda minorista también necesita un buen sistema de seguridad. Por la noche, puede usarlo como sistema de detección de movimiento y, durante el horario laboral, para grabar el proceso de trabajo. ¡Su personal también necesita estar monitoreado! Con Security Eye, siempre estará al tanto de lo que sucede en el trabajo.
-Vigilancia para bebés: vigila constantemente a tu hijo en cualquier momento y lugar. Sigue lo que ocurre en la habitación de tu bebé cuando no estás. ¿Tienes alguna sospecha sobre tu niñera? Usa Security Eye para recopilar pruebas: ¡lo tendrás todo grabado!
-Monitoreo de Mascotas: alguna vez te preguntaste qué hace tu mascota favorita cuando no estás en casa?

Requisitos del sistema para Security Eye
RAM: 2 GB
Sistema operativo: Windows 7, 8, 8.1, 10 y 11
Espacio requerido: 300 MB

Imagen

Al iniciar el programa verás que su interfaz es amigable y apta para todos los usuarios. Desde allí tendrás un asistente que te solicitará que insertes las diferentes cámaras, sea cámaras IP o Webcam. Una vez ingresadas todas las cámaras, solo te resta configurar el entorno para usarlo según tus necesidades.

Podrás programar la grabación de vídeo en un rango horario determinado. Por ejemplo, en el caso que quieras vigilar tu negocio, cuando te vas de la oficina de 20 horas hasta las 08 horas del próximo día. También podrás hacerlo por días de la semana o eventos especiales. El asistente de programación es muy versátil y permite muchas opciones. Claro, ningún sistema de vigilancia estaría completo sin que se pueda activar la detección de movimiento. En este caso, la cámara no solo se activará en el momento en el que algo se mueva en su campo visual, sino que también te alertará mediante correo electrónico o SMS y te enviará una captura.

Pero sin lugar a dudas la característica principal de la plataforma es la fácil inserción de hasta 64 cámaras. El programa cuenta en su base de datos con más de 1200 modelos de cámaras (IP y Webcam) y codifica el vídeo en formato Xvid y MPEG-4, con lo cual no deberás preocuparte por el espacio en tu disco.

La utilidad también te permite programar las cámaras para que tomen instantáneas según tu configuración y guardarlas en una carpeta específica. Además, podrás personalizar la eliminación programada de las viejas capturas para ir haciendo espacio en tu disco a medida que pasa el tiempo. La configuración de las alertas vía correo electrónico y SMS, es realmente muy sencilla de realizar.

El entorno también te permite controlar de forma remota el vídeo. Lo podrás realizar con comandos SMS desde tu dispositivo móvil, pudiendo observar las instantáneas, borrarlas o enviarlas vía correo electrónico, entre otras funciones. Para hacer eso, sin embargo, deberás contratar una cuenta en servicios como Textmagic.



Version History
Version Update Information Date
4.7 Camera performance has been increased.
Database has been updated.
New camera settings have been added. 02/27/2026
4.6 Audio support. Import/export cameras. New languages. 01/03/2026
4.5 New IP cameras support. Major bugs fixed. 12/06/2025
4.4 PTZ Control. 06/09/2024
4.3 Video Effects Editor. 12/29/2022
4.2 Privacy mask tool. User accounts. 12/11/2019
4.0 New IP cameras, new languages. Improvements in recording engine and settings. 09/18/2018
3.9 Internal Changes. 07/17/2018
3.7 Masking tool is added. Faster connection of cameras. 06/28/2017
3.6 New ways to discover your cameras in the network. ONVIF support. 04/22/2017
3.5 Wizard is now used to help you to setup new cameras in Security Eye 02/27/2017
3.4 Security Eye can be easily rebranded now! RTSP protocol for IP cameras is supported now. 02/11/2017
3.3 Added support for hundreds of new models of IP cameras. 01/10/2017
3.2 Added Web Access function. You can view your cameras from any place of the world now - just in the browser.
Minor updates in the motion detecting engine. 12/05/2016
3.0 Added remote control with SMS commands! You can start/stop monitoring and send other commands to the program directly from your cell phone! 11/20/2016
2.9 Added support for new IP cameras.
Minor updates in video recording function. 10/02/2016
2.5 Added timers for starting video monitoring and recording.
New delivery method for alarms: via SMS! You can receive notifications directly on your cell phone now! 09/05/2016
2.1 Integrated Multimedia Player for watching recorded videos and snapshots.
Minor updates in decoding engine.
Updates in alarm functionality. 07/15/2016
2.0 Added Motion Detecting engine.
Added options of video recording on motion detection event. Added scheduler options for monitoring. 07/03/2016
1.8 Added support for hundreds models of IP cameras.
Added scheduler options for video recording. Updates in encoding mechanism. 06/12/2016
1.4 Fixed major bugs.
Added a Video recording function. 06/01/2016
1.0 Initials release. 05/21/2016

Imagen
Dejo aquí un database de githubs sobre vigilancia https://www.aibase.com/repos/topic/surveillance

DEEPCAMERA plataforma de código abierto para el desarrollo de habilidades de cámara con IA.
https://github.com/SharpAI/DeepCamera
Imagen
Las funcionalidades de código abierto de DeepCamera dotan a tus cámaras de IA: análisis de escenas VLM, detección de objetos y reidentificación de personas, todo ello ejecutándose localmente con modelos como Qwen, DeepSeek, SmolVLM y LLaVA. Basado en sistemas probados de reconocimiento facial, reidentificación, detección de caídas y monitorización de CCTV/NVR, el catálogo de funcionalidades amplía estas capacidades de aprendizaje automático con IA moderna. Toda la inferencia se ejecuta localmente para garantizar la máxima privacidad.
Imagen
🛡️ Presentamos SharpAI Aegis : aplicación de escritorio para DeepCamera
Aprovecha las capacidades de IA de DeepCamera a través de una aplicación de escritorio con configuración basada en LLM, chat con agentes y alertas inteligentes, conectada a tu móvil mediante Discord, Telegram o Slack.
Imagen

SharpAI Aegis es el complemento de escritorio para DeepCamera. Utiliza LLM para configurar automáticamente tu entorno, configurar las funciones de la cámara y gestionar todo el proceso de IA, sin necesidad de Docker ni CLI manual. Además, incorpora una capa de agente inteligente: memoria persistente, chat con tus cámaras, generación de vídeo mediante IA, voz (TTS) y mensajería conversacional a través de Discord, Telegram y Slack.

Imagen

🧩 Catálogo de habilidades
Cada habilidad es un módulo independiente con su propio modelo, parámetros y protocolo de comunicación . Consulta la Guía de desarrollo de habilidades y los Parámetros de la plataforma para crear el tuyo propio.



Categoría        | Habilidad              | Qué hace                                                         | Estado
--------------------------------------------------------------------------------------------------------------
Detección        | yolo-detection-2026    | Detección en tiempo real de +80 clases con TensorRT/CoreML/ONNX | ✅
Análisis         | home-security-benchmark| 143 pruebas para evaluar seguridad de LLM y VLM                 | ✅
Privacidad       | depth-estimation       | Anonimización de cámara con mapa de profundidad en tiempo real  | ✅
Anotación        | sam2-segmentation      | Segmentación por clic con máscaras de precisión de píxel        | 📐
Anotación        | dataset-annotation     | Etiquetado asistido por IA → exportación COCO                   | 📐
Capacitación     | model-training         | Fine-tuning YOLO: anotar, entrenar, exportar e implementar      | 📐
Automatización   | mqtt · webhook · ha-trigger | Activadores de automatización basados en eventos            | 📐
Integraciones    | homeassistant-bridge   | Cámaras Home Assistant ↔ resultados de detección                | 📐

✅ Ready · 🧪 Testing · 📐 Planned

🚀 Primeros pasos con SharpAI Aegis
La forma más sencilla de ejecutar las funciones de IA de DeepCamera. Aegis conecta todo: cámaras, modelos, funciones y a ti.

📷 Conecta cámaras en segundos : añade cámaras RTSP/ONVIF, webcams o cámaras de iPhone para una prueba rápida.
🤖 LLM y VLM locales integrados : llama-server incluido, no se necesita configuración adicional.
📦 Implementación de habilidades con un solo clic : instala habilidades desde el catálogo con solución de problemas asistida por IA.
🔽 Descargas de HuggingFace con un solo clic : busca y ejecuta Qwen, DeepSeek, SmolVLM, LLaVA, MiniCPM-V
📊 Encuentra el mejor VLM para tu máquina : compara modelos en tu propio hardware con HomeSec-Bench.
💬 Comunícate con tu guardia a través de Telegram, Discord o Slack. Pregúntale qué sucedió, dile qué debe vigilar y obtén respuestas basadas en inteligencia artificial con grabaciones.

🎯 YOLO 2026 — Detección de objetos en tiempo real

Detección de última generación que se ejecuta localmente en cualquier hardware, totalmente integrada como una habilidad de DeepCamera.
Imagen

Modelos YOLO26

YOLO26 (enero de 2026) elimina NMS y DFL para exportaciones más limpias y menor latencia.
Elige el tamaño que se ajuste a tu hardware:

Modelo        | Parámetros | Latencia (optimizada) | Caso de uso
---------------------------------------------------------------------------
yolo26n       | 2.6 M      | ~2 ms                 | Edge devices, tiempo real en CPU
yolo26s       | 11.2 M     | ~5 ms                 | Equilibrio entre velocidad y precisión
yolo26m       | 25.4 M     | ~12 ms                | Enfocado en precisión
yolo26l       | 52.3 M     | ~25 ms                | Máxima calidad de detección


Todos los modelos detectan más de 80 clases de COCO:
personas, vehículos, animales y objetos cotidianos.
Imagen


⚡ Aceleración de hardware

El sistema detecta automáticamente tu GPU y convierte el modelo al formato nativo más rápido, sin necesidad de configuración manual (env_config.py).

Hardware                     | Formato optimizado     | Tiempo de ejecución | Aceleración vs PyTorch
------------------------------------------------------------------------------------------------
GPU NVIDIA (RTX, Jetson)    | TensorRT.engine        | CUDA                | 3–5x
Apple Silicon (M1–M4)       | CoreML.mlpackage       | ANE + GPU           | ~2x
Intel (CPU, iGPU, NPU)      | OpenVINO IR.xml        | OpenVINO            | 2–3x
GPU AMD (RX, MI)            | ONNX Runtime           | ROCm                | 1.5–2x
Cualquier CPU               | ONNX Runtime           | CPU                 | ~1.5x

Imagen




DEJO ESTE VÍDEO SOBRE CERRADURAS INTELIGENTES

https://www.youtube.com/watch?v=QQ2BL4PXJQo
https://www.youtube.com/watch?v=UTLo3Lxt5e4
Bueno, esto creo que podría mejorar mucho las cosas
https://moondream.ai/blog/photon-real-t ... nally-here

RESUMEN TECNICO: PHOTON (MOONDREAM REAL-TIME VLM)
Photon es el motor de inferencia especializado desarrollado por el equipo de Moondream para la ejecucion de modelos de lenguaje y vision (VLM) en tiempo real. Su arquitectura esta diseñada para eliminar el cuello de botella tradicional entre el procesamiento de imagen y la generacion de texto. Diseñado específicamente para ejecutar modelos de lenguaje y visión (VLM) en tiempo real con una velocidad extrema. lanzado recientemente (marzo de 2026), su propósito principal es permitir que la IA "vea" y analice video o imágenes de forma instantánea, eliminando la latencia que suele afectar a estos modelos

¿Por qué es un gran avance? Tradicionalmente, los VLM eran lentos y pesados. Si querías que una IA analizara una transmisión en vivo, solía haber un retraso de varios segundos. Photon cambia esto, permitiendo aplicaciones donde la respuesta debe ser inmediata, como en la navegación de robots, asistencia en vivo para personas con discapacidad visual o monitoreo de seguridad inteligente.


CARACTERISTICAS TECNICAS:
1. Rendimiento de Inferencia: Alcanza mas de 60 inferencias por segundo (FPS) en hardware de alta gama como NVIDIA H100.
2. Optimizacion de Kernels: Implementacion de bajo nivel diseñada especificamente para la arquitectura de Moondream, lo que reduce la latencia de respuesta inicial.
3. Despliegue en el Edge: Capacidad de ejecucion local en dispositivos como NVIDIA Jetson y estaciones de trabajo personales sin dependencia de APIs externas.
4. Funcionalidades Soportadas: Visual Question Answering (VQA), deteccion de objetos, descripcion de video en vivo y segmentacion de imagenes.

APLICACIONES INDUSTRIALES:
- Robotica y Navegacion: Procesamiento de sensores visuales con respuesta inmediata para evitacion de obstaculos.
- Asistencia en Tiempo Real: Sistemas de apoyo para personas con discapacidad visual que requieren descripcion instantanea del entorno.
- Analisis de Video: Clasificacion y monitoreo de flujos de seguridad sin el retardo habitual de los modelos multimodales convencionales.

COMPARATIVA DE RENDIMIENTO ESTIMADO:
- NVIDIA H100: ~64 FPS
- NVIDIA RTX 4090: ~35-40 FPS
- Apple M3 Max: Optimizado para baja latencia en inferencia local.
Imagen

¿Qué lo hace especial?
-Velocidad sin precedentes: En hardware de alto rendimiento como una NVIDIA H100, Photon puede alcanzar más de 60 inferencias por segundo. Esto es suficiente para procesar video fotograma a fotograma en tiempo real.
-Optimización "de raíz": A diferencia de otros sistemas que intentan optimizar modelos ya existentes, Photon fue diseñado por el mismo equipo que creó el modelo Moondream. Esto permitió ajustar el código (kernels personalizados) específicamente para la arquitectura del modelo y el hardware.
-Eficiencia en el "Edge": No solo funciona en grandes servidores; está optimizado para dispositivos locales y embebidos (como una NVIDIA Jetson), permitiendo que cámaras, drones o robots procesen visión avanzada sin depender de la nube.

Capacidades Multimodales: Soporta tareas complejas como:
-Visual Q&A: Responder preguntas sobre lo que ve la cámara.
-Object Detection: Identificar y localizar objetos.
-Pointing & Segmentation: Señalar partes específicas de una imagen.
@katatsumuri w0w venia a informarme un poco y me encuentro este pedazo de hilo xD
Pero hay mucha info para lo que necesito...

A ver si alguien puede resumir, tengo una terraza exterior donde quiero poner un par de cámaras solares, he mirado amazon y rondan de 40 a 60e las baratillas.
En algunas he visto que viene grabación en la nube 24h gratis o subscripción para su servicio en la nube. También tienen tarjeta TF para grabaciones.

Pero mi idea sería intentar montar algo que grabe en el NAS de casa (aunque es muy viejo (dlink dns340L), antes de comprar la cámara, que debería saber para que sea compatible con esta idea?
Todas las cámaras "chinas" permiten esto o debes pasar por su nube/servidor?

Algún consejo de marca o modelo?

Gracias.
D3 The BesTT escribió:@katatsumuri w0w venia a informarme un poco y me encuentro este pedazo de hilo xD
Pero hay mucha info para lo que necesito...

A ver si alguien puede resumir, tengo una terraza exterior donde quiero poner un par de cámaras solares, he mirado amazon y rondan de 40 a 60e las baratillas.
En algunas he visto que viene grabación en la nube 24h gratis o subscripción para su servicio en la nube. También tienen tarjeta TF para grabaciones.

Pero mi idea sería intentar montar algo que grabe en el NAS de casa (aunque es muy viejo (dlink dns340L), antes de comprar la cámara, que debería saber para que sea compatible con esta idea?
Todas las cámaras "chinas" permiten esto o debes pasar por su nube/servidor?

Algún consejo de marca o modelo?

Gracias.

De cámaras no sé mucho, sobre modelos, etc... yo tengo una Xiaomi y graba gratis en la nube, tiene su propia aplicación donde puedes ver las grabaciones, aunque creo que te borra las grabaciones cada X o si acumula cosas grabadas, eso hay que leerlo bien en el producto que quieres comprar, sus políticas.

Si la cámara es buena detectando el servicio en la nube gratuito es lo mejor, porque te ahorras de pagar nada ni tenerte que montar algo.

Mover actualmente cosas con IA es complejo porque cuesta mucho consumo, aunque con lo que publiqué ayer o el otro día la cosa debería mejorar bastante, pero aún no creo que haya implementación de ello accesible al ser tan reciente, si eres manitas si que puedes implementarlo.

Para que las grabaciones vayan al NAS supongo que vas a necesitar un software que maneje las grabaciones, a veces te viene con la cámara, y también tienes software third como algunos que he posteado aquí.

El problema de las cámaras normales es que no entienden mucho, fallan bastante con las detecciones si son baratas, pero ahí no me puedo meter porque no sé mucho de cámaras, lo que buscaba con este hilo es que con cámaras baratas un software gestionase la imagen de estas y fuese lo suficientemente inteligente como para grabar cuando detecte alguna cosa y que luego la clasifique, eso es lo que hace SharpAI Aegis, que es un software donde instalas LLMs que pueden ver y entender, y luego tienes otros recursos pero son de pago como el ecosistema de unify que es en local pero te obliga a pagar hardware propietario.

A una de malas para grabar en la nube gratis como backup podrías incluso retransmitir a youtube en privado, aunque tendrías que meter un script para que reinicie automáticamente el stream antes de las 24 horas creo, ya que se corta.


Podrías hacer que se vaya todo a youtube directamente y que el software por IA analice el stream de youtube y corte el clip de allí si ve que tiene que grabar algo importante.
@katatsumuri Mucho lio eso de youtube [carcajad]

@D3 The BesT

Si tienes un NAS medio decente (y con NAS me refiero a algo que monte un buen software y que puedas instalar apps usando Docker por ejemplo o HomeAssistant) es posible que tengas ya disponible el software pensado para cámaras.

Por ejemplo, Synology tiene "Surveillance Station" y es canela. Recibe el vídeo de las cámaras y aplica algoritmos para detectar caras y eventos.



QNAP tiene uno similar al de Synology.

Y si eres "apañao" te puedes instalar un Scrypted con HomeAssistant. Tienes de todo. Notificaciones, análisis con algoritmos más complejos, privacidad 100%....


Si compras una cámara para hacer proyectos así, asegúrate que son compatibles con ONVIF (Open Network Video Interface Forum) o RTSP (Real Time Streaming Protocol)

Las Xiaomi y todas estas, están completamente bloqueadas para que pases si o si por su software (y su plataforma, su suscripción....)

Una webcam de 20€ conectada al NAS, con el software adecuado, te puede hacer lo mismo que una cámara de estas con IA de +100€
@xDarkPeTruSxx está muy interesante el synology surveillance station, el único problema que le veo es que también es necesario hardware propietario de synology por lo que he visto, solo para el software, pero está muy interesante el software.

También he leído algo de que necesitas tener licencias para añadir más de 2 cámaras, esto lo he visto por Xpenology, que es una especie de virtualización de DiskStation Manager, el software que manejaría el programa de vigilancia de Synology, para instalarlo en un PC cualquiera.
https://www.reddit.com/r/synology/comme ... _licenses/
Ahí se podría complicar un poco la cosa si necesitas pagar licencias o encontrarlas comprando productos. Si solo vas a poner 2 cámaras en un NAS normal, es gratis. A partir de la tercera, o pagas la licencia (~55€) o compras una cámara oficial de Synology, por lo que se convertiría en una especie de ecosistema como el de UNIFY

Corregidme si me equivoco.

Estaría bien probar xpenology, a ver como se mueve. https://xpenology.net/
El problema que le veo es que parece como una virtualización y gestionar las licencias podría ser más complejo que en nativo.

Lo bueno es que si tienes dinero y no buscas complicaciones te facilita las cosas, igual que Unify.

Dejo otras opciones: Blue Iris, Milestone XProtect. Tengo que revisarlas, pero sería lo de siempre, software con algoritmos tradicionales.
BLUE IRIS https://blueirissoftware.com/
XPROTECT https://www.milestonesys.com/es/product ... /xprotect/

Esos son productos de pago, así que dejo alguno open source o gratuitos:
FRIGATE NVR https://frigate.video/
AGENT DVR https://www.ispyconnect.com/es/docs/agent/about
https://gitlab.com/Shinobi-Systems/Shinobi

Frigate usa modelos de IA avanzados por lo que he visto

FRIGATE NVR / OPEN SOURCE https://frigate.video/ https://github.com/blakeblackshear/frigate
Frigate es un NVR de código abierto creado en torno a la detección de objetos mediante IA en tiempo real. Todo el procesamiento se realiza localmente en su propio hardware y las transmisiones de su cámara nunca salen de su casa.

Obtenga acceso a modelos personalizados diseñados específicamente para Frigate con Frigate+.
Imagen

Los NVR tradicionales pueden requerir horas de ajuste fino para reducir las tasas de falsos positivos porque dependen de una simple detección de movimiento. Al descargar la detección de objetos a un acelerador de IA compatible, incluso un hardware modesto puede ejecutar análisis avanzados para determinar si el movimiento es en realidad una persona, un automóvil u otro objeto de interés. Con el procesamiento local de Frigate, no es necesario pagar para que las imágenes de su cámara personal se envíen a la nube para su análisis.


Deja de revisar sombras y viento y comienza a revisar detecciones que importan
Deje que la IA de Frigate borre sus transmisiones de video por usted. Con un acelerador de IA compatible, Frigate puede ejecutar detecciones de objetos 100+ por segundo para no perder ni un solo cuadro.

Afina tus eventos y alertas con zonas
Frigate rastrea objetos en tiempo real y puede determinar el momento exacto en que una persona comienza a subir las escaleras de su casa o cuando un automóvil ingresa a su camino de entrada. Refina tus notificaciones en función de ubicaciones precisas.
Imagen


Diseñado para Asistente a domicilio con detección de objetos de IA. Utiliza OpenCV y Tensorflow para realizar la detección de objetos en tiempo real localmente para cámaras IP.

Se recomienda encarecidamente el uso de una GPU o un acelerador de IA. Los aceleradores de IA superarán incluso a las mejores CPU con muy poca sobrecarga. Ver el apoyo de Frigate detectores de objetos. https://docs.frigate.video/configuratio ... detectors/

-Estrecha integración con Home Assistant a través de a componente personalizado
-Diseñado para minimizar el uso de recursos y maximizar el rendimiento buscando objetos solo cuando y donde sea necesario
-Aprovecha en gran medida el multiprocesamiento con énfasis en el tiempo real en lugar de procesar cada cuadro
-Utiliza una detección de movimiento de sobrecarga muy baja para determinar dónde ejecutar la detección de objetos
-La detección de objetos con TensorFlow se ejecuta en procesos separados para obtener el máximo FPS
-Se comunica a través de MQTT para una fácil integración en otros sistemas
-Graba vídeo con configuraciones de retención basadas en objetos detectados
-Grabación 24 horas al día, 7 días a la semana
-Retransmisión a través de RTSP para reducir la cantidad de conexiones a su cámara
-Compatibilidad con WebRTC y MSE para visualización en vivo de baja latencia



Integre con Home Assistant y otras plataformas de automatización
Ofrezca sus ojos domésticos integrando la detección de objetos en Home Assistant, OpenHab, NodeRed o cualquier cosa con soporte MQTT. Frigate se integra directamente en el navegador multimedia de Home Assistant, proporciona entidades de cámara de baja latencia y expone sensores en tiempo real y cambia para alimentar automatizaciones y notificaciones a su gusto.


Afina un modelo con tus propios envíos de imágenes
Los NVR tradicionales pueden requerir horas de ajuste fino para reducir las tasas de falsos positivos porque dependen de una simple detección de movimiento. Al descargar la detección de objetos a un acelerador de IA compatible, incluso un hardware modesto puede ejecutar análisis avanzados para determinar si el movimiento es en realidad una persona, un automóvil u otro objeto de interés. Con el procesamiento local de Frigate, no es necesario pagar para que las imágenes de su cámara personal se envíen a la nube para su análisis.

Podrás solicitar un modelo afinado con las imágenes que hayas subido y anotado hasta 12 veces con tu suscripción anual. Se pueden comprar ajustes adicionales por $5 si es necesario.

Imagen



Imagen

Hay algunas cosas sobre los modelos que si son de suscripción con Frigate+

Aquí está la documentación de Frigate+, el servicio de suscripción.
https://docs.frigate.video/plus/

Suscripción a Frigate+
$50/año
Acceso a los modelos de Frigate+
Hasta 12 modelos afinados
La IA sugirió etiquetas para tus cargas
Admite fragata de código abierto



Preguntas frecuentes
No quiero otra suscripción. ¿Qué pasa si cancelo?
Los modelos entrenados durante tu suscripción están disponibles para descargar indefinidamente incluso si decides no renovarlos. Si desea una opción de compra única, simplemente puede cancelar su suscripción y no se renovará al final del año.
¿Tengo que subir imágenes desde mis propias cámaras?
No tienes que hacerlo. Los suscriptores tienen acceso directo a los modelos base entrenados en las imágenes de otros usuarios de Frigate+.
¿Se requiere Frigate+ para el reconocimiento de rostros o matrículas?
No. El reconocimiento facial y de matrículas está integrado directamente en Frigate a partir de la versión 0.16. Esto funciona con o sin una suscripción a Frigate+. Los modelos Frigate+ simplemente mejoran la eficiencia.
¿Puedo entrenar a Frigate+ en cualquier objeto que quiera?
Sólo etiquetas específicas son apoyados. Aún no puedes agregar tus propias etiquetas personalizadas.

Habría que ver que tal de eficientes y como rinden esos modelos en hardware modesto, parece una alternativa a UNIFY bastante interesante.
9 respuestas