[HILO] Inteligencias artificiales conversacionales | Lenguaje y Programación

katatsumuri 14 may 2023 08:53 *

16.306 mensajes
desde ene 2019
en bios

Editado 15 veces. Última: 7/12/2025 - 12:50:14 por katatsumuri.

🔲INTELIGENCIAS ARTIFICIALES GENERATIVAS IMAGEN - VÍDEO - AUDIO - 3D
INTELIGENCIAS ARTIFICIALES CONVERSACIONALES | LENGUAJE Y PROGRAMACIÓN
Imagen

Abro este hilo para ir recopilando las IAs conversacionales ( chat bots ) y modelos de lenguaje y programación que vayan apareciendo, actualmente la mayoría de modelos son propietarios, pero su futuro es que sean completamente libres y de código abierto.

La utilidad de este tipo de IAs abarca varios campos, pueden ayudarnos a encontrar información concreta de cualquier tipo como consultar normativas legales de nuestro país, ayudarnos a hacer la declaración de la renta, escribir código de programación, redactar textos, resumir textos, escribir poesía, traducir idiomas, hablar sobre existencialismo, calcular fórmulas matemáticas, etc... un sinfín de posibilidades.

Estas IAs aún están en las antípodas de lo que serán en un futuro, por poner un ejemplo, aún no pueden reconocer vídeo, por lo que cuando reconozcan vídeo, para haceros una idea de su alcance, podrán diagnosticarnos un melanoma cutáneo simplemente mostrándole por cámara una mancha extraña de nuestra piel.
Imagen

PINOKIO https://pinokio.computer/ https://github.com/pinokiocomputer/pinokio/releases
Pinokio es un software gratuito y de código abierto que funciona como un gestor e instalador de IAs locales y abiertas que funciona mediante scripts, estos scripts permiten su instalación de una forma automatizada sin necesidad de recurrir a tener que hacer mil instalaciones y configuraciones complejas teniendo que ir a cada github, buscado cada versión de python, etc... Es simplemente una interfaz gráfica agradable donde buscas la IA que quieres, le das a instalar y se instala automáticamente en el ordenador, desde pinokio también la lanzas.

Para mi es actualmente la herramienta más importante ya que recopila la mayor parte de estas.
Imagen

GOOGLE AI BARD por GOOGLE
Bard es un bot conversacional de inteligencia artificial desarrollado por Google basado en la familia LaMDA. Se desarrolló como respuesta directa al auge de ChatGPT de OpenAI. Se lanzó de forma limitada en marzo de 2023 con una acogida poco entusiasta.

Lo recomiendo antes que chat GPT ya que no está tan capado, aunque aún no tiene soporte en español, para acceder a este hay que hacerlo a través de VPN ya que ha sido prohibido en Europa.
https://bard.google.com/
Imagen

GPT-4 - CHAT GPT por OpenAI)
GPT-4 es un modelo de lenguaje de gran tamaño creado por OpenAI. Se lanzó el 14 de marzo de 2023 y estará disponible a través de la API y para los usuarios de ChatGPT Plus.
https://openai.com/product/gpt-4

ChatGPT es un prototipo de chatbot de inteligencia artificial desarrollado en 2022 por OpenAI que se especializa en el diálogo. El chatbot es un gran modelo de lenguaje, ajustado con técnicas de aprendizaje tanto supervisadas como de refuerzo. Se basa en el modelo GPT-4 de OpenAI, una versión mejorada de GPT-3.
https://chat.openai.com/
Imagen

BLOOM (código abierto) por BigScience
BLOOM , el primer LLM multilingüe capacitado en total transparencia, para cambiar este status quo: el resultado de la mayor colaboración de investigadores de IA jamás involucrada en un solo proyecto de investigación. Con sus 176 mil millones de parámetros, BLOOM puede generar texto en 46 lenguajes naturales y 13 lenguajes de programación. Para casi todos ellos, como el español, el francés y el árabe, BLOOM será el primer modelo de idioma con más de 100B de parámetros jamás creado. Esta es la culminación de un año de trabajo en el que participaron más de 1000 investigadores de más de 70 países y más de 250 instituciones, lo que llevó a una carrera final de 117 días (del 11 de marzo al 6 de julio) entrenando el modelo BLOOM en la supercomputadora Jean Zay en el sur de París, Francia, gracias a una subvención de cómputo por un valor estimado de 3 millones de euros de las agencias de investigación francesas CNRS y GENCI.
Imagen

Los investigadores ahora pueden descargar, ejecutar y estudiar BLOOM para investigar el rendimiento y el comportamiento de los grandes modelos de lenguaje desarrollados recientemente hasta sus operaciones internas más profundas. En términos más generales, cualquier persona o institución que acepte los términos de la Licencia de IA responsable del modelo (desarrollada durante el propio proyecto BigScience) puede usar y desarrollar el modelo en una máquina local o en un proveedor de la nube, ya que está integrado en Hugging Face. ecosistema, es tan fácil como importarlo con transformadores y ejecutarlo con aceleración. En este espíritu de colaboración y mejora continua, también lanzamos, por primera vez, los puntos de control intermedios y los estados de optimización del entrenamiento. ¿No tienes 8 A100 para jugar? Estamos finalizando una API de inferencia para uso a gran escala incluso sin hardware o ingeniería dedicados. Mientras tanto, para pruebas rápidas, creación de prototipos y uso a menor escala, ya puede jugar con una versión anterior en el concentrador HF.

https://bigscience.huggingface.co/blog/bloom

dinamita4922 14 may 2023 14:02 *

MegaAdicto!!!

5.238 mensajes
desde ene 2005
en sevilla

Editado 2 veces. Última: 14/05/2023 - 14:07:32 por dinamita4922.

Edito

Hilo equivocado

katatsumuri 14 may 2023 15:13 *

16.306 mensajes
desde ene 2019
en bios

Editado 2 veces. Última: 14/05/2023 - 15:24:52 por katatsumuri.

Bard de Google llega a todo el mundo… menos a España y la UE por culpa de ChatGPT

Bard ahora está disponible en más de 180 países en su versión en inglés, japonés y coreano. Pronto se agregarán 40 idiomas más, incluyendo español. Esta esperada expansión llegó con una integración nativa a Google Search, el motor de búsqueda de la empresa, lo que cambiará el modo en que realizamos búsquedas en internet para siempre. Además, el chatbot inteligente de Google promete vincularse con otros servicios del ecosistema de la empresa.

Lo cierto es que este gran avance está lejos de ser accesible en España y otras partes de la Unión Europea y mucho tiene que ver con los problemas alrededor de privacidad que sistemas como ChatGPT han enfrentado en aquella región.]

Imagen

Países como España, Alemania o Italia han puesto en marcha una serie de investigaciones alrededor del funcionamiento de sistemas basados en inteligencia artificial generativa como Bard o ChatGPT.

Las preocupaciones de las autoridades europeas alrededor de la inteligencia artificial no son nuevas. El 21 de abril de 2021, la Comisión Europea propuso la Ley de Inteligencia Artificial (AI Act) con el objetivo de introducir en la Unión Europea (UE) un marco normativo y jurídico común para controlar el uso de la IA en aquella región.

Desde entonces, dicha propuesta de ley se ha actualizado para considerar avances y desarrollos sin precedentes como ChatGPT o Bard. Durante esta semana, el Comité de Mercado Interior y el Comité de Libertades Civiles aprobaron un nuevo borrador de la ley que, entre otras cosas, prohíbe el uso de sistemas de inteligencia artificial para cumplir tareas de vigilancia biométrica masiva.

Bard avanza con pasos de plomo
A principios del mes pasado, los eurodiputados que trabajan en este proyecto de ley publicaron una carta abierta en la que aseguran que el rápido avance de la IA generativa demanda un marcó legal que controle los alcances y riesgos de esta tecnología. “Con la rápida evolución de la poderosa IA, vemos la necesidad de una atención política significativa. Los legisladores aún tenemos algunas negociaciones pendientes, pero esperamos que esta regulación, que cubrirá a todo el mercado de la UE, pueda servir como modelo para otras iniciativas regulatorias […] a lo largo del mundo”, se lee en el documento.

La decisión de Google por no lanzar Bard en la Unión Europea tiene que ver justo con estas medidas. La compañía ha dicho que el lanzamiento de Bard en aquella región deberá esperar hasta tener la garantía de cumplir con las normas locales para evitar enfrentamientos con las autoridades La decisión es también un recurso para cuidar el negocio alrededor del desarrollo IA que ahora está en una etapa incipiente.

Recordemos que tras las intenciones de regulación de la Unión Europea, las empresas relacionadas con desarrollos IA expresaron sus preocupaciones sobre el impacto negativo que una regulación más estricta en el bloque europeo dejará en sus negocios.

Cumplir con los requisitos que serán aplicables en muchos países europeos supone la necesidad de incrementar las inversiones y elevar o poner un costo a sus herramientas. Una encuesta reciente indicaba, ante este escenario, que el 51% de los desarrolladores espera una desaceleración de sus actividades e ingresos como resultado de la nueva Ley de IA.

katatsumuri 20 may 2023 10:21

16.306 mensajes
desde ene 2019
en bios

BLOOM también lanza su propio chat bot

katatsumuri 26 may 2023 14:02 *

16.306 mensajes
desde ene 2019
en bios

Editado 1 vez. Última: 26/05/2023 - 14:05:09 por katatsumuri.

ABRIL 2023
Stability AI lanza el primero de su conjunto de modelos de lenguaje StableLM
https://stability.ai/blog/stability-ai- ... age-models
Stability AI lanzó un nuevo modelo de lenguaje de código abierto, StableLM. La versión Alpha del modelo está disponible en 3 mil millones y 7 mil millones de parámetros, con 15 mil millones a 65 mil millones de modelos de parámetros a continuación. Los desarrolladores pueden inspeccionar, usar y adaptar libremente nuestros modelos base StableLM con fines comerciales o de investigación, sujeto a los términos de la licencia CC BY-SA-4.0.

En 2022, Stability AI impulsó el lanzamiento público de Stable Diffusion, un modelo de imagen revolucionario que representa una alternativa transparente, abierta y escalable a la IA propietaria. Con el lanzamiento del conjunto de modelos StableLM, Stability AI continúa haciendo que la tecnología fundamental de IA sea accesible para todos. Nuestros modelos StableLM pueden generar texto y código y potenciarán una gama de aplicaciones posteriores. Demuestran cómo los modelos pequeños y eficientes pueden ofrecer un alto rendimiento con la formación adecuada.

El lanzamiento de StableLM se basa en nuestra experiencia en modelos de idioma anteriores de código abierto con EleutherAI, un centro de investigación sin fines de lucro. Estos modelos de lenguaje incluyen GPT-J, GPT-NeoX y la suite Pythia, que se entrenaron en el conjunto de datos de código abierto The Pile. Muchos modelos de lenguaje de código abierto recientes continúan basándose en estos esfuerzos, incluidos Cerebras-GPT y Dolly-2.

StableLM está entrenado en un nuevo conjunto de datos experimentales creado en The Pile, pero tres veces más grande con 1,5 billones de tokens de contenido. Publicaremos detalles sobre el conjunto de datos a su debido tiempo. La riqueza de este conjunto de datos otorga a StableLM un rendimiento sorprendentemente alto en tareas de conversación y codificación, a pesar de su pequeño tamaño de 3 a 7 mil millones de parámetros (en comparación, GPT-3 tiene 175 mil millones de parámetros).

También estamos lanzando un conjunto de modelos de investigación que son instrucción afinada. Inicialmente, estos modelos perfeccionados utilizarán una combinación de cinco conjuntos de datos de código abierto recientes para agentes conversacionales: Alpaca, GPT4All, Dolly, ShareGPT y HH. Estos modelos ajustados están destinados únicamente para uso en investigación y se publican bajo una licencia CC BY-NC-SA 4.0 no comercial, en línea con la licencia Alpaca de Stanford.

Vea algunos ejemplos a continuación, producidos por nuestro modelo ajustado de 7 mil millones de parámetros:

Los modelos lingüísticos formarán la columna vertebral de nuestra economía digital y queremos que todos tengan voz en su diseño. Modelos como StableLM demuestran nuestro compromiso con la tecnología de IA que es transparente, accesible y de apoyo:

Transparente. Abrimos nuestros modelos para promover la transparencia y fomentar la confianza. Los investigadores pueden "mirar debajo del capó" para verificar el rendimiento, trabajar en técnicas de interpretación, identificar riesgos potenciales y ayudar a desarrollar salvaguardas. Las organizaciones de los sectores público y privado pueden adaptar ("afinar") estos modelos de código abierto para sus propias aplicaciones sin compartir sus datos confidenciales ni ceder el control de sus capacidades de IA.

Accesible. Diseñamos para el borde para que los usuarios cotidianos puedan ejecutar nuestros modelos en dispositivos locales. Con estos modelos, los desarrolladores pueden crear aplicaciones independientes compatibles con hardware ampliamente disponible en lugar de depender de los servicios propietarios de una o dos empresas. De esta forma, los beneficios económicos de la IA son compartidos por una amplia comunidad de usuarios y desarrolladores. El acceso abierto y detallado a nuestros modelos permite a la amplia comunidad académica y de investigación desarrollar técnicas de interpretación y seguridad más allá de lo que es posible con modelos cerrados.

Apoyo. Construimos modelos para apoyar a nuestros usuarios, no para reemplazarlos. Estamos enfocados en un rendimiento de IA eficiente, especializado y práctico, no en una búsqueda de inteligencia divina. Desarrollamos herramientas que ayudan a las personas y las empresas cotidianas a utilizar la IA para desbloquear la creatividad, aumentar su productividad y abrir nuevas oportunidades económicas.

Los modelos ya están disponibles en nuestro repositorio de GitHub. Publicaremos un informe técnico completo en un futuro cercano y esperamos una colaboración continua con los desarrolladores e investigadores a medida que implementamos la suite StableLM. Además, iniciaremos nuestro programa RLHF de fuente abierta y trabajaremos con esfuerzos comunitarios como Open Assistant para crear un conjunto de datos de fuente abierta para asistentes de IA.

Pronto lanzaremos más modelos y nuestro equipo está creciendo. Si le apasiona democratizar el acceso a esta tecnología y tiene experiencia en LLM, ¡solicite aquí!

Stability AI lanza StableVicuna, el primer chatbot RLHF LLM de código abierto del mundo de IA
https://stability.ai/blog/stablevicuna-open-source-rlhf-chatbot

En los últimos meses, ha habido un impulso significativo en el desarrollo y lanzamiento de chatbots. Desde el chatbot de Character.ai la primavera pasada hasta ChatGPT en noviembre y Bard en diciembre, la experiencia del usuario creada al ajustar los modelos de lenguaje para el chat ha sido un tema candente. La aparición de alternativas de acceso abierto y código abierto ha alimentado aún más este interés.

El entorno actual de los chatbots de código abierto

El éxito de estos modelos de chat se debe a dos paradigmas de formación: el ajuste fino de la instrucción y el aprendizaje reforzado a través de la retroalimentación humana (RLHF). Si bien se han realizado esfuerzos significativos para crear marcos de código abierto para ayudar a entrenar este tipo de modelos, como trlX, trl, DeepSpeed Chat y ColossalAI, hay una falta de acceso abierto y modelos de código abierto que tengan ambos paradigmas aplicados. En la mayoría de los modelos, el ajuste fino de instrucciones se aplica sin entrenamiento RLHF debido a la complejidad que implica.

Recientemente, Open Assistant, Anthropic y Stanford han comenzado a hacer que los conjuntos de datos de chat RLHF estén disponibles para el público. Esos conjuntos de datos, combinados con el entrenamiento sencillo de RLHF proporcionado por trlX, son la columna vertebral para el primer modelo de RLHF y sintonizado con aletas de instrucción a gran escala que presentamos aquí hoy: StableVicuna.

Presentamos el primer chatbot RLHF LLM de código abierto a gran escala

Estamos orgullosos de presentar StableVicuna, el primer chatbot de código abierto a gran escala entrenado a través del aprendizaje reforzado a partir de la retroalimentación humana (RLHF). StableVicuna es una versión de Vicuna v0 13b capacitada en RLHF y afinada con instrucciones adicionales, que es un modelo LLaMA 13b afinado con instrucciones. Para el lector interesado, puede encontrar más sobre Vicuña aquí.

Estos son algunos de los ejemplos con nuestro Chatbot,

Pídele que haga matemáticas básicas. Imagen

Pídele que escriba código Imagen

Pídele que te ayude con la gramática. Imagen

Del mismo modo, aquí hay una serie de puntos de referencia que muestran el rendimiento general de StableVicuna en comparación con otros chatbots de código abierto de tamaño similar.

Imagen

Para lograr el sólido rendimiento de StableVicuna, utilizamos Vicuna como modelo base y seguimos el proceso típico de RLHF de tres etapas descrito por Steinnon et al. y Ouyang et al. Concretamente, entrenamos aún más el modelo base de Vicuña con ajuste fino supervisado (SFT) utilizando una combinación de tres conjuntos de datos:

OpenAssistant Conversations Dataset (OASST1), un corpus de conversación estilo asistente generado por humanos y anotado por humanos que comprende 161 443 mensajes distribuidos en 66 497 árboles de conversación, en 35 idiomas diferentes;

GPT4All Prompt Generations, un conjunto de datos de 437 605 mensajes y respuestas generados por GPT-3.5 Turbo;

Y Alpaca, un conjunto de datos de 52 000 instrucciones y demostraciones generadas por el motor text-davinci-003 de OpenAI.

Usamos trlx para entrenar un modelo de recompensa que primero se inicializa a partir de nuestro modelo SFT adicional en los siguientes conjuntos de datos de preferencias de RLHF:

El conjunto de datos de conversaciones de OpenAssistant (OASST1) contiene 7213 muestras de preferencias;

Anthropic HH-RLHF, un conjunto de datos de preferencias sobre la utilidad e inocuidad del asistente de IA que contiene 160 800 etiquetas humanas;

Y Stanford Human Preferences (SHP), un conjunto de datos de 348.718 preferencias humanas colectivas sobre las respuestas a preguntas/instrucciones en 18 áreas temáticas diferentes, desde cocina hasta filosofía.

Finalmente, usamos trlX para realizar el aprendizaje de refuerzo de optimización de política proximal (PPO) para realizar el entrenamiento RLHF del modelo SFT para llegar a StableVicuna.

Obtención de Vicuña Estable-13B

¡StableVicuna está, por supuesto, en HuggingFace Hub! El modelo se puede descargar como un peso delta contra el modelo LLaMA original. Para obtener StableVicuna-13B, puede descargar el delta de peso desde aquí. Sin embargo, tenga en cuenta que también debe tener acceso al modelo LLaMA original, lo que requiere que solicite los pesos LLaMA por separado mediante el enlace proporcionado en el repositorio de GitHub o aquí. Una vez que tenga tanto el peso delta como los pesos LLaMA, puede usar un script provisto en el repositorio de GitHub para combinarlos y obtener StableVicuna-13B.

Anuncio de nuestra próxima interfaz de chatbot
Imagen

Junto con nuestro chatbot, nos complace presentar una vista previa de nuestra próxima interfaz de chat que se encuentra en las etapas finales de desarrollo. Las siguientes capturas de pantalla ofrecen una idea de lo que los usuarios pueden esperar.

katatsumuri 28 sep 2023 15:48 *

16.306 mensajes
desde ene 2019
en bios

Editado 2 veces. Última: 28/09/2023 - 15:49:34 por katatsumuri.

ChatGPT ahora puede oir, ver y hablar:

lluvia4d 09 nov 2023 00:50

MegaAdicto!!!

790 mensajes
desde jul 2013
en Düsseldorf

Twitter de lluvia4d Steam ID: Lluvia4D

GPT X Perplexity v1 - GPT Custom Instructions

Llevo un tiempo usando perplexity aprovechando el 50% de descuento, he pensado en añadir los beneficios de Perlexity.ai a GPT

Añado unas conversaciones para mostrar el potencia y la sencillez de estas instrucciones, donde solo con una pregunta muy vaga y números, puedes recibir mucha información.

Chat 1

Chat 2

Chat 3

Cómo funciona 🌟💬🔄

Paso 1: "Copiloto 🌟" - Aquí, el GPT revisa tus preguntas para comprender completamente el contexto y solicita información adicional para que la respuesta sea lo más significativa y útil posible. Se trata de adaptar la experiencia a tus necesidades únicas.

Paso 2: "Respuesta 💬" - Con una comprensión completa del Paso 1, la IA proporciona una respuesta detallada, teniendo en cuenta cualquier información adicional del usuario para alinearse estrechamente con sus intereses y objetivos.

Paso 3: "Relacionado 🔄" - Después de la respuesta, obtendrás una lista numerada de temas relacionados para seguir explorando. Esto fomenta el aprendizaje continuo y las inmersiones profundas en temas de interés.
Para la instalación:

https://pastebin.com/0wEZHB6y

Cambiar “English” por Spanish, suelo ir actualizando para afinar las instrucciones.

AxelStone 10 nov 2023 19:34

CRT 15khz fan

14.148 mensajes
desde may 2003
en Sevilla

Página web de AxelStone

No había visto este hilo, muy interesante, creo que las IA tienen mucho que aportar en nuestro día a día. De momento van estupendas como asistentes, esperemos que no llegue el dia que nos reemplacen.

Empecé usando ChatGPT y ahora es justamente el que menos uso. No me gusta que sigue sin poder recabar información de internet y me parece bastante lento respondiendo. Por seguir añadiendo algunos a la lista:

Microsoft Bing Chat / Copilot (no me queda claro cómo llamarlo): funciona bastante bien, responde rápidamente y da respuestas coherentes. A diferencia de ChatGPT se puede conectar a internet por lo que las respuestas son actualizadas y a menudo añade enlaces de referencia. En su contra, no almacena conversaciones como si hace ChatGPT
Aria (chatbot integrado en Opera): muy similar a Copilot en resultado y eficiencia, además de poder conectarse también a internet. Si usas este navegador, viene integrado y es muy cómodo. A diferencia de Copilot, si almacena tus conversaciones para retomarlas.

Deseando que sigan avanzando y puedan generar algo más que contenidos textuales. Sería muy útil por ejemplo que pudiera generarte un excel siguiendo unas instrucciones.

#595049# 14 nov 2023 09:25

AxelStone escribió:No había visto este hilo, muy interesante, creo que las IA tienen mucho que aportar en nuestro día a día. De momento van estupendas como asistentes, esperemos que no llegue el dia que nos reemplacen.

Empecé usando ChatGPT y ahora es justamente el que menos uso. No me gusta que sigue sin poder recabar información de internet y me parece bastante lento respondiendo. Por seguir añadiendo algunos a la lista:
Microsoft Bing Chat / Copilot (no me queda claro cómo llamarlo): funciona bastante bien, responde rápidamente y da respuestas coherentes. A diferencia de ChatGPT se puede conectar a internet por lo que las respuestas son actualizadas y a menudo añade enlaces de referencia. En su contra, no almacena conversaciones como si hace ChatGPT
Aria (chatbot integrado en Opera): muy similar a Copilot en resultado y eficiencia, además de poder conectarse también a internet. Si usas este navegador, viene integrado y es muy cómodo. A diferencia de Copilot, si almacena tus conversaciones para retomarlas.

Deseando que sigan avanzando y puedan generar algo más que contenidos textuales. Sería muy útil por ejemplo que pudiera generarte un excel siguiendo unas instrucciones.

Si pagas chatgpt es muchísimo mejor, le puedes pasar hasta imágenes e incluso está en beta poder crear tus propios chatbots. Es la puta hostia

AxelStone 14 nov 2023 16:46

CRT 15khz fan

14.148 mensajes
desde may 2003
en Sevilla

Página web de AxelStone

@Satoru Gojo Hombre imagino que con una cuota de 20€ debe mejorar mucho la versión gratuita. Estuve a punto de pillar la suscripción, pero con la salida de tantas alternativas (Copilot / Bing, Aria, Bard, etc) eché el freno, creo que de momento van bastante bien.

Lo que aún no hace ninguno es generar contenidos complejos ¿cierto? Se limitan a prompts de texto, enlaces y poco más. Quiero decir, ninguno te genera un excel, word, powerpoint...al menos gratuitos, igual de pago si. Para mi ese sería el verdadero copilot, podría ahorrar mucho trabajo.

katatsumuri 06 dic 2023 18:31 *

16.306 mensajes
desde ene 2019
en bios

Editado 5 veces. Última: 6/12/2023 - 18:56:30 por katatsumuri.

GOOGLE GEMINI YA ESTÁ AQUÍ https://deepmind.google/technologies/ge ... pabilities
Promete rivalizar con GPT-4

sexto 13 mar 2024 12:00

Escribiendo...

14.522 mensajes
desde dic 2007
en Zaragoza

PSN ID: ljhghfghk

Yo uso IAs conversacionales para que me haga algunos cálculos que me da pereza calcular a mí o para que me revise algo de código de Vue, Groovy, Bash o lo que necesite.
Siempre suelo usar ChatGPT, que además de que últimamente me falla (he llegado a este hilo a raíz de otro que precisamente el usuario que lo abrió se quejaba de que no iba bien) no son pocas las veces que me da respuestas incorrectas.
Sin ir más lejos, hoy he calculado una probabilidad cuyo resultado era 4,23% y él me ha dicho 51,2%, así por la cara.

Y no sólo eso, hace unos días le pedí que me dijera álbumes de grupos en los que la batería suene similar a la de St. Anger de Metallica, y me recomendó St. Anger de Metallica.

Dicho esto: ¿Cuál es ahora mismo la mejor IA conversacional, que sea gratis (o barata) y que guarde las conversaciones en servidor (para poder acceder a ellas desde diferentes dispositivos?

katatsumuri 13 mar 2024 15:02 *

16.306 mensajes
desde ene 2019
en bios

Editado 3 veces. Última: 13/03/2024 - 15:05:54 por katatsumuri.

sexto escribió:Yo uso IAs conversacionales para que me haga algunos cálculos que me da pereza calcular a mí o para que me revise algo de código de Vue, Groovy, Bash o lo que necesite.
Siempre suelo usar ChatGPT, que además de que últimamente me falla (he llegado a este hilo a raíz de otro que precisamente el usuario que lo abrió se quejaba de que no iba bien) no son pocas las veces que me da respuestas incorrectas.
Sin ir más lejos, hoy he calculado una probabilidad cuyo resultado era 4,23% y él me ha dicho 51,2%, así por la cara.

Y no sólo eso, hace unos días le pedí que me dijera álbumes de grupos en los que la batería suene similar a la de St. Anger de Metallica, y me recomendó St. Anger de Metallica.

Dicho esto: ¿Cuál es ahora mismo la mejor IA conversacional, que sea gratis (o barata) y que guarde las conversaciones en servidor (para poder acceder a ellas desde diferentes dispositivos?

Actualmente todas son imperfectas, te pueden ayudar en algunas cosas y en otras liártela, solo las debes de usar como un acompañamiento y bajo supervisión humana.

Prueba google gemini, si no pagas GPT estarás usando la versión 3.5, no la 4.

La que no he probado es chat con RTX de NVIDIA

CHAT CON RTX
Ocupa unos 30 GB y se ejecutan en local, no me la he bajado por el peso.
Descarga: https://www.nvidia.com/en-us/ai-on-rtx/ ... rative-ai/

katatsumuri 13 may 2024 20:41 *

16.306 mensajes
desde ene 2019
en bios

Editado 5 veces. Última: 13/05/2024 - 20:56:23 por katatsumuri.

OPEN AI PRESENTA CHAT-GPT4o
La compañía anuncia esta actualización, gratuita y capaz de interactuar con imágenes, vídeo, audio y texto, y el lanzamiento de un asistente de voz parecido a Siri o Alexa

FORMAS DE USAR CHAT GPT 4 GRATIS: https://www.xataka.com/basics/gpt-4-gra ... atgpt-plus

TRADUCCIONES AL VUELO CON CHAT GPT

paco_man 24 may 2024 16:45

Manesho Phupa

11.070 mensajes
desde ene 2011
en paquetado

katatsumuri escribió:OPEN AI PRESENTA CHAT-GPT4o
La compañía anuncia esta actualización, gratuita y capaz de interactuar con imágenes, vídeo, audio y texto, y el lanzamiento de un asistente de voz parecido a Siri o Alexa

FORMAS DE USAR CHAT GPT 4 GRATIS: https://www.xataka.com/basics/gpt-4-gra ... atgpt-plus

TRADUCCIONES AL VUELO CON CHAT GPT

Estoy deseando que salga la aplicación de móvil con gpt4o. Va a suponer un antes y un después.

Un abrazo compañero. [tadoramo]

katatsumuri 17 sep 2024 09:45 *

16.306 mensajes
desde ene 2019
en bios

Editado 2 veces. Última: 17/09/2024 - 09:48:31 por katatsumuri.

SYNTHFLOW AI
Synthflow AI es una plataforma innovadora diseñada para crear agentes de voz de IA conversacionales avanzados que pueden administrar llamadas entrantes y salientes y programar citas las 24 horas del día, los 7 días de la semana, sin necesidad de conocimientos de codificación.
Este modelo conversacional tiene una latencia bajísima https://synthflow.ai/

katatsumuri 30 sep 2024 00:47 *

16.306 mensajes
desde ene 2019
en bios

Editado 1 vez. Última: 30/09/2024 - 00:50:25 por katatsumuri.

EXPERIMENTO ENTRE IA'S PARA VER SI ADIVINAN QUIEN ES EL HUMANO

OPENAI HA LANZADO SU CHATBOT

AxelStone 29 oct 2024 09:16

CRT 15khz fan

14.148 mensajes
desde may 2003
en Sevilla

Página web de AxelStone

Refloto un poco el hilo para preguntar a los usuarios de Opera: ¿habeís notado un bajón tremendo en su IA, Aria? Eso o las demás han avanzado (mucho) más rápido que ella.

Cuando lanzaron el modelo me gustó bastante por sus respuestas simples, rápidas y directas. Vamos que llegué a usarlo con cierta frecuencia por su capacidad de síntesis. A día de hoy me está dando algunas respuestas que me caigo de culo, pongo un ejemplo reciente.

Estoy intentando instalar Veyon, una aplicación de monitorización, y estoy teniendo algunos problemas. Le pregunté a ChatGPT que me sintetizara los pasos para instalar y configurar Veyon por primera vez, a lo cuál pues más o menos me dió una Quick Start Guide (con algunos errores eso sí, algo habitual en las IAs en cualquier caso). La respuesta de Aria a la misma pregunta no tuvo desperdicio, algo tal que:

"Claro que te puedo ayudar. Para instalar Veyon debes seguir los pasos indicados en su documentación oficial, ubicada en..."

Joer, me enlaza la web de Veyon y se lava las manos. Y cada vez veo más respuestas de este tipo. ¿Alguien más ha notado este empobrecimiento de Aria?

ziu 15 nov 2024 17:31 *

MegaAdicto!!!

4.389 mensajes
desde mar 2003

Editado 1 vez. Última: 15/11/2024 - 17:31:56 por ziu.

1 valoración positiva

Hola,
he creado esta encuesta para proponer a EOL que cree un subforo dedicado a la IA con todas sus variantes que abarca, con los votos que tengamos en 1 semana, ya que cada vez la usamos mas en mas ambitos,y necesita un subforo propio.

A votar! [beer]

https://www.elotrolado.net/hilo_encuenta-subforo-de-ia-en-pc_2510733

saludos!

katatsumuri 22 nov 2024 21:41 *

16.306 mensajes
desde ene 2019
en bios

Editado 3 veces. Última: 6/12/2024 - 19:08:09 por katatsumuri.

CONVERTIR UN VÍDEO DE YOUTUBE DE VOZ A TEXTO https://notegpt.io/youtube-transcript-generator
Esta web basada en GPT nos permite pegar cualquier tipo de vídeo y nos transcribirá la voz a texto, incluso podemos descargar el archivo en formato subtítulo o simplemente copiar el texto entero.

@kechua Le pasas el vídeo y te genera los subtítulos automáticamente, tendría que ver si hay algo por github gratuito y para vídeos que no sean de youtube.

https://github.com/pranauv1/AI-Video-Translation
https://github.com/Huanshere/VideoLingo

Esto es para doblaje pero aún está verde
https://github.com/Softcatala/open-dubbing

TRADUCCIÓN EN TIEMPO REAL PARA VIDEOLLAMADAS
https://github.com/pritishyuvraj/videoTranslation?tab=readme-ov-file

katatsumuri 06 dic 2024 02:09 *

16.306 mensajes
desde ene 2019
en bios

Editado 1 vez. Última: 6/12/2024 - 02:27:46 por katatsumuri.

kechua 06 dic 2024 22:14

MegaAdicto!!!

25.658 mensajes
desde jul 2006

@katatsumuri

Muchas gracias

katatsumuri 08 dic 2024 00:40 *

16.306 mensajes
desde ene 2019
en bios

Editado 1 vez. Última: 8/12/2024 - 00:43:37 por katatsumuri.

@kechua ahora estaba mirando una historia porque estoy intentando reproducir una película con subs y quería meterle unos y me ha salido esta maravilla de vídeo

SUBTITLE EDIT
https://github.com/SubtitleEdit/subtitl ... /tag/4.0.8

kaku_20 14 ene 2025 16:21

MegaAdicto!!!

929 mensajes
desde sep 2006

Gamertag: kakulf

buenas tardes estoy mirando para crear un chatbot para que sea comercial , tengo una web de prueba me gustaria ponerle un chatbot educado como comercial lo que la duda me viene por muchos lados porque no se si poner una api de chatgpt o si usar alguna online o si es mejor montarme yo en casa una en red local y darle haceos no se estoy echo un lio
si alguna persona save de este campo o que opcion seria la mejor pero claro con tar que hay que crear el php para ponerlo en la web de pruebas

katatsumuri 13 feb 2025 18:34 *

16.306 mensajes
desde ene 2019
en bios

Editado 1 vez. Última: 13/02/2025 - 18:38:07 por katatsumuri.

Hace unos días google lanzó la app de gemini en la google playstore donde puedes hablar con geminí y preguntarle cosas con la voz en vez de escribiendo, te responde también con voz, aunque considero que la IA aún es bastante limitada y no da respuestas muy inteligentes, lo bueno es que es gratis, tampoco tiene memoria de las conversaciones anteriores, lo cual es una mierda porque no recuerda lo que pudiste corregirle y esas historias.

https://play.google.com/store/apps/deta ... &hl=es_419

Otra cosa que no me gusta es que no sabe si eres hombre o mujer y cosas así, creo que tampoco reconoce cuantas personas hay en un lugar hablando, por ejemplo, si sois dos o tres preguntando, no lo sabe.

AxelStone 11 jun 2025 21:15 *

CRT 15khz fan

14.148 mensajes
desde may 2003
en Sevilla

Página web de AxelStone

Editado 1 vez. Última: 11/06/2025 - 21:17:25 por AxelStone. Reflotado, original: 10/03/2025 - 21:35:57

Vamos a reflotar un poco el hilo y lo hago rompiendo una lanza a favor de Claude, de Anthropic, me ha gustado mucho la naturalidad de sus respuestas. Siempre tenemos en mente los grandes (ChatGPT, Gemini, Copilot, ...) pero debo decir que las respuestas de Claude me han parecido mejor "construidas" que las obtenidas por los demás agentes.

El que veo un poco descolgado últimamente es Copilot, no sé si será cosa mía pero veo sus respuestas pobres, como si se hubiera quedado atascado en su versión de meses atrás mientras los demás siguen avanzando.

P.D.: le di por error a reflotar en vez de responder. Venía a decir, valiente 2 días llevan en chatGPT con los sistemas totalmente fritos, aún siguen con problemas importantes en varias herramientas.

https://status.openai.com

katatsumuri 19 jun 2025 12:03 *

16.306 mensajes
desde ene 2019
en bios

Editado 3 veces. Última: 19/06/2025 - 12:14:42 por katatsumuri.

lolololito escribió:Qué IA aconsejáis para que haga programación (aunque sea básica) ??

actualmente le pido a CHATGPT que me cree SCRIPTS pequeños, y me los hace bastante bien utilizando siempre PYTHON. Me pasa el código, lo compilo y a funcionar.

Qué otras opciones hay?

Yo uso muchas veces IAs conversacionales porque aprendes mucho, a veces se equivocan, pero por lo general son buenas guías, ojalá hubieran existido cuando yo era un niño, es como tener un profesor privado al que le puedes preguntar lo que quieras y pedirle ejemplos, o ponerle directamente tu ejemplos con imágenes y se basa en las imágenes de ejemplo, o pegarle texto y crear una charla donde se nutra de la información de determinada cosa.

Hace tiempo vi un canal de un chico que lleva bastante la actualidad de programación con IA y por lo visto de filtró un prompt que iba genial para programar, a ver si lo encuentro.

Creo que era este el canal, es un canal diría enfocado a la programación usando IA y ahí puedes encontrar mucha información https://www.youtube.com/@midudev/
https://youtu.be/3tU_PrYtZpE

lolololito 19 jun 2025 12:45

MegaAdicto!!!

3.740 mensajes
desde abr 2007

Algúna IA que haga programación de manera bastante automatizada?

Actualmente uso CHATGPT para crear mini programas , y la verdad que me va bastante bien. Me los crea siempre con PYTHON y una vez generados, los compilo y a funcionar. Alguna alternativa útil? o que sea más específica?

katatsumuri 21 jun 2025 01:05 *

16.306 mensajes
desde ene 2019
en bios

Editado 1 vez. Última: 21/06/2025 - 01:05:46 por katatsumuri.

TRANSCRIPCIÓN DE VÍDEO / VOZ A TEXTO PARA SUBTÍTULOS CON PREMIERE PRO
Premiere también tiene una función para transcribir de audio a texto basada en IA.

Egisto 22 jun 2025 07:29 *

Adicto

172 mensajes
desde ene 2012

Editado 1 vez. Última: 22/06/2025 - 07:29:43 por Egisto.

lolololito escribió:Algúna IA que haga programación de manera bastante automatizada?

Actualmente uso CHATGPT para crear mini programas , y la verdad que me va bastante bien. Me los crea siempre con PYTHON y una vez generados, los compilo y a funcionar. Alguna alternativa útil? o que sea más específica?

Hola. Yo uso Cursor con la opción de pago de 20$ al mes. Es una pasada y te permite elegir el modelo que usas para generar código (OpenAI, Claude, etc.). Yo personalmente tengo Claude configurado y la verdad es que va bastante bien.

Esta semana cree un bot de Discord en Python sin tirar una sola línea de código. Como a todas las IAs a veces se le va la olla pero muchas veces es porque el prompt no es todo lo preciso que debería. Cada vez tengo la sensación de que me va mejor y creo que es porque he mejorado yo en la forma de pedirle las cosas.

https://www.cursor.com/

lolololito 22 jun 2025 09:57 *

MegaAdicto!!!

3.740 mensajes
desde abr 2007

Editado 1 vez. Última: 22/06/2025 - 09:59:59 por lolololito.

@katatsumuri se me había saltado la parte que me indicas lo del vídeo de youtube! me lo miro!!!! muchas gracias compañero! siempre estás ahí! no tengo suficiente dinero para agradecer lo que siempre aportas!

@Egisto Genial! lo probaré a ver qué tal.......he hecho una prueba así por encima y es muy rápida (y utilizando la versión gratis), aunque no he probado los scripts generados (pero pinta muy bien)

Aunque parezca mentira, a mí CHATGPT en la versión gratis, me ha hecho bastantes apps sencillitas, pero que me han solucionado muchos problemillas....y bastante rápido

katatsumuri 27 jun 2025 12:26 *

16.306 mensajes
desde ene 2019
en bios

Editado 5 veces. Última: 30/06/2025 - 11:08:17 por katatsumuri.

HUNYUAN-A13B
https://x.com/TencentHunyuan/status/1938525874904801490
Presentamos Hunyuan-A13B, nuestro nuevo LLM de código abierto. Como modelo MoE, aprovecha 80 000 millones de parámetros con tan solo 13 000 millones activos, ofreciendo un rendimiento potente comparable al de o1 y DeepSeek en múltiples benchmarks convencionales. Hunyuan-A13B presenta una arquitectura híbrida con razonamiento dinámico "rápido y lento", destaca en tareas de texto largo y cuenta con capacidades avanzadas de llamada a herramientas de agente para ejecutar tareas complejas con lenguaje natural. Para mejorar aún más las capacidades de los LLM, también hemos publicado dos nuevos conjuntos de datos: ArtifactsBench, diseñado para reducir la brecha visual e interactiva en las evaluaciones de código, mientras que C3-Bench es un conjunto de datos de evaluación específico para agentes, diseñado para revelar vulnerabilidades del modelo y promover la investigación sobre la interpretabilidad del rendimiento. Publicamos Hunyuan-A13B para fomentar la innovación impulsada por la comunidad. Explora la API y los recursos correspondientes a continuación:
Pruébalo en: https://hunyuan.tencent.com
Dirección de la API: https://cloud.tencent.com/product/tclm
GitHub: https://github.com/Tencent-Hunyuan
Hugging Face: https://huggingface.co/tencent/Hunyuan-A13B-Instruct
Conjunto de datos C3-Bench: https://github.com/Tencent-Hunyuan/C3-Benchmark
Conjunto de datos ArtifactsBench: https://github.com/Tencent-Hunyuan/ArtifactsBenchmark

GEMMA 3N
https://x.com/GoogleDeepMind/status/1938278533517746686
Así es Gemma 3n, la nueva IA de Google que no necesita internet para funcionar
Google anunció oficialmente el lanzamiento de su nuevo modelo de inteligencia artificial (IA) de código abierto: Gemma 3n, diseñado para ejecutarse de forma eficiente y sin necesidad de conexión a internet, incluso en smartphones con solo 2GB de memoria RAM.

Este modelo, presentado inicialmente en mayo, está pensado para ofrecer experiencias de IA locales, rápidas y de bajo consumo en teléfonos móviles, tabletas y computadoras portátiles. El nombre «3n» hace referencia a su relación directa con Gemini Nano, ya que comparten la misma arquitectura avanzada optimizada para IA multimodal en dispositivos.

Con el lanzamiento de Gemma 3n, Google amplía su familia de modelos Gemma, ofreciendo capacidades avanzadas de IA en entornos móviles. Además, es compatible con plataformas como Hugging Face Transformers, llama.cpp, Google AI Edge, Ollama y MLX, facilitando su integración para desarrolladores.

Según detalló la empresa en su blog oficial, Gemma 3n supone un gran avance en IA local, al ofrecer «potentes capacidades multimodales» que antes solo se encontraban en modelos complejos basados en la nube. Es capaz de procesar de manera nativa entradas y salidas de texto, imágenes, audio y video.

El modelo se ofrece en dos versiones: E2B, con 2.000 millones de parámetros y funcionamiento con solo 2GB de RAM; y E4B, con 4.000 millones de parámetros, que requiere 3GB de RAM y alcanza una puntuación LMArena superior a 1.300, siendo el primero de su tamaño en lograrlo.

Además, incorpora la arquitectura MatFormer, inspirada en las muñecas rusas Matryoshka, lo que permite «modelos dentro de modelos»; adaptándose a las necesidades de cada dispositivo y optimizando recursos. También emplea técnicas de incrustaciones por capa (PLE), que mejoran la eficiencia de memoria y permiten cargar gran parte de los parámetros en la CPU; aliviando el uso de la VRAM.

Entre sus capacidades, destaca su comprensión en 140 idiomas para texto y su funcionamiento multimodal en 35 idiomas, con aplicaciones en matemáticas, programación y razonamiento.

Gemma 3n ya está disponible en Google AI Studio, así como en Hugging Face, Kaggle, y puede utilizarse en dispositivos mediante herramientas como Google AI Edge Gallery y Ollama.

GEMINI CLI https://blog.google/technology/develope ... -ai-agent/
Google acaba de lanzar un agente CLI que ejecuta Gemini 2.5 localmente, sin navegador, sin clave API, sin coste.
https://youtu.be/9NGNW5trXkU
Para los desarrolladores, la interfaz de línea de comandos (CLI) no es solo una herramienta; es su hogar. La eficiencia, ubicuidad y portabilidad de la terminal la convierten en la herramienta predilecta para trabajar. Y a medida que los desarrolladores dependen de la terminal, también crece la demanda de asistencia integrada con IA.

Por eso presentamos Gemini CLI , un agente de IA de código abierto que integra la potencia de Gemini directamente en tu terminal. Proporciona un acceso sencillo a Gemini, ofreciéndote la ruta más directa desde tu prompt hasta nuestro modelo. Si bien destaca en la programación, Gemini CLI fue diseñado para hacer mucho más. Es una utilidad local versátil que puedes usar para una amplia gama de tareas, desde la generación de contenido y la resolución de problemas hasta la investigación exhaustiva y la gestión de tareas.

También hemos integrado Gemini CLI con el asistente de codificación de IA de Google, Gemini Code Assist , para que todos los desarrolladores (en los planes gratuitos, Standard y Enterprise Code Assist) obtengan codificación basada en indicaciones y con IA primero, tanto en VS Code como en Gemini CLI.

Límites de uso inigualables para desarrolladores individuales
Para usar Gemini CLI gratis, simplemente inicia sesión con tu cuenta personal de Google para obtener una licencia gratuita de Gemini Code Assist. Esta licencia gratuita te da acceso a Gemini 2.5 Pro y a su enorme ventana de contexto de 1 millón de tokens. Para garantizar que rara vez, o nunca, alcances el límite durante esta vista previa, ofrecemos la mayor cantidad de solicitudes de modelo del sector: 60 solicitudes de modelo por minuto y 1000 solicitudes al día sin costo.

Si eres un desarrollador profesional que necesita ejecutar varios agentes simultáneamente, o si prefieres usar modelos específicos, puedes usar una clave de Google AI Studio o Vertex AI para la facturación basada en el uso u obtener una licencia estándar o empresarial de Gemini Code Assist.

ANTHROPIC LIBERA PROMPTS PARA CLAUDE
https://docs.anthropic.com/en/docs/buil ... g/overview
Anthropic es una empresa emergente estadounidense de investigación y desarrollo de inteligencia artificial fundada por exmiembros de OpenAI, pues ha liberado un manual de prompts muy útiles para CLAUDE.

katatsumuri 22 ago 2025 13:34

16.306 mensajes
desde ene 2019
en bios

Me ha hecho bastante gracia la verdad

katatsumuri 07 dic 2025 12:52 *

16.306 mensajes
desde ene 2019
en bios

Editado 3 veces. Última: 7/12/2025 - 12:56:38 por katatsumuri.

Gemini 3 puede crear aplicaciones que convierten modelos 3D en partículas interactivas 3D similares a hologramas y puedes usar las manos para controlarlas, utilizando indicaciones de texto simples, sin necesidad de código.

Literalmente, cualquiera puede crear aplicaciones de 100.000 dólares ahora.

También puede generar un sistema de gestión de instalaciones de edificios interactivo en 3D completo (gemelo digital) utilizando Three.js... sin código, solo indicaciones de texto. Analiza y simula datos en tiempo real para identificar posibles problemas.

TUTORIAL Y PROMPTS: https://elcine.beehiiv.com/p/build-a-fu ... h-gemini-3

Si alguna vez quisiste crear una simulación de edificio interactiva en 3D completa, con iluminación controlada por tiempo, movimiento de personas, mapas de calor, datos energéticos e inspección piso por piso, ahora puedes hacerlo sin necesidad de programación manual.

Simplemente abra Gemini 3, pegue las indicaciones a continuación, deje que genere la base de código completa y coloque todo en Visual Studio Code.

Pulsa "Go Live" y tendrás un panel de control futurista Three.js ejecutándose en tu navegador.

A continuación se muestra el mensaje completo para Gemini 3.

Generará una aplicación web moderna y completa: escena 3D Three.js, tablero Tailwind, sistema de tiempo, lógica de extracción de piso, resaltado interactivo de habitaciones, modos de energía, visualización de confort térmico, garaje subterráneo y más.

Prompt:

Build a Fully-Interactive 3D Office Campus Web App

Goal:

Create a polished, futuristic, bright-looking Three.js interactive office building simulator, with a Tailwind CSS dashboard and multiple data-driven modes.

⸻

Technology & UI

   •   Use Three.js for the 3D scene.

   •   Use Tailwind CSS for the UI dashboard (float on the left, compact and dense).

   •   Right side = fullscreen 3D; left = tabs + sliders + toggles.

   •   Visual style: bright, modern, slightly “sci-fi” with bloom/tonemapping.

   •   The environment and main building should appear clearly lit, not dark.

⸻

3D Scene Setup

   •   Procedurally generate a modern office building with interior rooms, partitions, and different functional zones.

   •   Add simple surrounding buildings + roads (low-poly is fine).

   •   Add a lobby on the first floor with:

   •   a reception bar

   •   a central core (elevators + stairs) spanning all floors

   •   Underground parking garage directly beneath the building.

Interior Details

   •   Floor partitions to separate office/meeting/pantry/core/etc.

   •   Office furniture (gray models; white blends too much):

   •   desks, chairs

   •   meeting tables + TV

   •   pantry with water bar

   •   People = red-tinted 3D human proxies

   •   No people in parking

   •   Ensure character feet sit exactly on the floor (no floating).

⸻

Dashboard Controls (Tailwind)

Three Tabs

   1.   People

   2.   Environment

   3.   Energy

24-Hour Time Slider

Controls:

   •   Sun position

   •   Window emissive intensity (night mode)

   •   People distribution per time period

   •   Shows external environmental metrics (simulated is ok):

   •   temperature

   •   humidity

   •   wind speed

   •   solar radiation

View Modes

   1.   Default: PBR realistic materials

   2.   Heatmap: comfort shown as colored volumetric blocks

   3.   People view: highlights human density + zones

⸻

Behavior Logic

People Simulation

   •   Distribution changes visibly with time:

   •   Work hours → more in offices + meeting rooms

   •   Lunch → more in pantry / rest areas

   •   Not just numbers — 3D positions change dynamically

Energy Mode

Show breakdown by:

   •   cooling

   •   heating

   •   lighting

   •   equipment

   •   hot water

Parking energy includes only lighting + equipment.

⸻

Interactive Features

1. Floor “Drawer” Extraction

   •   Clicking a floor pulls it out like a drawer

   •   Extraction direction:

   •   along the short side

   •   rotated 90° clockwise

   •   Extracted floor = opaque, not transparent

   •   Extracted floor = highlighted; other floors dim

2. Room-Level Interaction

   •   Clicking a room should:

   •   highlight only that room

   •   remove previous ugly yellow wireframe

   •   no highlight when nothing is selected

   •   Add toggle buttons to show functional zones using color blocks.

3. Parking Visibility Toggle

   •   Hide the ground plane when viewing the parking garage

   •   Parking features:

   •   painted parking lines

   •   cars placed without overlap

⸻

Environment & Heat-Comfort

   •   Use colored volumetric blocks for comfort visualization

   •   No Z-fighting with floors or ground

   •   Fix overflow bug (Level 1 comfort cube extruding outside the building)

⸻

Visual & Functional Improvements

   •   Scene must be brighter

   •   Remove neighbor building that obstructs floor extraction

   •   People models more red for clarity

   •   No transparency for extracted objects

   •   Furniture uses gray only

   •   Roof splitting bugs fixed

   •   Heat-comfort mode limited properly inside geometry

⸻

Acceptance Checklist

Gemini should generate code that satisfies:

✔ Sun + time slider updates lighting + emissive windows

✔ People distribution changes visibly by time

✔ Heatmap uses volumetric blocks

✔ Floor extraction is correct (short side, 90° CW, opaque)

✔ Room highlights on click only

✔ Parking visible only after hiding ground

✔ Cars do not overlap

✔ Red people models grounded correctly

✔ Energy breakdown fully functional

✔ Bright scene with “cool” futuristic visual style

[HILO] Inteligencias artificiales conversacionales | Lenguaje y Programación | GOOGLE BARD CHAT GPT