[HO] Inteligencia Artificial (IA)

Ayer estuve debatiendo sobre el tema de la IA, se ponía de manifiesto la evolución que ha tenido la IA con el argumento de que la IA de ahora es muchísimo mejor que la IA de hace dos años, y que la de dentro de dos años será mil veces mejor que la IA de ahora con el alarmismo de que mi trabajo peligra. Yo no estoy de acuerdo.

Trabajo en soporte en la parte de front end con contacto directo con clientes, para un programa bastante complejo, mi empresa entró fuerte con el tema de la IA hace 3 años, hemos hecho mil y un trainings y tenemos mil y una herramientas basadas en IA, como herramientas de lenguaje o búsqueda de artículos la IA es genial, pero a menudo me da información incorrecta y ya cuando le pido un mínimo de razonamiento el resultado es nulo ahora y hace dos años, no he visto ni un ápice de evolución.

Yo no digo que por si acaso no deba prepararme en otros campos, pero a día de hoy como las empresas basen su soporte en IA es un tiro en el pié. Yo de echo cuando trato de contactar con soporte de cualquier otro programa o empresa trato de pasar el bypass de la IA que me pone el artículo de turno que ya había leido por google para intentar dar con un humano.

Llevo 9 años en soporte y tengo claro que es lo que me gusta hacer para el resto de mi vida con programas complejos y mis conocimientos cada vez más profundos, ojala un programa nunca me sustituya.
Es que la IA es un motor de búsqueda automatizado, es decir es como guguel pero en vez de buscar y elegir tú la página que te conviene es ella la que te hace un resumen de lo que le dá la gana.
Por otro lado, el lenguaje de la IA te dá respuestas estadísticas, o sea que mira en su base de datos las palabras o frases que son estadisticamente mas empleadas para responder a las preguntas o propuestas que se le presentan.
Si algún informático o entendido puede describir más exactamente su funcionamiento pues se agradece la información.
Llamarla inteligencia artificial es solo para vender la moto, porque ahí no hay ninguna inteligencia otra que la del programador.
Sin necesidad de IA ya se pueden automatizar brazos robóticos y máquinas y se podría mandar a la mitad de los albañiles a casa y no se hace, el porqué ( costos, calidad, conveniencia) ya es otro debate.
Si la IA llegase a quitarnos trabajos seria un progreso y dejaria tiempo a los humanos para ocuparse de labores mas especializadas, intelectuales o gratificantes, como siempre una herramienta se puede usar bien o mal.
FrutopiA escribió:Ayer estuve debatiendo sobre el tema de la IA, se ponía de manifiesto la evolución que ha tenido la IA con el argumento de que la IA de ahora es muchísimo mejor que la IA de hace dos años, y que la de dentro de dos años será mil veces mejor que la IA de ahora con el alarmismo de que mi trabajo peligra. Yo no estoy de acuerdo.

Trabajo en soporte en la parte de front end con contacto directo con clientes, para un programa bastante complejo, mi empresa entró fuerte con el tema de la IA hace 3 años, hemos hecho mil y un trainings y tenemos mil y una herramientas basadas en IA, como herramientas de lenguaje o búsqueda de artículos la IA es genial, pero a menudo me da información incorrecta y ya cuando le pido un mínimo de razonamiento el resultado es nulo ahora y hace dos años, no he visto ni un ápice de evolución.

Yo no digo que por si acaso no deba prepararme en otros campos, pero a día de hoy como las empresas basen su soporte en IA es un tiro en el pié. Yo de echo cuando trato de contactar con soporte de cualquier otro programa o empresa trato de pasar el bypass de la IA que me pone el artículo de turno que ya había leido por google para intentar dar con un humano.

Llevo 9 años en soporte y tengo claro que es lo que me gusta hacer para el resto de mi vida con programas complejos y mis conocimientos cada vez más profundos, ojala un programa nunca me sustituya.


Sobre esto, comentar que una prima mía trabaja en una empresa tecnológica y lleva un tiempo trabajando en un proyecto para un bufete de abogados para incorporar la IA a la gestión de documentación legal, sentencias, etc... y me dice siempre que están viviendo un infierno porque no hay forma posible de acabar con el tema de las alucinaciones, de manera que la IA se inventa con frecuencia legislación y sentencias que no existen (un problema gravísimo en ese ambito). El problema de esto es que es un tema que no es fácil de arreglar por el camino actual, ya que es un problema intrínseco al funcionamiento de la IA generativa. Como la IA es el tema de moda y todo el mundo la quiere tener en su empresa y tal, las empresas se empeñan en meterla en lo que sea sí o sí, decisiones que normalmente toman personas con conocimientos técnicos nulos o casi nulos, sin darse cuenta de que en ciertos procesos críticos es muy arriesgado o imposible usarla por lo comentado antes. Las dificultades vienen generalmente en problemas que tienen una solución única, ya que la IA funciona a base de suministrar la solución más probable, no la correcta. Por eso se le dan muy bien los problemas que pueden tener multiples soluciones, y muy mal los que tienen una sola.

Edit: Le di a publicar antes de escribir otra cosa sobre esto que leí el otro día... Resulta que Yann LeCun, uno de los tres padres de la IA, que estaba trabajando en Meta hasta hace muy poco, se fué de la empresa por diferencias sobre el tema de hacer mejorar y evolucionar la IA, ya que dice que el camino que están siguiendo actualmente las grandes empresas como Meta, Open.ai y otras, basado en 'la fuerza bruta' y en entrenar modelos cada vez más y más grandes sin cambiar la forma de entrenarlos o intentar crear una nueva arquitectura, es un callejón sin salida que no conduce a nada. Precisamente se refiere a temas como el tema de las alucinaciones, que hay que solucionar y son intrínsecos al funcionamiento de la tecnología, además de que piensa que las IAs actuales 'son tontísimas' (palabras textuales suyas) y no van a mejorar por ese camino. Por lo que él apuesta por intentar cambiar la forma en la que piensan y funcionan totalmente, buscar nuevas arquitecturas innovadoras y no basarse siempre en lo mismo, para lo que ha creado una nueva empresa tras irse de Meta.
SIRDRAK escribió:
FrutopiA escribió:Ayer estuve debatiendo sobre el tema de la IA, se ponía de manifiesto la evolución que ha tenido la IA con el argumento de que la IA de ahora es muchísimo mejor que la IA de hace dos años, y que la de dentro de dos años será mil veces mejor que la IA de ahora con el alarmismo de que mi trabajo peligra. Yo no estoy de acuerdo.

Trabajo en soporte en la parte de front end con contacto directo con clientes, para un programa bastante complejo, mi empresa entró fuerte con el tema de la IA hace 3 años, hemos hecho mil y un trainings y tenemos mil y una herramientas basadas en IA, como herramientas de lenguaje o búsqueda de artículos la IA es genial, pero a menudo me da información incorrecta y ya cuando le pido un mínimo de razonamiento el resultado es nulo ahora y hace dos años, no he visto ni un ápice de evolución.

Yo no digo que por si acaso no deba prepararme en otros campos, pero a día de hoy como las empresas basen su soporte en IA es un tiro en el pié. Yo de echo cuando trato de contactar con soporte de cualquier otro programa o empresa trato de pasar el bypass de la IA que me pone el artículo de turno que ya había leido por google para intentar dar con un humano.

Llevo 9 años en soporte y tengo claro que es lo que me gusta hacer para el resto de mi vida con programas complejos y mis conocimientos cada vez más profundos, ojala un programa nunca me sustituya.


Sobre esto, comentar que una prima mía trabaja en una empresa tecnológica y lleva un tiempo trabajando en un proyecto para un bufete de abogados para incorporar la IA a la gestión de documentación legal, sentencias, etc... y me dice siempre que están viviendo un infierno porque no hay forma posible de acabar con el tema de las alucinaciones, de manera que la IA se inventa con frecuencia legislación y sentencias que no existen (un problema gravísimo en ese ambito). El problema de esto es que es un tema que no es fácil de arreglar por el camino actual, ya que es un problema intrínseco al funcionamiento de la IA generativa. Como la IA es el tema de moda y todo el mundo la quiere tener en su empresa y tal, las empresas se empeñan en meterla en lo que sea sí o sí, decisiones que normalmente toman personas con conocimientos técnicos nulos o casi nulos, sin darse cuenta de que en ciertos procesos críticos es muy arriesgado o imposible usarla por lo comentado antes. Las dificultades vienen generalmente en problemas que tienen una solución única, ya que la IA funciona a base de suministrar la solución más probable, no la correcta. Por eso se le dan muy bien los problemas que pueden tener multiples soluciones, y muy mal los que tienen una sola.

Edit: Le di a publicar antes de escribir otra cosa sobre esto que leí el otro día... Resulta que Yann LeCun, uno de los tres padres de la IA, que estaba trabajando en Meta hasta hace muy poco, se fué de la empresa por diferencias sobre el tema de hacer mejorar y evolucionar la IA, ya que dice que el camino que están siguiendo actualmente las grandes empresas como Meta, Open.ai y otras, basado en 'la fuerza bruta' y en entrenar modelos cada vez más y más grandes sin cambiar la forma de entrenarlos o intentar crear una nueva arquitectura, es un callejón sin salida que no conduce a nada. Precisamente se refiere a temas como el tema de las alucinaciones, que hay que solucionar y son intrínsecos al funcionamiento de la tecnología, además de que piensa que las IAs actuales 'son tontísimas' (palabras textuales suyas) y no van a mejorar por ese camino. Por lo que él apuesta por intentar cambiar la forma en la que piensan y funcionan totalmente, buscar nuevas arquitecturas innovadoras y no basarse siempre en lo mismo, para lo que ha creado una nueva empresa tras irse de Meta.

Lo de tu amiga en el ambito legal supongo que porque estarán utilizando algo genérico y no algo entrenado para tal fin. Al final si en una empresa con muchos casos la entrenas al pasar un tiempo deberia darte cosas parecidas a las que se venian haciendo sin su uso.

Estoy por meterme en meter IA local para trastear generativa (imagen, vídeo ...) Lo que sea OpenSource... Y lanzo pregunta: no os da cosilla meter en un pc que usáis para todo algo tan grande que es jodidamente difícil de analizar que solo esté haciendo lo que crees que está haciendo sin que alguien haya podido colar algo más?
exitfor escribió:
SIRDRAK escribió:
FrutopiA escribió:Ayer estuve debatiendo sobre el tema de la IA, se ponía de manifiesto la evolución que ha tenido la IA con el argumento de que la IA de ahora es muchísimo mejor que la IA de hace dos años, y que la de dentro de dos años será mil veces mejor que la IA de ahora con el alarmismo de que mi trabajo peligra. Yo no estoy de acuerdo.

Trabajo en soporte en la parte de front end con contacto directo con clientes, para un programa bastante complejo, mi empresa entró fuerte con el tema de la IA hace 3 años, hemos hecho mil y un trainings y tenemos mil y una herramientas basadas en IA, como herramientas de lenguaje o búsqueda de artículos la IA es genial, pero a menudo me da información incorrecta y ya cuando le pido un mínimo de razonamiento el resultado es nulo ahora y hace dos años, no he visto ni un ápice de evolución.

Yo no digo que por si acaso no deba prepararme en otros campos, pero a día de hoy como las empresas basen su soporte en IA es un tiro en el pié. Yo de echo cuando trato de contactar con soporte de cualquier otro programa o empresa trato de pasar el bypass de la IA que me pone el artículo de turno que ya había leido por google para intentar dar con un humano.

Llevo 9 años en soporte y tengo claro que es lo que me gusta hacer para el resto de mi vida con programas complejos y mis conocimientos cada vez más profundos, ojala un programa nunca me sustituya.


Sobre esto, comentar que una prima mía trabaja en una empresa tecnológica y lleva un tiempo trabajando en un proyecto para un bufete de abogados para incorporar la IA a la gestión de documentación legal, sentencias, etc... y me dice siempre que están viviendo un infierno porque no hay forma posible de acabar con el tema de las alucinaciones, de manera que la IA se inventa con frecuencia legislación y sentencias que no existen (un problema gravísimo en ese ambito). El problema de esto es que es un tema que no es fácil de arreglar por el camino actual, ya que es un problema intrínseco al funcionamiento de la IA generativa. Como la IA es el tema de moda y todo el mundo la quiere tener en su empresa y tal, las empresas se empeñan en meterla en lo que sea sí o sí, decisiones que normalmente toman personas con conocimientos técnicos nulos o casi nulos, sin darse cuenta de que en ciertos procesos críticos es muy arriesgado o imposible usarla por lo comentado antes. Las dificultades vienen generalmente en problemas que tienen una solución única, ya que la IA funciona a base de suministrar la solución más probable, no la correcta. Por eso se le dan muy bien los problemas que pueden tener multiples soluciones, y muy mal los que tienen una sola.

Edit: Le di a publicar antes de escribir otra cosa sobre esto que leí el otro día... Resulta que Yann LeCun, uno de los tres padres de la IA, que estaba trabajando en Meta hasta hace muy poco, se fué de la empresa por diferencias sobre el tema de hacer mejorar y evolucionar la IA, ya que dice que el camino que están siguiendo actualmente las grandes empresas como Meta, Open.ai y otras, basado en 'la fuerza bruta' y en entrenar modelos cada vez más y más grandes sin cambiar la forma de entrenarlos o intentar crear una nueva arquitectura, es un callejón sin salida que no conduce a nada. Precisamente se refiere a temas como el tema de las alucinaciones, que hay que solucionar y son intrínsecos al funcionamiento de la tecnología, además de que piensa que las IAs actuales 'son tontísimas' (palabras textuales suyas) y no van a mejorar por ese camino. Por lo que él apuesta por intentar cambiar la forma en la que piensan y funcionan totalmente, buscar nuevas arquitecturas innovadoras y no basarse siempre en lo mismo, para lo que ha creado una nueva empresa tras irse de Meta.

Lo de tu amiga en el ambito legal supongo que porque estarán utilizando algo genérico y no algo entrenado para tal fin. Al final si en una empresa con muchos casos la entrenas al pasar un tiempo deberia darte cosas parecidas a las que se venian haciendo sin su uso.

Estoy por meterme en meter IA local para trastear generativa (imagen, vídeo ...) Lo que sea OpenSource... Y lanzo pregunta: no os da cosilla meter en un pc que usáis para todo algo tan grande que es jodidamente difícil de analizar que solo esté haciendo lo que crees que está haciendo sin que alguien haya podido colar algo más?


Para nada, porque eso no funciona así... Si precisamente tienes en local a la hora de usar los modelos es control total hasta del proceso generativo (que puedes modificar y personalizar en ComfyUI, por ejemplo). Además los archivos .safetensors impiden que dentro se pueda meter o ejecutar codigo oculto como sí pasaba antiguamente con los .cpk o los .pth. Donde no tienes control con lo que pasa con tus datos es con las de suscripción, como ya se ha hecho patente varias veces...

El tema de las alucinaciones, por cierto, es imposible de evitar por mucho que entrenes específicamente una IA... Lo puedes reducir, evitar no. Como digo es algo intrínseco al propio funcionamiento de esta tecnología y la única forma de solucionarlo es crear una arquitectura totalmente nueva.
SIRDRAK escribió:
exitfor escribió:
SIRDRAK escribió:
Sobre esto, comentar que una prima mía trabaja en una empresa tecnológica y lleva un tiempo trabajando en un proyecto para un bufete de abogados para incorporar la IA a la gestión de documentación legal, sentencias, etc... y me dice siempre que están viviendo un infierno porque no hay forma posible de acabar con el tema de las alucinaciones, de manera que la IA se inventa con frecuencia legislación y sentencias que no existen (un problema gravísimo en ese ambito). El problema de esto es que es un tema que no es fácil de arreglar por el camino actual, ya que es un problema intrínseco al funcionamiento de la IA generativa. Como la IA es el tema de moda y todo el mundo la quiere tener en su empresa y tal, las empresas se empeñan en meterla en lo que sea sí o sí, decisiones que normalmente toman personas con conocimientos técnicos nulos o casi nulos, sin darse cuenta de que en ciertos procesos críticos es muy arriesgado o imposible usarla por lo comentado antes. Las dificultades vienen generalmente en problemas que tienen una solución única, ya que la IA funciona a base de suministrar la solución más probable, no la correcta. Por eso se le dan muy bien los problemas que pueden tener multiples soluciones, y muy mal los que tienen una sola.

Edit: Le di a publicar antes de escribir otra cosa sobre esto que leí el otro día... Resulta que Yann LeCun, uno de los tres padres de la IA, que estaba trabajando en Meta hasta hace muy poco, se fué de la empresa por diferencias sobre el tema de hacer mejorar y evolucionar la IA, ya que dice que el camino que están siguiendo actualmente las grandes empresas como Meta, Open.ai y otras, basado en 'la fuerza bruta' y en entrenar modelos cada vez más y más grandes sin cambiar la forma de entrenarlos o intentar crear una nueva arquitectura, es un callejón sin salida que no conduce a nada. Precisamente se refiere a temas como el tema de las alucinaciones, que hay que solucionar y son intrínsecos al funcionamiento de la tecnología, además de que piensa que las IAs actuales 'son tontísimas' (palabras textuales suyas) y no van a mejorar por ese camino. Por lo que él apuesta por intentar cambiar la forma en la que piensan y funcionan totalmente, buscar nuevas arquitecturas innovadoras y no basarse siempre en lo mismo, para lo que ha creado una nueva empresa tras irse de Meta.

Lo de tu amiga en el ambito legal supongo que porque estarán utilizando algo genérico y no algo entrenado para tal fin. Al final si en una empresa con muchos casos la entrenas al pasar un tiempo deberia darte cosas parecidas a las que se venian haciendo sin su uso.

Estoy por meterme en meter IA local para trastear generativa (imagen, vídeo ...) Lo que sea OpenSource... Y lanzo pregunta: no os da cosilla meter en un pc que usáis para todo algo tan grande que es jodidamente difícil de analizar que solo esté haciendo lo que crees que está haciendo sin que alguien haya podido colar algo más?


Para nada, porque eso no funciona así... Si precisamente tienes en local a la hora de usar los modelos es control total hasta del proceso generativo (que puedes modificar y personalizar en ComfyUI, por ejemplo). Además los archivos .safetensors impiden que dentro se pueda meter o ejecutar codigo oculto como sí pasaba antiguamente con los .cpk o los .pth. Donde no tienes control con lo que pasa con tus datos es con las de suscripción, como ya se ha hecho patente varias veces...

El tema de las alucinaciones, por cierto, es imposible de evitar por mucho que entrenes específicamente una IA... Lo puedes reducir, evitar no. Como digo es algo intrínseco al propio funcionamiento de esta tecnología y la única forma de solucionarlo es crear una arquitectura totalmente nueva.

Pero en la suscripción le das solo la info que quieres, no le permites acceso local. Y en ia los procesos son intensos, largos, y analizar codigo de "entorno" "modelo" "lora"... me pego un tiro si pensara tener que hacerlo (como alguna vez he hecho en el pasado con alguna pequeña aplicación clasica opensource antes de utilizarla).
exitfor escribió:
SIRDRAK escribió:
exitfor escribió:Lo de tu amiga en el ambito legal supongo que porque estarán utilizando algo genérico y no algo entrenado para tal fin. Al final si en una empresa con muchos casos la entrenas al pasar un tiempo deberia darte cosas parecidas a las que se venian haciendo sin su uso.

Estoy por meterme en meter IA local para trastear generativa (imagen, vídeo ...) Lo que sea OpenSource... Y lanzo pregunta: no os da cosilla meter en un pc que usáis para todo algo tan grande que es jodidamente difícil de analizar que solo esté haciendo lo que crees que está haciendo sin que alguien haya podido colar algo más?


Para nada, porque eso no funciona así... Si precisamente tienes en local a la hora de usar los modelos es control total hasta del proceso generativo (que puedes modificar y personalizar en ComfyUI, por ejemplo). Además los archivos .safetensors impiden que dentro se pueda meter o ejecutar codigo oculto como sí pasaba antiguamente con los .cpk o los .pth. Donde no tienes control con lo que pasa con tus datos es con las de suscripción, como ya se ha hecho patente varias veces...

El tema de las alucinaciones, por cierto, es imposible de evitar por mucho que entrenes específicamente una IA... Lo puedes reducir, evitar no. Como digo es algo intrínseco al propio funcionamiento de esta tecnología y la única forma de solucionarlo es crear una arquitectura totalmente nueva.

Pero en la suscripción le das solo la info que quieres, no le permites acceso local. Y en ia los procesos son intensos, largos, y analizar codigo de "entorno" "modelo" "lora"... me pego un tiro si pensara tener que hacerlo (como alguna vez he hecho en el pasado con alguna pequeña aplicación clasica opensource antes de utilizarla).



Ya, por eso la UE sancionó a Open.ai por la gestión de los datos de sus usuarios, por ejemplo, y hasta el gobierno italiano estuvo a punto de prohibir el uso de ChatGPT... Y por eso, los navegadores con AI que han publicado estas empresas hace poco no desataron un escándalo por estar plagados de agujeros de seguridad frente a los navegadores clásicos. En un lora o un checkpoint en local no tienes que analizar nada porque no hay 'código que pueda ser ejecutado' en esos archivos (en los .safetensors que se crearon y se llaman así precisamente por eso, porque en lo que había antes sí se podía meter código). No hay nada más seguro que tener tú mismo los archivos en local y poder tener todo el control de lo que hacen y hasta entrenarlos tu mismo... En el momento de que dependas de cualquier servicio online (sea el que sea, ya no específicamente de IA) estás vendido, y no tienes mas que ver lo frecuentes que son las filtraciones de datos, con literalmente los datos de cientos de millones e incluso miles de millones de personas circulando por ahí (posiblemente haya datos tuyos de una filtración previa y no lo sepas, como la de la DGT, la de todos los clientes españoles de The Phone House, etc...).
@SIRDRAK que no te digo que no, pero un sevicio online puede tener mis datos de suscripción y las fotos que le pueda pasar.

Algo en local que se vaya de madre, estás accediendo a tus correos, banco, etc. Contraseñas en navegadores y mil cosas más .A eso me quiero referir.
Yo tengo alguna duda ya que a penas he usado chatGPT y hace unos días me llamó la atención una cosa...

El crío se estaba leyendo un libro en euskera para el cole y como no tengo ni puta idea de euskera y sabía que existía el mismo en castellano me dio por hacerle unas preguntas sobre el libro a chatGPT para poder ayudar a mi hijo...

El libro en cuestión es este:

Imagen

Y esto es todo lo que me dijo del libro...

Claro. Aquí tienes un resumen más extenso, estructurado y adecuado para presentar en una clase, sobre el primer libro Max Burbuja 1: Dejadme en paz de El Hematocrítico.
(No contiene spoilers mayores, pero sí explica bien los temas y el desarrollo general.)



Resumen Extenso de “Max Burbuja 1: Dejadme en paz”

Max Burbuja es un niño de primaria que vive rodeado de obligaciones, expectativas y actividades constantes. Aunque es sensible, creativo y con mucha imaginación, Max siente que su vida está demasiado llena y que no tiene casi tiempo para él mismo. A través de su voz fresca y humorística, el libro nos muestra su día a día y cómo se va cargando emocionalmente.

1. La vida diaria de Max

Desde el principio se entiende que Max está “llenísimo de cosas”:
• Su madre lo apunta a muchas actividades artísticas y de bienestar: talleres, mandalas, mindfulness, proyectos manuales…
• Su padre, en cambio, organiza excursiones, rutas de senderismo y actividades en la naturaleza cada vez que están juntos.
• En el colegio también hay deberes, cumpleaños de compañeros, encargos y responsabilidades.

Aunque todo viene con buena intención, para Max es demasiado. No tiene tiempo para descansar, aburrirse, jugar libremente o simplemente hacer nada.

2. La sensación de estar desbordado

El libro muestra de forma divertida cómo Max va estallando por dentro. Cada actividad nueva parece una gota más en un vaso que ya rebosa.
Max quiere ser un niño normal, pero siente que los adultos lo tratan como un proyecto que siempre debe mejorarse: ser más sensible, más deportista, más despierto, más creativo.

Mientras tanto, él solo quiere un respiro.

3. Relaciones con su familia

La familia de Max está separada, y eso añade más cambios y ritmo a su vida.
• Con su madre vive un ambiente muy “zen”, con música relajante y propuestas creativas.
• Con su padre vive aventuras al aire libre que a veces son demasiado intensas para él.

Aunque lo quieren mucho, ninguno se da cuenta de que Max necesita algo que no está en ningún manual: tiempo libre auténtico.

4. La escuela y los amigos

En el colegio, Max tiene un grupo de amigos y vive situaciones típicas:
• el caos de los cumpleaños,
• los encargados de clase,
• las normas que a veces no tienen sentido,
• y las conversaciones graciosas y sinceras que solo ocurren entre niños.

Estas escenas aportan humor y ayudan a que los lectores se identifiquen con él.

5. El conflicto central

El conflicto del libro no es una gran aventura externa, sino algo más cercano: cómo Max gestiona sentirse saturado.
Cada capítulo muestra un momento en el que Max piensa o dice internamente: “¡Dejadme en paz!”. Pero pocas veces se atreve a decirlo en voz alta porque no quiere decepcionar a nadie.

Ese es el corazón del libro: un niño intentando encontrar su propio espacio dentro de un mundo que constantemente lo empuja hacia hacer más.

6. Resolución y mensaje

A lo largo del libro, Max va entendiendo que tiene derecho a pedir descanso, a expresar que está cansado y a decir “no” sin sentirse culpable.
Aunque su entorno no cambia completamente, los adultos empiezan a notar lo que le ocurre, y Max aprende a defender su necesidad de tranquilidad.

La historia deja varios mensajes importantes:
• Los niños también necesitan pausas reales.
• Tener demasiadas actividades puede ser tan agotador como para un adulto.
• Escuchar a los niños es fundamental; a veces sus emociones son más claras que las de los mayores.
• El equilibrio entre obligaciones, diversión y descanso es clave para un bienestar sano.

7. El estilo del libro
• Muy humorístico, con situaciones exageradas pero realistas.
• Ilustraciones que apoyan el tono cómico.
• Capítulos cortos y lenguaje cercano.
• Ideal para primeros lectores y también para trabajar en clase sobre emociones y autocuidado.



Si quieres, puedo prepararte una versión para exponer oralmente, una ficha de análisis literario, o preguntas para trabajar en clase con los alumnos. ¿Cuál prefieres?

Aquí tienes una versión preparada para exponer oralmente, con un lenguaje claro, natural y adecuado para una presentación frente a clase. Puedes leerla tal cual o adaptarla a tu estilo:



Exposición oral sobre Max Burbuja 1: Dejadme en paz

Hoy voy a presentar el libro Max Burbuja 1: Dejadme en paz, escrito por El Hematocrítico. Es un libro infantil muy divertido, pero también habla de un tema importante: cómo a veces los niños tienen tantas actividades y responsabilidades que acaban completamente agotados.

El protagonista es Max Burbuja, un niño de primaria que vive siempre con prisas y con un montón de cosas que hacer. Su madre quiere que sea creativo y relajado, así que lo apunta a talleres, a ejercicios de mindfulness y a actividades artísticas. Su padre, por el contrario, está obsesionado con que Max viva aventuras en la naturaleza, así que cuando están juntos lo lleva a excursiones y rutas que a veces son demasiado intensas.

Además de todo eso, Max tiene la escuela, los deberes, los encargos de clase y los cumpleaños de sus compañeros… y llega un momento en el que ya no puede más. Él siente que los adultos lo llevan de un lado para otro y que nunca tiene tiempo para descansar o simplemente para jugar por su cuenta. Todo lo que quiere es un poco de tranquilidad y poder decir: “¡Dejadme en paz!”

A lo largo del libro vemos situaciones muy graciosas que muestran lo sobrecargado que está. Aunque sus padres actúan con buena intención, no se dan cuenta de que Max necesita algo muy sencillo: parar un poco y escuchar sus propias emociones. Él no quiere decepcionar a nadie, pero tampoco quiere vivir tan acelerado.

Lo más interesante del libro es su mensaje. Por un lado, nos recuerda que los niños también tienen derecho a descansar y a tener momentos de calma. Y por otro lado, invita a los adultos a fijarse más en cómo se sienten los niños, porque a veces sus vidas están tan organizadas que olvidan que también necesitan tiempo libre.

El estilo del libro es muy cercano, lleno de humor y con ilustraciones que hacen la lectura aún más divertida. Es fácil identificarse con Max porque todos, niños o adultos, nos hemos sentido alguna vez demasiado ocupados.

En resumen, Max Burbuja 1: Dejadme en paz es un libro que mezcla humor, situaciones cotidianas y una reflexión muy actual sobre la presión que pueden sentir los niños. Es una lectura entretenida, útil para trabajar las emociones, y que nos anima a recordar que descansar también es importante.



Si quieres, puedo prepararte una versión más corta, una más larga, tarjetas de apoyo o incluso un guion para acompañar con diapositivas. ¿Prefieres alguna de esas opciones?

Claro, aquí tienes una versión breve, muy clara y fácil de decir para un niño de 8 años:



Exposición corta para un niño de 8 años

Hoy voy a hablar del libro Max Burbuja: Dejadme en paz. El protagonista es Max, un niño que tiene demasiadas cosas que hacer. Su madre lo apunta a actividades de arte y de relajación, y su padre lo lleva a muchas excursiones a la naturaleza. Además tiene el cole, los deberes y los cumpleaños de sus amigos.

Aunque todo parece divertido, Max está cansado de hacer tantas cosas seguidas. Siente que nunca tiene un momento para él, para descansar o jugar tranquilo. Por eso, lo único que quiere decir es: “¡Dejadme en paz!”.

El libro es muy gracioso y tiene ilustraciones. Pero también nos enseña algo importante: que los niños necesitamos tiempo para relajarnos y no tener la agenda tan llena. A veces solo queremos un rato de calma.

En resumen, Max Burbuja es un libro divertido que nos recuerda que descansar también es importante.



Si quieres, puedo hacerlo aún más corto, más fácil, o incluso ayudarte a practicar cómo decirlo.

Personajes principales del libro

1. Max Burbuja

Es el protagonista.
• Es un niño sensible, con mucha imaginación.
• A veces se estresa porque tiene demasiadas actividades.
• Solo quiere un poco de tranquilidad y tiempo libre.
• Es divertido y observa el mundo de una manera muy graciosa.

2. La madre de Max
• Es muy cariñosa.
• Le encantan las actividades creativas, relajantes y “zen”.
• Apunta a Max a talleres, manualidades y ejercicios de calma.
• No se da cuenta de que Max a veces necesita menos cosas, no más.

3. El padre de Max
• También lo quiere mucho, pero de otra forma.
• Le encanta la naturaleza y las aventuras.
• Siempre quiere que Max haga excursiones y rutas.
• A veces se emociona tanto que se olvida de que Max puede cansarse.



Personajes secundarios

4. Los amigos del colegio

Max tiene una pandilla en la escuela.
• Con ellos vive situaciones típicas: juegos, conversaciones divertidas, cumpleaños, pequeños enfados…
• Representan la parte más alegre y normal de su día a día.

5. Compañeros y profesores del cole
• Aparecen en escenas cortas.
• Algunos ponen normas, encargos o deberes que aumentan la sensación de “día lleno” que tiene Max.
• Otros son simplemente parte del ambiente escolar.



6. Otros adultos “bienintencionados”

Aparecen algunos personajes que quieren ayudar a Max, pero que en realidad le añaden más actividades. Por ejemplo:
• La persona que organiza talleres creativos.
• Adultos que le proponen retos o actividades “para mejorar”.

Estos personajes sirven para mostrar cómo los adultos, aunque quieran lo mejor, a veces no escuchan lo que los niños realmente necesitan.




Entonces mis dudas son...

1.- La inteligencia artificial a la que le preguntaba accede en tiempo real al libro.., lo lee en décimas de segundo y me hace un resumen en otras décimas de segundo??

2.- Si no es así dónde consulta todo lo que pregunto en tiempo real??

3.- Puedes acceder a resúmenes o preguntarle cualquier cosa de cualquier libro del mercado??


De verdad que estas cosas empiezan a superarme :Ð
SIRDRAK escribió:
rammestino escribió:Una pregunta para los expertos......quiero tener una herramienta de texto a video. He oído hablar maravillas de Wan 2.5 (que supuestamente se podía descargar de Hugging Face) pero no veo forma de conseguirlo. Creo que primero necesito una herramienta para poder cargar LLMs en local, que no recuerdo ahora cómo se llamaba. Me podéis ayudar?


No, Wan 2.5 por ahora sólo está disponible en su servicio online, es decir, aún no lo han liberado como las versiones anteriores... Lo que tú necesitas es Wan 2.2 o Hunyuan Video 1.5. Como te veo un poco perdido y esto es más complejo al inicio de lo que parece, te diré que tu mejor opción para empezar, la más sencilla, es recurrir a Pinokio. Pinokio es un gestor de aplicaciones de IA que tiene la ventaja de que él sólo se encarga de descargar e instalar todo lo necesario en tu lugar de forma automática, y que las aplicaciones se instalan en 1 click de la misma forma. En tu caso, puesto que quieres generar vídeo, lo que tendrías que hacer es instalar Pinokio desde su web oficial, y una vez hecho eso, y con Pinokio abierto, en esa misma web debajo de donde está el botón de descarga, hay un listado de aplicaciones recomendadas. La que te interesa es Wan2GP, que aparece como Wan 2.1 en el listado mencionado. Sólo has de hacer 1 click sobre ella y se instalará en Pinokio, y de la misma forma, los modelos los descarga automáticamente la primera vez que los utilices. Tiene soporte para todos los modelos de vídeo actuales como los mencionados antes en todas sus variantes, y además también de modelos de imagen como Flux o Qwen Image/Quen Image Edit. La web oficial de Pinokio es esta: https://pinokio.co/


Gracias, Sirdrak. Me lo he instalado pero para Wan2GP me requiere instalar Visual Studio. El tema es que mi Unidad C esta petada y le he dicho de instalar Pinokio en F. Cuando llega la hora de instalar Visual Studio se vuelve loco en un bucle instalándola pero no hay manera de que lo haga. Estoy frustrado. [buuuaaaa]
@Torres es bastante simple, tu piensa que a mediados-finales de los 90, ya estaban metiendo enciclopedias en CDs...

y un CD son 700 cochinos megas. Que ya te contenia el texto de una enciclopedia, y les sobraba para meterte gráficos y música extra.

Imagina estos modelos entonces, que te pesan un porrón de gigas... son prácticamente el chiste de la serie esa de "The it crowd", cuando el personaje de la chica le presenta a un puñado de trajeados, "y esto es internet" señalando a una caja, pero ahora, más o menos en serio. Porque te puedes bajar un modelo local de los open source que existen, y consultarlo en tu pc sin que acceda a internet, tienen toneladas de información.

Los modelos online que podemos usar pueden llegar a ser muchísimo más tochos que esos, y encima pueden acceder a datos online la mayoría de ellos tal como les preguntes, vamos que en el caso del libro que comentas, pueden pasar dos cosas...
a) el libro ya estaba entre los datos del modelo, o
b) el modelo ha accedido a datos sobre el libro de internet

precisamente hace poco, la prensa española ha denunciado a no recuerdo si era chatgpt pidiendo pasta, porque denunciaban que open ai había metido hemeroteca a cascoporro de sus medios al modelo por la cara, algo que open ai ha hecho con muchísimo material con copyright... bueno ellos y diría que casi todas estas empresas de IA.
En mi sector hay bastante escepticismo porque, cuando llega la hora de la verdad, la IA no te saca la papeleta. Trabajo como cámara ENG —coberturas en exteriores y sucesos— y no solo creemos que la IA no nos va a sustituir sino que es probable que nuestro trabajo se revalorice. Otra cosa son los entornos controlados: en plató, con iluminación fija, hace tiempo que casi no hay operadores de cámara y muchas funciones se gestionan desde realización. El movimiento lógico ahí es que desaparezca parte de la figura del operador de realización y sea el realizador quien programe las cámaras. Pero en exterior lo veo muy difícil: una IA que salga rápido en coche, se meta en una zona complicada, se mueva con criterio, elija bien dónde grabar y, además, mantenga la calidad… lo veo MUY complicado (y más con los ritmos a los que trabajamos).

Donde sí he visto mucha mejora es cuando tienes que hacer algún contenido de pequeña duración pero con muchos efectos (tipo spots de detergentes, champús...y, quizás, colonias). Esa subrama la veo con los días contados.

Y, aun así, en mi campo uso bastante la IA como apoyo. Sobre todo para corregir problemas que no puedes controlar en toma. Principalmente, para limpiar audios de declaraciones con mucho ruido ambiente cuando tienes que enviar un vídeo editado en 20 minutos a Madrid. Antes había que abrir un editor de audio, hacer una capturar de ruido, hacer pruebas y rezar. Ahora subes el clip, eliges el grado de reducción y directo a la línea de tiempo. Lo mismo con algunos micrófonos que ya incorporan IA para ajustar filtros y mejorar la señal al vuelo.

Lo que también creo que está claro es que si sabes integrar la IA en tu trabajo tienes muchas papeletas para poder continuar.
Ekir escribió:@Torres es bastante simple, tu piensa que a mediados-finales de los 90, ya estaban metiendo enciclopedias en CDs...

y un CD son 700 cochinos megas. Que ya te contenia el texto de una enciclopedia, y les sobraba para meterte gráficos y música extra.

Imagina estos modelos entonces, que te pesan un porrón de gigas... son prácticamente el chiste de la serie esa de "The it crowd", cuando el personaje de la chica le presenta a un puñado de trajeados, "y esto es internet" señalando a una caja, pero ahora, más o menos en serio. Porque te puedes bajar un modelo local de los open source que existen, y consultarlo en tu pc sin que acceda a internet, tienen toneladas de información.

Los modelos online que podemos usar pueden llegar a ser muchísimo más tochos que esos, y encima pueden acceder a datos online la mayoría de ellos tal como les preguntes, vamos que en el caso del libro que comentas, pueden pasar dos cosas...
a) el libro ya estaba entre los datos del modelo, o
b) el modelo ha accedido a datos sobre el libro de internet

precisamente hace poco, la prensa española ha denunciado a no recuerdo si era chatgpt pidiendo pasta, porque denunciaban que open ai había metido hemeroteca a cascoporro de sus medios al modelo por la cara, algo que open ai ha hecho con muchísimo material con copyright... bueno ellos y diría que casi todas estas empresas de IA.


Ya pero a la encarta no le podías pedir el resumen de un libro o que te explicase el impacto del personaje X en el desarrollo del libro... Me refiero a que no es información cerrada.., no es un resumen que te busca la IA en una base de datos.., es un resumen que te hace en el momento... Por eso digo si tiene acceso en tiempo real a ese libro y se lo puede leer para hacerte el resumen o te puede saber decir los personajes del libro y cómo actúa cada uno... Eso no es una base de datos...
@Torres
Yo pienso que si, es una base de datos inmensa donde un programa ultrarápido elige los fragmentos que te va a presentar de forma estadistica.
Yo diria que accede al texto, y propone un resumen en el cual privilegia las partes que mas aparecen en esas bases

1.- La inteligencia artificial a la que le preguntaba accede en tiempo real al libro.., lo lee en décimas de segundo y me hace un resumen en otras décimas de segundo??

Si

3.- Puedes acceder a resúmenes o preguntarle cualquier cosa de cualquier libro del mercado??

Siempre que estén en sus bases de datos y no sean restringidos de acceso por H o por B
Para los que quieran iniciarse en esto de usar IAs opensource en local y ComfyUI les parece muy complejo, aprovecho que hoy AcademiaSD ha publicado un vídeo sobre el nuevo modelo que está haciendo furor para generar imágenes, Z-image Turbo, en el que además no sólo explica como instalar Forge Neo desde cero, incluyendo también de dónde y cómo descargar Z-image, sino que incluso proporciona una utilidad para que se instale todo en 1-click de la forma más sencilla posible. Es una gran oportunidad, porque Forge Neo es una de las interfaces que eran más ampliamente usadas para generar imágenes, y lo sigue siendo mejor y más cómoda para usar ciertos modelos, además de que proporciona muchísimos modos y herramientas, como el modo img2img o el modo de edición para hacer inpaint de las imágenes, además de soportar un montón de extensiones para añadir funcionalidades nuevas, todo ello con una interfaz intuituva y fácil de usar. Esta versión (Neo) es un fork del Forge original al que se le ha incorporado soporte de todas las IA para generar imágenes actuales (Chroma, Qwen, Flux Kontext, Z-image, etc...) e incluso permite hacer vídeos con Wan, a pesar de que para esto son más indicados Wan2GP o ComfyUI.

Sobre Z-image, el tema es bastante curioso y lo he vivido en directo: Resulta que todo esto empezó el día 25 cuando en teoría tenía que aparecer una nueva versión anunciada previamente de Qwen Image Edit, concretamente la 2511, otro modelo de edición de imágenes estilo Flux Kontext/Nano Banana de Alibaba muy popular. Ese mismo día, para 'hacerle la puñeta' a los de Alibaba, van los de Black Forest Labs (antiguos miembros de Stability.ai y creadores del famosísimo Flux) y presentan y publican nada menos que Flux 2.Dev, la nueva versión de su famosísimo modelo de imagen con unas características apabullantes (capacidad de hacer de forma nativa imágenes de hasta 4 MP, 32B de parámetros su Unet y usando de Text Encoder un LLM completo de 24B, Mistral, nada menos, permitiendo prompts de más de 35000 tokens, capacidades de edición de imágenes avanzadísimas que miran de tú a tú a Nano Banana Neo, pudiendo usar un número ilimitado de imágenes de referencia -en teoría-,etc...).

Como es obvio desata muchísimo interés las primeras horas, pero tiene varias pegas muy grandes como son su enorme tamaño, que hace muy difícil su uso incluso con gráficas punteras de usuario, hasta el punto de que para usarlo con una gráfica de 24 GB de VRAM como la mía, no sólo se tienen que usar versiones muy cuantizadas del modelo (la GGUF Q4_K_M), siendo casi imposible usar el modelo sin optimizar de alguna forma en gráficas no profesionales, sino que se necesita grandes cantidades de RAM del sistema para que 'entre' también el LLM que hace de text encoder. A esto hay que sumar que está muy censurado (de hecho en la página de HuggingFace del modelo dedican nada menos que un 70% del texto del artículo de presentación a hablar de lo orgullosos que están de la censura que le han metido y que se han asociado para ello con la Internet Watch Foundation, que es una de las empresas impulsoras del nefasto Chat Control que nos quieren meter a los europeos), que luego sorprendentemente, la calidad de imagen no es mejor que la de modelos mucho más pequeños, aunque su parte de edición es la mejor actual sin duda ninguna (gracias a su LLM), y que es leeento generando las imágenes debido a su tamaño (varios minutos para generar una imagen de 1024x1024, más que para generar un vídeo de 5 segundos con Wan 2.2).

Pero mira por dónde, que de la nada, y de forma totalmente sorpresiva, Alibaba contraataca sacando este misterioso Z-image que nadie sabía que existía sólo unas horas después, provocando una auténtica revolución, que todo el mundo olvide a Flux 2 y dejándolo además en evidencia por su alto consumo de recursos y consiguiendo una calidad de imagen brutal y teniendo algunas de las características de Flux 2 con un tamaño increiblemente más pequeño. Resulta que es un modelo 6B, por lo que funciona en equipos muchísimo más modestos (se puede usar el modelo completo sin cuantizar en gráficas con 12 GB de VRAM como una RTX 3060), usando de Text Encoder una versión 4B de Qwen 3, rapidísimo (7 segundos en generar una imagen de 1024x1024), una calidad de imagen brutal, mejor que la de modelos muchísimo más grandes como Qwen Image, Hidream y por supuesto el propio Flux 2.Dev, capacidad de generar imágenes con una resolución nativa de hasta 4 MP, buen seguimiento del prompt, bueno con la generación de texto, generando imágenes de todo tipo (fotorrealismo, ilustración, etc...) y con una censura mínima, al contrario que en los modelos occidentales, no sólo pudiendo hacer desnudos integrales sin problemas sino pudiendo generar imágenes de personajes conocidos y de series/videojuegos sin problema. El hecho de tener estas características, que hace tiempo que venía pidiendo la comunidad (ya que los modelos cada vez más grandes hacen cada vez más difícil poder usarlos en ordenadores de usuario debido a la escasez de VRAM que todos conocemos), ha hecho que la comunidad se vuelque totalmente en este modelo y haya sido acogido con muchísimo entusiasmo, del que además hay anunciados una versión 'base' no destilada (la versión publicada es una versión 'turbo'), ideal para entrenar loras o hacer finetunning del modelo, y otra de edición como Qwen Image Edit/Flux Kontext/Nano Banana, todas del mismo tamaño de la publicada.

Y después de todo el tocho anterior, os dejo con lo que importa, que es el vídeo de AcademiaSD que mencioné al principio y que os será muy útil a los que queráis probar IAs en local:

Jack Hall escribió:@Torres
Yo pienso que si, es una base de datos inmensa donde un programa ultrarápido elige los fragmentos que te va a presentar de forma estadistica.
Yo diria que accede al texto, y propone un resumen en el cual privilegia las partes que mas aparecen en esas bases

1.- La inteligencia artificial a la que le preguntaba accede en tiempo real al libro.., lo lee en décimas de segundo y me hace un resumen en otras décimas de segundo??

Si

3.- Puedes acceder a resúmenes o preguntarle cualquier cosa de cualquier libro del mercado??

Siempre que estén en sus bases de datos y no sean restringidos de acceso por H o por B

yo entiendo que la duda es: ¿de dónde lo lee si no lo hay en digital gratuito? ¿quién paga los derechos del libro al que accede? porque si tú tienes el libro o documento y se lo subes es fácil pero si no ¿ese libro de dónde lo sacan?
@korchopan
Ahí la verdad no sé decirte, habria que hacer la pruba con una novela reciente y si te dá una copia o un resumen pues o tiene licencias o a lo mejor lo extrae ilegalmente.
Creo que alguien a comentado que hay quien a interpuesto demanda por usurpación de contenidos
Torres escribió:Ya pero a la encarta no le podías pedir el resumen de un libro o que te explicase el impacto del personaje X en el desarrollo del libro... Me refiero a que no es información cerrada.., no es un resumen que te busca la IA en una base de datos.., es un resumen que te hace en el momento... Por eso digo si tiene acceso en tiempo real a ese libro y se lo puede leer para hacerte el resumen o te puede saber decir los personajes del libro y cómo actúa cada uno... Eso no es una base de datos...


Bueno, es una "base de datos" también, entendido como que los almacena para su acceso. Tiene su propia recopilación de datos curados por la empresa que esté tras el modelo, y muchos autores, medios y editoriales están por eso mosqueados, por si sus escritos están metidos ahí. Creo que la antigua facebook tenía un follón judicial liado por todo lo que metieron pirata en sus modelos.

Mi teoría es que todos estos mastodontes en IA han pirateado todo lo que han querido para sus modelos de lenguaje, y se van a tirar años "saneando" lo pirateado a base de reescribir los materiales originales (con algo de cuidado para que no se degrade demasiado el material original) para nutrir de datos las versiones posteriores del modelo hasta llegar a un punto que tampoco les podrán culpar de piratear obras originales, porque ya las tendrán reversionadas, con los pasajes originales reescritos. Lo suficiente para que de cara a la galería no les puedan denunciar por copyright.

Pero por poder resumir textos enormes, siguen siendo son unas herramientas cojonudas. Es tremendo lo rápido que procesa todos los PDFs que le voy dando, cientos de páginas constantemente, me ahorra un trabajo tremendo.
el problema de fondo que estais describiendo es algo que yo ya dije casi "desde el principio".

los asistentes de IA son como un dependiente japones: estan hechos para no decirte nunca "no", con lo cual cuando de algo tienen informacion incorrecta o contradictoria, o simplemente "cuando no lo sabe" -> se lo inventa. y esto lo hace para todo.

en ciertos trabajos generativos eso no es un mal enfoque porque permite rellenar los huecos y a base de entrenamiento lo ira haciendo cada vez mejor (es lo que ocurre con imagenes y videos) pero con trabajos de documentacion, de codigo o simplemente para buscar respuestas a preguntas, conduce a muchisimos errores que si el humano no detecta, le van a estallar en la cara a alguien antes o despues.

yo sigo pensando lo mismo: que es una herramienta estupenda para "vagos ocupados", que va a destruir muchisimos empleos (ya lo esta haciendo) y que hay muchisimo mas marketing que "nueces" reales.

ah, y que el enfoque etico con el que se las esta integrando en toda clase de esquemas es super cuestionable (y eso siendo amables).
SIRDRAK escribió:Para los que quieran iniciarse en esto de usar IAs opensource en local y ComfyUI les parece muy complejo, aprovecho que hoy AcademiaSD ha publicado un vídeo sobre el nuevo modelo que está haciendo furor para generar imágenes, Z-image Turbo, en el que además no sólo explica como instalar Forge Neo desde cero, incluyendo también de dónde y cómo descargar Z-image, sino que incluso proporciona una utilidad para que se instale todo en 1-click de la forma más sencilla posible. Es una gran oportunidad, porque Forge Neo es una de las interfaces que eran más ampliamente usadas para generar imágenes, y lo sigue siendo mejor y más cómoda para usar ciertos modelos, además de que proporciona muchísimos modos y herramientas, como el modo img2img o el modo de edición para hacer inpaint de las imágenes, además de soportar un montón de extensiones para añadir funcionalidades nuevas, todo ello con una interfaz intuituva y fácil de usar. Esta versión (Neo) es un fork del Forge original al que se le ha incorporado soporte de todas las IA para generar imágenes actuales (Chroma, Qwen, Flux Kontext, Z-image, etc...) e incluso permite hacer vídeos con Wan, a pesar de que para esto son más indicados Wan2GP o ComfyUI.

Sobre Z-image, el tema es bastante curioso y lo he vivido en directo: Resulta que todo esto empezó el día 25 cuando en teoría tenía que aparecer una nueva versión anunciada previamente de Qwen Image Edit, concretamente la 2511, otro modelo de edición de imágenes estilo Flux Kontext/Nano Banana de Alibaba muy popular. Ese mismo día, para 'hacerle la puñeta' a los de Alibaba, van los de Black Forest Labs (antiguos miembros de Stability.ai y creadores del famosísimo Flux) y presentan y publican nada menos que Flux 2.Dev, la nueva versión de su famosísimo modelo de imagen con unas características apabullantes (capacidad de hacer de forma nativa imágenes de hasta 4 MP, 32B de parámetros su Unet y usando de Text Encoder un LLM completo de 24B, Mistral, nada menos, permitiendo prompts de más de 35000 tokens, capacidades de edición de imágenes avanzadísimas que miran de tú a tú a Nano Banana Neo, pudiendo usar un número ilimitado de imágenes de referencia -en teoría-,etc...).

Como es obvio desata muchísimo interés las primeras horas, pero tiene varias pegas muy grandes como son su enorme tamaño, que hace muy difícil su uso incluso con gráficas punteras de usuario, hasta el punto de que para usarlo con una gráfica de 24 GB de VRAM como la mía, no sólo se tienen que usar versiones muy cuantizadas del modelo (la GGUF Q4_K_M), siendo casi imposible usar el modelo sin optimizar de alguna forma en gráficas no profesionales, sino que se necesita grandes cantidades de RAM del sistema para que 'entre' también el LLM que hace de text encoder. A esto hay que sumar que está muy censurado (de hecho en la página de HuggingFace del modelo dedican nada menos que un 70% del texto del artículo de presentación a hablar de lo orgullosos que están de la censura que le han metido y que se han asociado para ello con la Internet Watch Foundation, que es una de las empresas impulsoras del nefasto Chat Control que nos quieren meter a los europeos), que luego sorprendentemente, la calidad de imagen no es mejor que la de modelos mucho más pequeños, aunque su parte de edición es la mejor actual sin duda ninguna (gracias a su LLM), y que es leeento generando las imágenes debido a su tamaño (varios minutos para generar una imagen de 1024x1024, más que para generar un vídeo de 5 segundos con Wan 2.2).

Pero mira por dónde, que de la nada, y de forma totalmente sorpresiva, Alibaba contraataca sacando este misterioso Z-image que nadie sabía que existía sólo unas horas después, provocando una auténtica revolución, que todo el mundo olvide a Flux 2 y dejándolo además en evidencia por su alto consumo de recursos y consiguiendo una calidad de imagen brutal y teniendo algunas de las características de Flux 2 con un tamaño increiblemente más pequeño. Resulta que es un modelo 6B, por lo que funciona en equipos muchísimo más modestos (se puede usar el modelo completo sin cuantizar en gráficas con 12 GB de VRAM como una RTX 3060), usando de Text Encoder una versión 4B de Qwen 3, rapidísimo (7 segundos en generar una imagen de 1024x1024), una calidad de imagen brutal, mejor que la de modelos muchísimo más grandes como Qwen Image, Hidream y por supuesto el propio Flux 2.Dev, capacidad de generar imágenes con una resolución nativa de hasta 4 MP, buen seguimiento del prompt, bueno con la generación de texto, generando imágenes de todo tipo (fotorrealismo, ilustración, etc...) y con una censura mínima, al contrario que en los modelos occidentales, no sólo pudiendo hacer desnudos integrales sin problemas sino pudiendo generar imágenes de personajes conocidos y de series/videojuegos sin problema. El hecho de tener estas características, que hace tiempo que venía pidiendo la comunidad (ya que los modelos cada vez más grandes hacen cada vez más difícil poder usarlos en ordenadores de usuario debido a la escasez de VRAM que todos conocemos), ha hecho que la comunidad se vuelque totalmente en este modelo y haya sido acogido con muchísimo entusiasmo, del que además hay anunciados una versión 'base' no destilada (la versión publicada es una versión 'turbo'), ideal para entrenar loras o hacer finetunning del modelo, y otra de edición como Qwen Image Edit/Flux Kontext/Nano Banana, todas del mismo tamaño de la publicada.

Y después de todo el tocho anterior, os dejo con lo que importa, que es el vídeo de AcademiaSD que mencioné al principio y que os será muy útil a los que queráis probar IAs en local:


Soy un completo ignorante en todos estos temas de IA offline pero viendo el vídeo me he puesto a ello pero haciendo todo tal cual y con las mismas opciones al intentar generar una imagen me salen unos errores que obviamente no entiendo pero la causa según pone es que mi gpu es demasiado nueva ¿? "... is not supported because: requires device with capability < (8, 0) but your GPU has capability (12, 0) (too new)"
Es una 5070ti. ¿Alguna idea?
GXY escribió:el problema de fondo que estais describiendo es algo que yo ya dije casi "desde el principio".

los asistentes de IA son como un dependiente japones: estan hechos para no decirte nunca "no", con lo cual cuando de algo tienen informacion incorrecta o contradictoria, o simplemente "cuando no lo sabe" -> se lo inventa. y esto lo hace para todo.

en ciertos trabajos generativos eso no es un mal enfoque porque permite rellenar los huecos y a base de entrenamiento lo ira haciendo cada vez mejor (es lo que ocurre con imagenes y videos) pero con trabajos de documentacion, de codigo o simplemente para buscar respuestas a preguntas, conduce a muchisimos errores que si el humano no detecta, le van a estallar en la cara a alguien antes o despues.

yo sigo pensando lo mismo: que es una herramienta estupenda para "vagos ocupados", que va a destruir muchisimos empleos (ya lo esta haciendo) y que hay muchisimo mas marketing que "nueces" reales.

ah, y que el enfoque etico con el que se las esta integrando en toda clase de esquemas es super cuestionable (y eso siendo amables).


La IA comercial es basicamente como si se pudieran COMPRAR aprendices y luego, cual cuco, encasquetárselos a la competencia, para que los formen sin cobrarte ni un duro.
Usar la IA para programación haciendo copia/pega es un suicidio, ya se ha visto que ha habido escabechinas, y que han tenido que contratar personas luego para arreglar esas escabechinas.

Pero usandola con cabeza, para que te oriente en temas que no sabes y aprender mas rapido, o para que te haga funciones banales que antes tenias que buscarla en google y fusilarla, pues es muy practico.
654321 escribió:Usar la IA para programación haciendo copia/pega es un suicidio, ya se ha visto que ha habido escabechinas, y que han tenido que contratar personas luego para arreglar esas escabechinas.

Pero usandola con cabeza, para que te oriente en temas que no sabes y aprender mas rapido, o para que te haga funciones banales que antes tenias que buscarla en google y fusilarla, pues es muy practico.


Exacto. En mi curro tenemos copilot con la suscripción enterprise y realmente ayuda a sacar algunas cosas que son realmente tediosas. Odio programar front, así que me creo las clases necesarias, hago todo el backend, y cuando lo tengo todo listo y probado, entonces tiro de copilot.

Aun así las lia muchísimo. Mi caso mas reciente fue un formulario relativamente complejo, le pedí que hiciera el front en modo agente y que lo hiciera multiidioma usando unos ficheros que tenemos de traducciones. Pues no solo NO lo hizo, hardcodeó absolutamente todo, y cuando le pedí que volviese a hacerlo usando las traducciones (tenemos varios ficheros de instrucciones que se le pasan a modo de pre-prompt), creó las claves y.... se cargó el 90% de las traducciones restantes. "The code is production ready!" soltó con sus dos cojones.

Aparte, usamos muchas librerías cuya documentación se encuentra tras un paywall, y como decidas implementar algo de ellas usando IA te escribe cada mierda que alucinas. Actualmente mi jornada se traduce en 2-3 horas programando y el resto corrigiendo al junior más incompetente de la historia.
De hecho ya lo ha dicho un compañero más arriba.
Las IA no trabajan para el usuario, es este el que trabaja para entrenar y desarrollar las bases de datos de las empresas creadoras
773 respuestas
112, 13, 14, 15, 16