[HO] Inteligencia Artificial (IA)

14, 5, 6, 7, 8
Hola a todos,

A ver si me podéis ayudar en algo que lo llevo buscando varias horas y no me queda nada claro.

Me gustaria saber si existe alguna manera de etiquetar automaticamente imágenes. Sería para un estudio. Es decir, extraigo imágenes y tengo un excel con 5.000 imágenes (por ejemplo), habría alguna forma mediante la IA de etiquetar esas imágenes a texto? lo llevo un rato buscando pero no me queda claro si se puede hacer.

Gracias, un saludo.
macdcai escribió:Hola a todos,

A ver si me podéis ayudar en algo que lo llevo buscando varias horas y no me queda nada claro.

Me gustaria saber si existe alguna manera de etiquetar automaticamente imágenes. Sería para un estudio. Es decir, extraigo imágenes y tengo un excel con 5.000 imágenes (por ejemplo), habría alguna forma mediante la IA de etiquetar esas imágenes a texto? lo llevo un rato buscando pero no me queda claro si se puede hacer.

Gracias, un saludo.


Si le preguntas una IA te dice:

Sí, existe la posibilidad de etiquetar imágenes automáticamente mediante la IA. Hay varias herramientas y métodos disponibles, y la mejor opción para ti dependerá de las características de tus imágenes y de tus necesidades específicas.

Un método común es utilizar un modelo de aprendizaje automático entrenado en un conjunto de datos de imágenes etiquetadas. Este modelo puede aprender a identificar objetos y características en las imágenes, y luego utilizar ese conocimiento para etiquetar nuevas imágenes.

Para etiquetar 5.000 imágenes, necesitarás un modelo que pueda procesar grandes cantidades de datos. Un modelo de aprendizaje profundo, como un CNN (red neuronal convolucional), sería una buena opción.

También necesitarás un conjunto de datos de imágenes etiquetadas para entrenar el modelo. Puedes crear tu propio conjunto de datos o utilizar un conjunto de datos de imágenes públicas.

Una vez que hayas entrenado el modelo, puedes utilizarlo para etiquetar tus propias imágenes. El proceso de etiquetado automático suele ser más rápido que el etiquetado manual, pero puede no ser tan preciso.

Aquí hay algunos ejemplos de herramientas y métodos que puedes utilizar para etiquetar imágenes automáticamente:

Google Cloud Vision API: Esta API permite a los desarrolladores etiquetar imágenes utilizando un modelo de aprendizaje profundo de Google.
Amazon Rekognition: Esta API similar a Google Cloud Vision API también permite a los desarrolladores etiquetar imágenes utilizando un modelo de aprendizaje profundo.
OpenCV: Esta biblioteca de código abierto ofrece una variedad de herramientas para el procesamiento de imágenes, incluyendo la clasificación de imágenes.
YOLO: Este algoritmo de aprendizaje profundo puede utilizarse para detectar objetos en imágenes.
Si estás buscando una solución específica para tu estudio, te recomiendo que busques en línea o consultes con un experto en IA.

Aquí hay algunos consejos para etiquetar imágenes automáticamente:

Utiliza un conjunto de datos de imágenes de alta calidad. Un conjunto de datos de imágenes de alta calidad ayudará a tu modelo a aprender a identificar objetos y características con precisión.
Etiqueta tus imágenes con cuidado. Asegúrate de que las etiquetas sean precisas y consistentes.
Evalúa la precisión de tu modelo. Una vez que hayas etiquetado tus imágenes, utiliza un conjunto de datos de imágenes de prueba para evaluar la precisión de tu modelo.
macdcai escribió:Hola a todos,

A ver si me podéis ayudar en algo que lo llevo buscando varias horas y no me queda nada claro.

Me gustaria saber si existe alguna manera de etiquetar automaticamente imágenes. Sería para un estudio. Es decir, extraigo imágenes y tengo un excel con 5.000 imágenes (por ejemplo), habría alguna forma mediante la IA de etiquetar esas imágenes a texto? lo llevo un rato buscando pero no me queda claro si se puede hacer.

Gracias, un saludo.


A ver que lo entienda mejor... Con etiquetar las imágenes a texto, te refieres a que se cree un archivo de texto por cada imagen con una descripción de lo que se vé en cada imagen? Si es así, sí, se puede hacer y de hecho es un paso necesario en el entrenamiento de modelos para IAs generativas de imágenes. Cuando se entrena un modelo, por ejemplo de un personaje, primero se hace una selección de imágenes para el entrenamiento y luego se las pasa por una IA que las analiza y crea un archivo de texto por cada imagen con la descripción de lo que ha visto en cada una de ellas, que le servirá a la otra IA para entrenar aprendiendo lo está viendo (como hacemos los humanos). Si ese es el caso, podrías usar la opción correspondiente de la interfaz Automatic1111 (la interfaz gráfica más popular para generar imágenes conm Stable Diffusion) en su apartado de entrenamiento para hacer el etiquetado, o bien instalar Kohya-ss, que es una aplicación excusivamente para entrenar modelos de Stable Diffusion, que también tiene las opciones para etiquetar imágenes.

Hay que decir que ambas aplicaciones requieren de unos pasos previos a su instalación, por lo que quizás te interese más instalar Automatic1111 que Kohya-ss. Básicamente primero tienes que tener instalada o instalar Python 10.6 o 10.9 (hay una versión más moderna, la 11, pero no es compatible), luego un git, y después crear una carpeta en la que se va a instalar Stable Diffusion y su interfaz, para lo que tienes que abrir en dicha carpeta una ventana de comandos (la famosa ventana de Ms-dos) o el Terminal de Windows, y escribir el comando git pull https://github.com/AUTOMATIC1111/stable-diffusion-webui

Cuando termine de descargar los archivos necesarios de los repositorios, para ejecutar Automatic1111, te vas a esa carpeta y abres el archivo webui-user.bat que está en la carpeta stable-diffusion-webui. La primera vez tardará un poco porque se descargará algunos modelos y cosas, pero cuando termine se te abritá la interfaz propiamente dicha en el navegador (utiliza una interfaz web). Debes dejar la ventana de comandos abierta todo el tiempo. Una vez en la interfaz, te vas a la pestaña que pone Train, y en ella, a la pestaña que pone Preprocess images. Allí, donde pone Source directory, le indicas la ruta de la carpeta donde tengas las imágenes que quieras etiquetar, y en Destination directory, donde quieres que genere los archivos de texto. Dejas lo demás sin tocar, y en las casillas que hay abajo marcas la que pone Keep original size, y luego, para el etiquetado propiamente dicho, marcas bien Use BILP for caption (con esta hará el etiquetado en el formato de lenguaje natural) o bien Use deepbooru for caption (en este caso, el etiquetado se hará mediante etiquetas separadas por comas, tipo 1woman, long blonde hair, blue eyes, hat, etc...) y pulsas el botón Preprocess, tras lo cual ya sólo debes esperar a que termine el proceso (la primera vez que lo hagas tardará un poco más porque se descargará el modelo de la IA encargada de hacer el etiquetado).
Gracias a @joakylla y a @SIRDRAK por las respuestas.

La verdad no sabía que fuera tan complicado jeje. Alguna vez he trabajado con Phyton sí, de hecho tengo la última versión, pero con cosas sencillas en las que me limitaba a descargarme algún paquete y poner algún código ya predefinido para realizar un análisis.

Ya aprovecho y cuento cuál es el motivo del interés en la etiqueta de imágenes. Realizo algunos estudios, sobre todo del sector turístico. Voy a realizar un estudio sobre la comunicación de diversos perfiles del sector turístico de Instagram. Ya lo he hecho alguna vez, extraigo la información en excel con una herramienta (contenido de mensajes, interacciones y el enlace). Con esa información y utilizando otra herramienta de análisis cualitativo realizo un análisis de contenido.

El problema es que Instagram las imágenes no se pueden analizar, solo el texto. En la mayoría de las ocasiones el texto del mensaje va asociada con la imagen pero no siempre. Mi idea era a ver si podía aprovechar alguna opción de la IA para etiquetar las imágenes y pasarlas a texto.

De todas formas hay complicaciones, primero que en la información extraida a excel te viene el enlace a la imagen, no la imagen en sí. Esto he logrado solucionarlo mediante jdownloader, lo cual con el enlace te descargas todas las imágenes a una carpeta. Ahora quedaría una herramienta para etiquetar las imágenes y poder pasar el texto de la etiqueta a la misma celda de excel donde estaba el enlace. Ya de por sí es complicado jeje.

He intentado realizar alguna opción que habéis puesto, por ejemplo la de @joakylla he visto que en todos los programas te tienes que registrar y te piden la tarjeta de crédito, cosa que de primeras me echa para atrás ya que solo quiero probar como funciona. He visto una versión de prueba de la de Google y me he fijado que las etiquetas que ponen son bastante simples. En la mayoría te pone la etiqueta "construcción" en cuanto ven cualquier edificio o monumento, propio de imágenes turísticas.

Me parece que es mucho problema para la efectividad que puede dar al estudio, así que me temo que finalmente haré un análisis solo del texto, me parece complicado etiquetar las imágenes para el resultado que da actualmente.

Por cierto si alguien sabe como utilizar phyton para extraer información de redes sociales como Twitter o Instagram a una base de datos tipo excel se lo agradezco, se que hay alguna cosa pero no me queda claro.

Un saludo.

He leído noticias sensacionalistas a lo largo de mi vida pero esta se lleva la palma de cabeza. Quiénes avisaron? Qué puesto tenían? Cuál era el avance? Amenazar en qué sentido?
Neo_darkness escribió:

He leído noticias sensacionalistas a lo largo de mi vida pero esta se lleva la palma de cabeza. Quiénes avisaron? Qué puesto tenían? Cuál era el avance? Amenazar en qué sentido?

Aqui esta la misma noticia pero reportada por reuters:
https://www.reuters.com/technology/sam- ... 023-11-22/
No dan muchos mas detalles, me hizo gracia el optimismo de algunos:
Dados los vastos recursos informáticos, el nuevo modelo pudo resolver ciertos problemas matemáticos, dijo la persona bajo condición de anonimato porque no estaba autorizada a hablar en nombre de la empresa. Aunque solo realizan matemáticas al nivel de los estudiantes de escuela primaria, realizar tales pruebas hizo que los investigadores se sintieran muy optimistas sobre el éxito futuro de Q*, dijo la fuente.
Neo_darkness escribió:

He leído noticias sensacionalistas a lo largo de mi vida pero esta se lleva la palma de cabeza. Quiénes avisaron? Qué puesto tenían? Cuál era el avance? Amenazar en qué sentido?


Como si fuera la primera vez que avisan del riesgo que supone la IA.
dinodini escribió:
Neo_darkness escribió:

He leído noticias sensacionalistas a lo largo de mi vida pero esta se lleva la palma de cabeza. Quiénes avisaron? Qué puesto tenían? Cuál era el avance? Amenazar en qué sentido?


Como si fuera la primera vez que avisan del riesgo que supone la IA.

Eso no es avisar, es sacar el titular más amarillo posible -ya no está en juego una guerra, un país, el planeta, sino la propia humanidad!- basándose en nada. Porque es que la noticia no dice nada, y lo poco que dice no tiene nada que ver.
Yolanda Díaz se enfada por los memes que la ridiculizan imitando su voz y los quiere perseguir penalmente

Imagen

Sumar ha presentado una proposición de ley orgánica de regulación de las "simulaciones de imágenes y voces de personas generadas por medio de la inteligencia artificial". El deseo de regular esta materia está en la mayoría de los grupos políticos con el fin de evitar situaciones de acoso, difamación o chantaje. Pero el texto presentado por Sumar incluye una nueva redacción de artículos del Código Penal que le permitirían a su líder, Yolanda Díaz, perseguir las caricaturas realizadas con inteligencia artificial y que llenan las redes sociales criticando las ocurrencias de la vicepresidencia de Sánchez. Y ella, casualmente, se ha convertido en una de las dianas preferidas de este tipo de memes virales.

https://www.libertaddigital.com/espana/ ... e-7082797/

https://www.larazon.es/actualidad/yolan ... ec5f8.html

¿Qué diferencia hay entre una caricatura o parodia hecha a mano y otra hecha con Inteligencia artificial? ¿Y qué diferencia hay entre las imitaciones de Carlos Latre y las que hace la Inteligencia artificial? :-?

No veo nada de malo en estas imágenes.

Imagen

Imagen
Ahora que está el hilo arriba, os recuerdo que ChatGPT es básicamente un predictor de texto avanzado, y NO sirve para hacer operaciones matemáticas, ni siquiera las más básicas. Quien use esto en lugar de Wolfram Alpha la lleva clara. Esto es más o menos lo que le he pedido, parafraseando:

Te voy a dar una lista de mis alumnos con sus notas. En cada fila aparece un alumno y su nota numérica al final. Quiero que elimines los nombres de los alumnos y uses solamente las notas numéricas. Escribe esas notas separadas por comas. Luego calcula la media de esos números. En el sistema educativo español, las notas inferiores a 5 son suspensos, y a partir de 5 son aprobados. Dime cuántos suspensos y aprobados hay en esta clase y calcula el porcentaje respecto al total de alumnos. Dime también cuál es la nota que más se repite.

PACOMÁN ABREMUCHOS HILOSSOBREIA 10
FRANCISCO HOMBRE NOTEENFADES 8
Etc.


Fácil, ¿no? Pues no.

En primer lugar, ha habido números que se ha saltado o se ha inventado en el primer paso, especialmente en clases muy numerosas (más de 40 alumnos). Posteriormente ha hecho mal todas las sumas de notas, absolutamente todas. Para calcular la media sabe qué pasos tiene que dar, pero si no sabe sumar, no va a hacer ninguna bien. Luego se ha inventado suspensos donde no los hay (por ejemplo en un grupo de números como 5, 4, 7, 9, 2, 10, 9, 7, 7 se inventa que hay cuatro suspensos), por lo que los porcentajes también están mal.

Total, que lo único que ha hecho bien ha sido ver una lista de números e identificar cuál es el que más se repite. Esta Skynet es tontísima.
@Dudeman Guymanington

Imagen

Además, dependiendo del valor que le des, utiliza un razonamiento u otro. Con otros valores sí entiende que es independiente de cuantas haya.
Dudeman Guymanington escribió:Ahora que está el hilo arriba, os recuerdo que ChatGPT es básicamente un predictor de texto avanzado, y NO sirve para hacer operaciones matemáticas, ni siquiera las más básicas. Quien use esto en lugar de Wolfram Alpha la lleva clara. Esto es más o menos lo que le he pedido, parafraseando:

Te voy a dar una lista de mis alumnos con sus notas. En cada fila aparece un alumno y su nota numérica al final. Quiero que elimines los nombres de los alumnos y uses solamente las notas numéricas. Escribe esas notas separadas por comas. Luego calcula la media de esos números. En el sistema educativo español, las notas inferiores a 5 son suspensos, y a partir de 5 son aprobados. Dime cuántos suspensos y aprobados hay en esta clase y calcula el porcentaje respecto al total de alumnos. Dime también cuál es la nota que más se repite.

PACOMÁN ABREMUCHOS HILOSSOBREIA 10
FRANCISCO HOMBRE NOTEENFADES 8
Etc.


Fácil, ¿no? Pues no.

En primer lugar, ha habido números que se ha saltado o se ha inventado en el primer paso, especialmente en clases muy numerosas (más de 40 alumnos). Posteriormente ha hecho mal todas las sumas de notas, absolutamente todas. Para calcular la media sabe qué pasos tiene que dar, pero si no sabe sumar, no va a hacer ninguna bien. Luego se ha inventado suspensos donde no los hay (por ejemplo en un grupo de números como 5, 4, 7, 9, 2, 10, 9, 7, 7 se inventa que hay cuatro suspensos), por lo que los porcentajes también están mal.

Total, que lo único que ha hecho bien ha sido ver una lista de números e identificar cuál es el que más se repite. Esta Skynet es tontísima.


Esa respuesta es de GPT3.5 o GPT4?

Para eso debería usar el modulo de análisis y resolverlo con código, eso el gpt4 lo hace bien, gpt3.5 si no especificas intentará razonarlo y posiblemente fallará en el calculo.

Pídele directamente que lo resuelva usando python.

Mira lo que me da a mi gpt4:
User: Invéntate una lista de nombres y notas entre el 0 y el 10, usa este formato:
PACOMÁN ABREMUCHOS HILOSSOBREIA 10
FRANCISCO HOMBRE NOTEENFADES 8

ChatGPT
Aquí tienes una lista inventada de nombres con sus correspondientes notas del 0 al 10:

PACOMÁN ABREMUCHOS HILOSSOBREIA - 10
FRANCISCO HOMBRE NOTEENFADES - 8
LUCÍA ESTRELLAMAR BRILLASIEMPRE - 9
JUAN TORRENTE FLUYECONSTANTE - 7
ANA ROSALES FLORECEPRIMAVERA - 6
MIGUEL ÁNGEL NUBESVUELA - 4
SOFÍA RÍO CAUCECLARO - 9.5
CARLOS SOL BRILLAALTO - 7.5
MARÍA LUNA NOCHEENCANTA - 8.5
PEDRO MONTE ALTURAASOMBROSA - 4
Espero que esta lista sea de tu agrado.

User: Te voy a dar una lista de mis alumnos con sus notas. En cada fila aparece un alumno y su nota numérica al final. Quiero que elimines los nombres de los alumnos y uses solamente las notas numéricas. Escribe esas notas separadas por comas. Luego calcula la media de esos números. En el sistema educativo español, las notas inferiores a 5 son suspensos, y a partir de 5 son aprobados. Dime cuántos suspensos y aprobados hay en esta clase y calcula el porcentaje respecto al total de alumnos. Dime también cuál es la nota que más se repite.

PACOMÁN ABREMUCHOS HILOSSOBREIA - 10
FRANCISCO HOMBRE NOTEENFADES - 8
LUCÍA ESTRELLAMAR BRILLASIEMPRE - 9
JUAN TORRENTE FLUYECONSTANTE - 7
ANA ROSALES FLORECEPRIMAVERA - 6
MIGUEL ÁNGEL NUBESVUELA - 4
SOFÍA RÍO CAUCECLARO - 9.5
CARLOS SOL BRILLAALTO - 7.5
MARÍA LUNA NOCHEENCANTA - 8.5
PEDRO MONTE ALTURAASOMBROSA - 4

ChatGPT: Las notas numéricas de tus alumnos, separadas por comas, son: 10, 8, 9, 7, 6, 4, 9.5, 7.5, 8.5, 4.

La media de estas notas es 7.35.
Hay 2 suspensos y 8 aprobados en esta clase.
El porcentaje de suspensos respecto al total de alumnos es del 20%, mientras que el de aprobados es del 80%.
La nota que más se repite es el 4. ​

# Actualización de las notas con la nueva lista proporcionada
notas_actualizadas = [10, 8, 9, 7, 6, 4, 9.5, 7.5, 8.5, 4]

# Cálculo de la media
media_actualizada = sum(notas_actualizadas) / len(notas_actualizadas)

# Conteo de suspensos y aprobados
suspensos_actualizados = sum(1 for nota in notas_actualizadas if nota < 5)
aprobados_actualizados = len(notas_actualizadas) - suspensos_actualizados

# Porcentaje de suspensos y aprobados
porcentaje_suspensos_actualizado = (suspensos_actualizados / len(notas_actualizadas)) * 100
porcentaje_aprobados_actualizado = (aprobados_actualizados / len(notas_actualizadas)) * 100

# Nota que más se repite
nota_mas_repetida_actualizada = Counter(notas_actualizadas).most_common(1)[0][0]

(media_actualizada, suspensos_actualizados, aprobados_actualizados, porcentaje_suspensos_actualizado, porcentaje_aprobados_actualizado, nota_mas_repetida_actualizada)


GPT3.5 en cambio, da esta respuesta:

Claro, puedo ayudarte con eso. Primero, eliminaré los nombres de los alumnos y te mostraré las notas numéricas separadas por comas:

10, 8, 9, 7, 6, 4, 9.5, 7.5, 8.5, 4

Ahora, calcularé la media de estas notas:

(10 + 8 + 9 + 7 + 6 + 4 + 9.5 + 7.5 + 8.5 + 4) / 10 = 73 / 10 = 7.3

La media de las notas es 7.3.

En el sistema educativo español, las notas inferiores a 5 son suspensos, y a partir de 5 son aprobados. Veamos cuántos alumnos tienen suspensos y cuántos tienen aprobados:

Suspensos (notas inferiores a 5): 4 y 4 (total 2)

Aprobados (notas iguales o superiores a 5): 10, 8, 9, 7, 6, 9.5, 7.5, 8.5 (total 8)

Ahora, calculemos el porcentaje de suspensos y aprobados respecto al total de alumnos:

Porcentaje de suspensos: (2 / 10) * 100 = 20%

Porcentaje de aprobados: (8 / 10) * 100 = 80%

Finalmente, para determinar la nota que más se repite, observemos cuántas veces aparece cada nota:

4: 2 veces
6: 1 vez
7: 2 veces
7.5: 1 vez
8: 1 vez
8.5: 1 vez
9: 1 vez
9.5: 1 vez
10: 1 vez

La nota que más se repite es 4, que aparece dos veces.


Aquí no ha usado código ni ningún modulo de calculo, en mi caso lo ha hecho bien, posiblemente es porqué la lista es corta y el resultado no sea el mismo con una lista más larga.

Pero siempre podemos pedirle que lo haga usando python:

User: Puedes hacerlo usando python?

ChatGPT:

Sí, puedo proporcionarte un código en Python para realizar las operaciones que mencionaste. Aquí tienes el código:

# Lista de notas de los alumnos
notas = [10, 8, 9, 7, 6, 4, 9.5, 7.5, 8.5, 4]

# Calcular la media de las notas
media = sum(notas) / len(notas)

# Contar el número de suspensos y aprobados
aprobados = sum(1 for nota in notas if nota >= 5)
suspensos = sum(1 for nota in notas if nota < 5)

# Calcular el porcentaje de suspensos y aprobados
porcentaje_aprobados = (aprobados / len(notas)) * 100
porcentaje_suspensos = (suspensos / len(notas)) * 100

# Encontrar la nota que más se repite
nota_repetida = max(set(notas), key = notas.count)

# Imprimir los resultados
print("Notas:", ", ".join(map(str, notas)))
print("Media de las notas:", media)
print("Aprobados:", aprobados)
print("Suspensos:", suspensos)
print(f"Porcentaje de aprobados: {porcentaje_aprobados:.2f}%")
print(f"Porcentaje de suspensos: {porcentaje_suspensos:.2f}%")
print(f"Nota que más se repite: {nota_repetida}")
@paco_man El fascismo no ha desaparecido, simplemente ha cambiado de bando.
Una noticia de LibertaDigital y ElMundo sobre Yolanda Diaz , y yo voy y me la creo....

Que es lo siguiente?? Una noticia sobre como Sanchez secuestra a niños para hacer ritos satanicos por la noche con Otegui redactada por OkDiario?? XD
trueskins escribió:Una noticia de LibertaDigital y ElMundo sobre Yolanda Diaz , y yo voy y me la creo....

Que es lo siguiente?? Una noticia sobre como Sanchez secuestra a niños para hacer ritos satanicos por la noche con Otegui redactada por OkDiario?? XD

Mejor sólo créete solo lo que diga el BOE, y si sólo hablan de cosas buenas que hace el gobierno.
paco_man escribió:
trueskins escribió:Una noticia de LibertaDigital y ElMundo sobre Yolanda Diaz , y yo voy y me la creo....

Que es lo siguiente?? Una noticia sobre como Sanchez secuestra a niños para hacer ritos satanicos por la noche con Otegui redactada por OkDiario?? XD

Mejor sólo créete solo lo que diga el BOE, y si sólo hablan de cosas buenas que hace el gobierno.


Tampoco me creo eso. Pero no me vengais a vender que el Mundo y LibertadD son la panacea de la prensa seria y apolítica , porque va a ser que no
Oprímeme, Pedro, oprímeme...
Le han pasado el political compass a las IA y por lo visto este es el resultado:
Imagen
SIRDRAK escribió:Vaya, no había visto este hilo sobre IA... El caso es que yo llevo usando unos meses (desde noviembre más o menos) de forma asídua Stable Diffusion para la creación de imágenes, aprender y experimentar y me tiene maravillado.

Empecé porque andaba haciendo carátulas para nuevos juegos homebrew de Commodore 64 que no tenían carátula y pensé que igual usar una IA era buena opción para crearla o por lo menos para generar algunos elementos... Primero lo intenté con Dall-E (la primera versión), pero los resultados no me convencían en absoluto, y estuve haciendo pruebas hasta que se me acabaron los intentos gratuítos y 'se me sugirió amablemente' que me inscribiera en un plan de pagos. Tras esto, decidí probar con la otra IA generativa de imágenes que es más famosa ahora (pero ni de lejos la mejor), Midjourney. Entré en su Discord oficial y, de nuevo, estuve haciendo pruebas hasta agotar los intentos gratuítos y, sí, las imágenes eran mucho mejores y más espectaculares, pero no me convencía ni el tema de suscripción ni el no tener algo más de control sobre el resultado de las imágenes...

...Y es entonces cuando, de forma casual, acabo en otro canal de Discord, en este caso no oficial, llamado 'Unstable Diffusion'. Allí, no sólo me entero de la existencia de Stable Diffusion, sino de que se trata de una IA opensource, sin limitaciones ni censura, gratuíta, que puedes instalar localmente en tu Pc y en la que además puedes entrenar tus propios modelos, que incluye modos para editar las imágenes mediante IA y que hasta tiene extensiones que disparan sus posibilidades hasta el infinito. Y además allí hay una guía que explica paso a paso todo lo necesario para instalarla.

Y al ser Opensource y tener la comunidad acceso al modelo base oficial, y por tanto ser posible 'reentrenar' este para especializarlo en la generación de un tipo de imágenes concreto (arquitectura, fotorrealismo, anime/hentai -ya comenté que no tiene censura de ningún tipo-, cartoon 2D, cartoon 3D, etc...), pues resulta que hay una infinidad de modelos para descargar. Y además, es muy fácil entrenar un tipo de modelo más pequeño (los LoRA, Low Rank Adaptation Network) que te permiten introducir al usarlos un personaje/persona, un estilo artístico o un concepto sobre el modelo base que estés utilizando, pudiendo de esta forma combinar las características de ambos. Esto permite, por ejemplo, que si entrenas un LoRA de una persona, la puedas representar como una persona de carne y hueso, un personaje de cómic, un dibujo animado de cualquier estilo, un navii de Avatar, un personaje de Jojo's Bizarre Adventure, una figura pintada de un wargame, una figura articulada de figma, un muñeco de Lego, etc...).

El asunto es que está siendo un viaje como en una montaña rusa, porque las novedades se suceden de forma vertiginosa y cada vez se tiene mayor control sobre el resultado y se pueden generar imágenes de mayor calidad, herramientas para corregir los fallos típicos (manos con 6 dedos, por ejemplo, y ese tipo de cosas) y lo mejor es ver que esto no ha hecho nada mas que empezar. En serio, los que usáis Midjourney y queréis darle un uso medianamente serio, probar Stable diffusion y podréis hacer cosas imposibles con todos los otros, y encima gratis... Un ejemplo:

Una de las mayores revoluciones en Stable diffusion fué la aparición de la extensión controlNET. Esta lo que hacía era añadir una capa más de control a las imágenes generadas por la IA añadiendo la posibilidad de usar una imagen como entrada para condicionar el resultado. De esta forma te ofrecía posibilidades tan interesantes como:

- Generar la imagen a partir de un boceto o dibujo sobre fondo blanco, respetando el dibujo en gran medida.
- Posibilidad de hacer una mapa de profundidad a partir de la imagen original, lo que permite que en el resultado se respete la profundidad y perspectiva de la imagen original
- La herramienta Openpose, que permite clonar las posturas, expresiones y hasta la posición de manos y dedos de los personajes de la imagen original y trasladarlos a los personajes de la imagen final (y de paso sacando manos perfectas)
- La herramienta lineart, que permite a partir de el trazado de un dibujo, colorearlo, darle sombras y añadir un fondo sin cambiar el dibujo original (el sueño de cualquier ilustrador, ahorrando muchas horas de trabajo)
- etc... (hay muchas más)

Sin ir mas lejos, esto me ha permitido pasar de unos bocetos de los personajes del Gauntlet que dibujé hace unos años, estos:

Imagen
Imagen
Imagen
Imagen

A esto, usando ControlNET, un modelo de estilo entrenado por mí y un modelo base semirrealista llamado Rev Animated 1.2.2:

Imagen
Imagen
Imagen
Imagen

Y además, esta misma combinación de modelos, es capaz de generar imágenes como estas:

Imagen
Imagen
Imagen
Imagen
Imagen
Imagen
Imagen
Imagen
Imagen
Imagen
Imagen
Imagen
Imagen
Imagen
Imagen
Imagen
Imagen
Imagen
Imagen
Imagen
Imagen
Imagen
Imagen
Imagen

Otro ejemplo, es que le hice un favor a un amigo que estaba programando una aventura conversacional pra Commodore 64 homenaje a los libros juveniles de los años 80 'Los Tres Investigadores', para el que necesitaba una portada que fuera como las de los libros originales, con ese estilo tipo 'pintura al óleo' tan típico. Pues bien, lo que hice fue entrenar un modelo con las portadas de los libros para que aprendiera el estilo y luego le generé la portada con los tres chicos protagonistas (con sus características físicas) investigando en uno de los escenarios del juego, un almacén abandonado. Crear una imagen como esta, controlando la apariencia de un grupo de tres personajes es imposible en las otras y además hay diversas formas de hacerlo en stable diffusion, ya sea con ControlNET o editando la imagen con el modo inpaint (un modo que te permite pintar con un pincel una parte de la imagen de forma que la IA modifique sólo lo pintado y deje lo demás sin tocar -al contrario también se puede hacer-).El resultado es el siguiente:

Imagen

Y el modelo que entrené es capaz de generar imágenes como estas:

Imagen
Imagen
Imagen
Imagen
Imagen

Y ya aprovecho para comentar sobre el tema de lo que aprende o no la IA... Lo cierto es que no se almacenan ni se memorizan las imágenes de entrenamiento, la IA lo que aprende son los conceptos contenidos en ellas... De hecho, el proceso de entrenamiento consiste, primero, en hacer una selección de imágenes, variada y de forma que se vea bien al personaje (si es de un personaje), su cara, diferentes expresiones y fondos, alguna de cuerpo entero, etc..., y después, se pasan esas imágenes por otra IA que las analiza y genera un archivo de texto por cada una de las imágenes con una descripción muy precisa de lo que aparece en ellas (llega a sorprender lo bien que describe todo lo que se ve),y que luego, una vez pones la IA a entrenar, será la información que utilice para aprender lo que está viendo. En el caso del modelo anterior, la IA representa en las imágenes muchas cosas que no estaban en las imágenes de entrenamiento, como el granjero, por ejemplo, y además le cambia el aspecto a coches y cosas, ropa, etc... a un aspecto ochentero a pesar de que no había muchas de esas cosas en el set de entrenamiento, pero sabe a qué época pertenecen las cosas por el tipo de imagen... Muchas veces los resultados te sorprenden.

En fin, sólo quería compartir mi experiencia usando esta IA con vosotros.


Gracias

Es sorprendente [flipa] lo que se puede conseguir con la IA
Schwefelgelb escribió:Le han pasado el political compass a las IA y por lo visto este es el resultado:
Imagen


que tienda hacia el "libertarianismo" no me sorprende para nada. que tienda a "economic left" me sorprende un poco mas.

sobre todo porque ese espacio entre "libertarianismo" y "economia de izquierdas"... existira en el diagrama, pero en la "realidad" ideologica, si existe, yo no lo conosco. :-P

paco_man escribió:Mejor sólo créete solo lo que diga el BOE


post mas sensato de paco_man 2023
GXY escribió:
Schwefelgelb escribió:Le han pasado el political compass a las IA y por lo visto este es el resultado:
Imagen


que tienda hacia el "libertarianismo" no me sorprende para nada. que tienda a "economic left" me sorprende un poco mas.

sobre todo porque ese espacio entre "libertarianismo" y "economia de izquierdas"... existira en el diagrama, pero en la "realidad" ideologica, si existe, yo no lo conosco. :-P

paco_man escribió:Mejor sólo créete solo lo que diga el BOE


post mas sensato de paco_man 2023

Libleft sería podemos, authleft la URSS, authright el franquismo, libright lo que llamas libertarianismo.

Libleft puede tener algo que ver con el libertarianismo, especialmente en derechos sociales, pero poco más. Es como decir que no te cuadra la existencia del anarquismo colectivista y el anarcocapitalismo.

Ya sé que al final toda la izquierda tira al autoritarismo, pero algunos por lo menos dicen no hacerlo.
bueno eso ya seria tema de otro hilo.
Hay alguna opción mejor que la de Bing Image Creator de microsoft para estilo disney pixar? Alguna que puedas basarla en imágenes reales de referencia?

Conozco alguna (de la que tengo hasta créditos sobrantes de unas pruebas de hace tiempo), pero está entrenada para estilos manganime y me interesa estilo pixar concretamente para hacer unas pruebas antes de preparar un posible regalo. Si va bien de opciones me es indiferente que sea gratis o de pago si no me atan a largo plazo que solo la quiero para una cosa.
exitfor escribió:Hay alguna opción mejor que la de Bing Image Creator de microsoft para estilo disney pixar? Alguna que puedas basarla en imágenes reales de referencia?

Conozco alguna (de la que tengo hasta créditos sobrantes de unas pruebas de hace tiempo), pero está entrenada para estilos manganime y me interesa estilo pixar concretamente para hacer unas pruebas antes de preparar un posible regalo. Si va bien de opciones me es indiferente que sea gratis o de pago si no me atan a largo plazo que solo la quiero para una cosa.


Midjourney sigue siendo superior a todas. Es de pago.
@Satoru Gojo trabaja bien con pixar style? veo no encuentra el estilo en el desplegable de art styles.
exitfor escribió:@Satoru Gojo trabaja bien con pixar style? veo no encuentra el estilo en el desplegable de art styles.


Yo nunca he usado nada de art styles. Prompt clásico en midjourney e ya. Lo habrán actualizado porque yo nunca he usado eso. Ejemplo:

https://youtu.be/p3SDYY6Hl-U?si=XFDS7q2grg3FzLuy

Prompt clásico y a correr tienes miles en Youtube y Reddit
He reflotado el hilo porque esto lo merece. Vaya sacada de rabo de OpenAI.

Lo primero que se me ocurre es que esto tenía que llegar pero se debe regular con mucha cabeza porque si no, da miedo lo que pueden liar estos que la están implantando en todo. [mad] [mad] [mad] [mad] [mad]
Esta mierda va a inundar Internet cuando salga al público que ríete tú de la época de Chiquito de la Calzada, hasta en la sopa.

Y lo peor es que cada vez va a ser más difícil saber si un contenido es real o no y la poca vida y arte de estas imágenes y videos hace que piense que se vienen tiempos oscuros.

A ver en que queda todo, pero no me gusta un pelo.
Como bien han dicho otros compañeros, esto tiene que estar muy regulado o se puede liar una muy gorda porque está avanzando demasiado deprisa.
Vdevendettas escribió:Esta mierda va a inundar Internet cuando salga al público que ríete tú de la época de Chiquito de la Calzada, hasta en la sopa.

Y lo peor es que cada vez va a ser más difícil saber si un contenido es real o no y la poca vida y arte de estas imágenes y videos hace que piense que se vienen tiempos oscuros.

A ver en que queda todo, pero no me gusta un pelo.

Vamos a tragarnos documentales de todo tipo que serán completamente falsos y nadie se dará cuenta.

El apareo de las ballenas en la Antártida !! Qué bonito, documental de oscar... Pues es más falso que un billete de 8 euros.

La cantidad de videógrafos, cineastas, fotografos, etc, etc que se van a quedar en el paro absoluto.

@Chun-Li Es imposible de regular. Sólo podrán regular las ias de empresas como Openai, Google, Claude... Pero a ver qué hacen con las ia,s open source, o las que tenga yo en mi casa de forma privada, o las que tengan empresas de forma privada o secreta. Habrá cientos de miles y en unos años millones.

Tal vez si desapareciese internet ahora mismo tendríamos alguna posibilidad, si no, vamos directos hacia el abismo.
La verdad, me están entrando ganas de rejugar MGS2.

Estoy viendo cosas creadas por Sora y da miedo, mucho miedo. Hasta ahora se podían manipular imágenes, y videos, aunque fuera muy, muy complejo. Pero estamos en el punto en que la gente puede crear realidades alternativas
¿Os imagináis un futuro cercano en el que pudieras crear una película en tu casa con un guion escrito?

Muy loco todo esto.

Si se consigue dar cierta consistencia a las imágenes (que los personajes sean los mismos todo el tiempo y los paisajes) va a estar interesante.
Vdevendettas escribió:¿Os imagináis un futuro cercano en el que pudieras crear una película en tu casa con un guion escrito?

Muy loco todo esto.

Si se consigue dar cierta consistencia a las imágenes (que los personajes sean los mismos todo el tiempo y los paisajes) va a estar interesante.

Ya se puede crear canciones, así que todo es posible...

Esto de los videos la verdad es que acojona bastante, veremos cómo se regula...
El móvil últimamente me esta recomendando artículos de personajes ficticios convertidos a como serian en real gracias a la IA y la verdad es que son sorprendentes.

¿Alguien sabría que sitio web alberga esa IA que hace reales a personajes animados y de anime en real?

Me gustaría trastear un rato
Parece que viene el ferrocarril y nosotros mirando desde nuestros burros de carga 😅.

En cualquier caso no sé qué cantidad de energía y tiempo son necesarios para generar esos vídeos, pero sospecho que debe ser una burrada. De todas formas aunque los resultados son impresionantes el control igual es algo aleatorio, no sé, quizás se revalorice un trabajo real más que un vídeo hecho con Sora.

A ver en qué queda todo ésto.
Hola.

¿A alguien le ha pasado alguna vez que una de estas IAs le haya intentado convencer de algo de manera insistente? Me acaba de pasar por primera vez (concretamente con Copilot) y estoy bastante sorprendido. XD A ver si se van a convertir (los van a convertir) en una especie de pastores religiosos o algo. [looco]
SirAzraelGrotesque escribió:Hola.

¿A alguien le ha pasado alguna vez que una de estas IAs le haya intentado convencer de algo de manera insistente? Me acaba de pasar por primera vez (concretamente con Copilot) y estoy bastante sorprendido. XD A ver si se van a convertir (los van a convertir) en una especie de pastores religiosos o algo. [looco]


Yo en copilot (aún no se llamaba así) el verano pasado tuve un bug muy interesante. Le pregunté por información de un grupo de música bastante desconocido y durante la conversación se hizo un lío y me dijo que su cantante murió de cancer en 2030 y le estuve preguntando sobre acontecimientos importantes en el futuro y me estuvo respondiendo como si fueran datos históricos, algunos muy interesantes 😅😅 pero ya ni los recuerdo
Pues ayer me estrene con el mundo ia.

Estuve haciendo un vídeo de un torneo de artes marciales la que asistí, y cuando lo estaba terminando dije, que demonios le pongo de música?

Y me acordé de una página que le das la info y te genera una canción.

Pues sin palabras, 10 segundos después de decirle que quería una canción con buen ritmo sobre una chica nueva que llega a un torneo y les gana a todos, tenía tremendo temazo que me flipo y le sentaba al video como un guante.

Me voy a suscribir al servicio y desde ahora TODA la música de mi canal de Youtube va a ser eso.

Se acabó el copyright y todas las historias asociadas por 8€ al mes.

Menudo puto flipe y lo peligroso que es esto. Sin palabras.
Enanon escribió:Pues ayer me estrene con el mundo ia.

Estuve haciendo un vídeo de un torneo de artes marciales la que asistí, y cuando lo estaba terminando dije, que demonios le pongo de música?

Y me acordé de una página que le das la info y te genera una canción.

Pues sin palabras, 10 segundos después de decirle que quería una canción con buen ritmo sobre una chica nueva que llega a un torneo y les gana a todos, tenía tremendo temazo que me flipo y le sentaba al video como un guante.

Me voy a suscribir al servicio y desde ahora TODA la música de mi canal de Youtube va a ser eso.

Se acabó el copyright y todas las historias asociadas por 8€ al mes.

Menudo puto flipe y lo peligroso que es esto. Sin palabras.


¿Puedes poner la página por curiosidad? ¿Y la canción a ver cómo ha quedado?
@Vdevendettas https://app.suno.ai/create/

no tengo el link que loguee con otra cuenta, a ver si mañana me acuerdo.
Vdevendettas escribió:.
Si se consigue dar cierta consistencia a las imágenes (que los personajes sean los mismos todo el tiempo y los paisajes) va a estar interesante.


Para lo de los personajes, igual se podria refinar esa IA poniendo un apartado donde puedas definir y dejar guardado a todo el reparto de actores que van a aparecer en esa película, y ponerles nombres, edad y definir sus características personales. Luego, en el guión de la peli, cada vez que aparezca el nombre de ese personaje para hacer alguna acción o decir algo, la IA misma podria consultar la ficha de ese personaje para saber su apariencia y "renderizarlo" inequívocamente.

Algo así como:

-john- dice: "nos hemos quedado sin cerveza".

La IA va a la sección de "reparto", consulta la ficha del personaje que se llame John y renderiza el modelo asociado a ese nombre (quien dice nombre puede decir también darle un ID a cada personaje y referirse con eso en vez de con el nombre. Así no hay ambigüedades con personajes que se llamen igual).

Includo se podrian hacer locuras como dar una serie de atributos de personalidad a cada miembro del reparto, como por ejemplo "este personaje es tímido, o muy agresivo, o impaciente, etc" y, si al escribir el guión, la propia IA detecta que estas haciendo que un personaje realice alguna acción que se sale mucho de lo que sería su personalidad, te lo indique para que puedas revisarlo y/o corregirlo (por poner un símil, algo así como la detección de errores de sintaxis que hacen los IDEs cuando estás programando, pero llevado a la escritura de un guión para mantener la coherencia de éste).

En fin, no se si se me acaba de ir la olla demasiado ni si he conseguido explicarme bien, pero es que todo esto ofrece tantas posibilidades...
paco_man escribió:Yolanda Díaz se enfada por los memes que la ridiculizan imitando su voz y los quiere perseguir penalmente

Imagen

Sumar ha presentado una proposición de ley orgánica de regulación de las "simulaciones de imágenes y voces de personas generadas por medio de la inteligencia artificial". El deseo de regular esta materia está en la mayoría de los grupos políticos con el fin de evitar situaciones de acoso, difamación o chantaje. Pero el texto presentado por Sumar incluye una nueva redacción de artículos del Código Penal que le permitirían a su líder, Yolanda Díaz, perseguir las caricaturas realizadas con inteligencia artificial y que llenan las redes sociales criticando las ocurrencias de la vicepresidencia de Sánchez. Y ella, casualmente, se ha convertido en una de las dianas preferidas de este tipo de memes virales.

https://www.libertaddigital.com/espana/ ... e-7082797/


debe ser por esta
https://www.tiktok.com/@losmeconios/vid ... 2827317536





cancion creada con IA de un tal marcus boss
https://vocaroo.com/19ZWpX2DtC4A
393 respuestas
14, 5, 6, 7, 8