› Foros › Off-Topic › Miscelánea
katatsumuri escribió:@Torres en 2017 facebook, antes de ser meta, tuvo que desactivar dos IAs que empezaron a hablar entre ellas en un lenguaje inventado porque parecía que no eran muy amigables.
https://es.gizmodo.com/lo-que-realmente ... 1797424875
Quiero decir, que no es algo nuevo.
Gemini si lo pones a hablar con otro gemini es bastante cortito, de hecho diría que llega un momento que puede entrar en bucle, está muy capado.
Abrams escribió:@Torres https://github.com/PennyroyalTea/gibberlink
Es un proyecto especificamente desarrollado para esto, dotar a una IA de utilizar otro protocolo de lenguaje para ser más eficiente.
No es nada extraño, se sabe que una IA conversacional puede consultar a otra IA para validar y verificar la información, un modo de lograr que sea más precisa y no se equivoque. Me suena que Valve o Nvidia presentaron una idea así. Pero entre IAs no es necesario que usen el lenguaje humano para entenderse si pueden comunicarse de otro modo que les permita ser más rápidas.
Abrams escribió:@dinodini pues como España no apueste fuerte y serio en los avances con IA, mucho me temo que vamos a sufrir una invasión del latino.
Es algo que llevo tiempo viendo en IAs de texto a voz, muy pocas se adaptan al castellano, la mayoría al latino.
Torres escribió:katatsumuri escribió:@Torres en 2017 facebook, antes de ser meta, tuvo que desactivar dos IAs que empezaron a hablar entre ellas en un lenguaje inventado porque parecía que no eran muy amigables.
https://es.gizmodo.com/lo-que-realmente ... 1797424875
Quiero decir, que no es algo nuevo.
Gemini si lo pones a hablar con otro gemini es bastante cortito, de hecho diría que llega un momento que puede entrar en bucle, está muy capado.
No muy amigables como el robot este matón que se encaró con el público![]()
![]()
![]()
![]()
dinodini escribió:¿Puede alguien explicarme algo de estos videos de IA?
¿Como se hace el movimiento de esa gente? Entiendo que debe de ser que graban a personas normales, capturan el movimiento, y ahora se lo ponen a esas fotos, a esas personas que salen en las fotos. Es decir, el movimiento de esas personas de las fotos es real, es motion capture de personas en un estudio de grabación, no?
Por otro lado me pregunto como recrean la parte que no se ve de la foto. He visto videos de personas que se dan la vuelta. ¿Como puede la IA inventarse como es el pelo por atrás, inventarse la parte del rostro que no se ve en la foto?
dinodini escribió:
Hay varias cosas que fallan en esta predicción.
La traducción no puede ser al instante, porque no se puede traducir palabra a palabra. Hay que esperar a que termine una frase para que se entienda el contexto, estructura de la frase, etc, antes de traducirla. Por ej. en unos idiomas el verbo está al final de la frase. Por tanto la traducción tendrá un retardo con respecto a la persona que habla. Es decir, una persona se pone a hablar contigo y el traductor no te va a decir la traducción hasta pasado unos segundos, lo que dure la frase que esté diciendote esa persona vamos.
Por otro lado sera confuso estar escuchando dos voces a la vez, la de tu interlocutor y la del traductor. Eso lo hemos visto en películas de algunos paises del este, que lo que hacen alli con las películas es dejar la voz original y otra voz al mismo tiempo con la traducción. En esos casos lo que hacen es poner en un volumen mas bajo la voz original, para evitor la confusión de escuchar dos voces al mismo tiempo, pero eso en la vida real no va a pasar. Quien te este hablando no lo va ha hacer en un tono bajo, con lo que va a ser molesto estár escuchando dos voces a la vez. Al final lo que pasará es que la gente esperará a que esa pesona termine de hablar para que empiece a oir la traducción de lo que acaba de decir. Por tanto las conversaciones con traducción sincronizada no lo vamos a ver.
El ruido de fondo hará inviable muchas traducciones. Y no hablo solo de ruido en si, que haga complicado al traductor entender lo que dice esa persona. me refiero a que haya otras personas hablando alrededor, por ej. estando en un bar, personas que no están en tu grupo de amigos. El traductor tambien te lo va a traducir y se va a mezclar con lo que te dice tu interlocutor.
dinodini escribió:
Hay varias cosas que fallan en esta predicción.
La traducción no puede ser al instante, porque no se puede traducir palabra a palabra. Hay que esperar a que termine una frase para que se entienda el contexto, estructura de la frase, etc, antes de traducirla. Por ej. en unos idiomas el verbo está al final de la frase. Por tanto la traducción tendrá un retardo con respecto a la persona que habla. Es decir, una persona se pone a hablar contigo y el traductor no te va a decir la traducción hasta pasado unos segundos, lo que dure la frase que esté diciendote esa persona vamos.
Por otro lado sera confuso estar escuchando dos voces a la vez, la de tu interlocutor y la del traductor. Eso lo hemos visto en películas de algunos paises del este, que lo que hacen alli con las películas es dejar la voz original y otra voz al mismo tiempo con la traducción. En esos casos lo que hacen es poner en un volumen mas bajo la voz original, para evitor la confusión de escuchar dos voces al mismo tiempo, pero eso en la vida real no va a pasar. Quien te este hablando no lo va ha hacer en un tono bajo, con lo que va a ser molesto estár escuchando dos voces a la vez. Al final lo que pasará es que la gente esperará a que esa pesona termine de hablar para que empiece a oir la traducción de lo que acaba de decir. Por tanto las conversaciones con traducción sincronizada no lo vamos a ver.
El ruido de fondo hará inviable muchas traducciones. Y no hablo solo de ruido en si, que haga complicado al traductor entender lo que dice esa persona. me refiero a que haya otras personas hablando alrededor, por ej. estando en un bar, personas que no están en tu grupo de amigos. El traductor tambien te lo va a traducir y se va a mezclar con lo que te dice tu interlocutor.
amchacon escribió:dinodini escribió:
Hay varias cosas que fallan en esta predicción.
La traducción no puede ser al instante, porque no se puede traducir palabra a palabra. Hay que esperar a que termine una frase para que se entienda el contexto, estructura de la frase, etc, antes de traducirla. Por ej. en unos idiomas el verbo está al final de la frase. Por tanto la traducción tendrá un retardo con respecto a la persona que habla. Es decir, una persona se pone a hablar contigo y el traductor no te va a decir la traducción hasta pasado unos segundos, lo que dure la frase que esté diciendote esa persona vamos.
Por otro lado sera confuso estar escuchando dos voces a la vez, la de tu interlocutor y la del traductor. Eso lo hemos visto en películas de algunos paises del este, que lo que hacen alli con las películas es dejar la voz original y otra voz al mismo tiempo con la traducción. En esos casos lo que hacen es poner en un volumen mas bajo la voz original, para evitor la confusión de escuchar dos voces al mismo tiempo, pero eso en la vida real no va a pasar. Quien te este hablando no lo va ha hacer en un tono bajo, con lo que va a ser molesto estár escuchando dos voces a la vez. Al final lo que pasará es que la gente esperará a que esa pesona termine de hablar para que empiece a oir la traducción de lo que acaba de decir. Por tanto las conversaciones con traducción sincronizada no lo vamos a ver.
El ruido de fondo hará inviable muchas traducciones. Y no hablo solo de ruido en si, que haga complicado al traductor entender lo que dice esa persona. me refiero a que haya otras personas hablando alrededor, por ej. estando en un bar, personas que no están en tu grupo de amigos. El traductor tambien te lo va a traducir y se va a mezclar con lo que te dice tu interlocutor.
Hay auriculares con cancelación de ruido activa. No es perfecta pero puede reducir el volumen a un nivel aceptable y que lo pase lo que dices.
exitfor escribió:Hubo algún lío de permisos ayer?
Chagpt pasó del sabado recrear imagenes a mil estilos (por ejemplo funko pop hasta poniendo el bocadillo de Pop en la caja) a el domingo decir que no podía casi nada.
Después sugería que podia hacer algo sin copy "estilo cabezon" si querías. Y cuando le decías que vale, decia que ni así podia por copy.
Así con 99% de estilos. Incluso describiendo un tipo de estilo sin relación alguna con copy decia que tu tía.
Hoy no he probado. Le habrán caído demandas a cholón después del boom de final de semana a sábado por todas partes por todo el mundo que no sabía ni lo que era ia?
Franquicia escribió:Los que doblan también intentan sincronizar la voz con el movimiento de la boca del actor. incluso perdiendo literalidad de la traducción para que no quede raro. De momento en estos videos no existe.
Pero siendo la IA capaz de recrear la boca del actor y moverla a su antojo, no creo que sea muy difícil de implementar.
SIRDRAK escribió:exitfor escribió:Hubo algún lío de permisos ayer?
Chagpt pasó del sabado recrear imagenes a mil estilos (por ejemplo funko pop hasta poniendo el bocadillo de Pop en la caja) a el domingo decir que no podía casi nada.
Después sugería que podia hacer algo sin copy "estilo cabezon" si querías. Y cuando le decías que vale, decia que ni así podia por copy.
Así con 99% de estilos. Incluso describiendo un tipo de estilo sin relación alguna con copy decia que tu tía.
Hoy no he probado. Le habrán caído demandas a cholón después del boom de final de semana a sábado por todas partes por todo el mundo que no sabía ni lo que era ia?
La censura en sí no la lleva el modelo sino el servicio que lo utiliza, con lo cual lo pueden ir 'actualizando' y poniendo más y más cosas en la 'lista negra' cuando quieran, y esto que comentas, ya pasaba desde antes, por ejemplo con Dall-E 3, que los primeros días podía, por ejemplo, generar imágenes con Michael Jackson o Bruce Lee y sólo dos días después ya no se podía... No hace falta que les demanden ni nada... A lo que se popularice algo, hacen criba para cubrirse las espaldas y poco después ya no se puede hacer o el más difícil. Es lo malo que tienen los modelos cerrados por suscripción.
exitfor escribió:SIRDRAK escribió:exitfor escribió:Hubo algún lío de permisos ayer?
Chagpt pasó del sabado recrear imagenes a mil estilos (por ejemplo funko pop hasta poniendo el bocadillo de Pop en la caja) a el domingo decir que no podía casi nada.
Después sugería que podia hacer algo sin copy "estilo cabezon" si querías. Y cuando le decías que vale, decia que ni así podia por copy.
Así con 99% de estilos. Incluso describiendo un tipo de estilo sin relación alguna con copy decia que tu tía.
Hoy no he probado. Le habrán caído demandas a cholón después del boom de final de semana a sábado por todas partes por todo el mundo que no sabía ni lo que era ia?
La censura en sí no la lleva el modelo sino el servicio que lo utiliza, con lo cual lo pueden ir 'actualizando' y poniendo más y más cosas en la 'lista negra' cuando quieran, y esto que comentas, ya pasaba desde antes, por ejemplo con Dall-E 3, que los primeros días podía, por ejemplo, generar imágenes con Michael Jackson o Bruce Lee y sólo dos días después ya no se podía... No hace falta que les demanden ni nada... A lo que se popularice algo, hacen criba para cubrirse las espaldas y poco después ya no se puede hacer o el más difícil. Es lo malo que tienen los modelos cerrados por suscripción.
Y esto tiene mas solución que ejecuciones locales "basadas en" ?
Supongo que los locales como contra tendrán no tener toda la capacidad que si tienen los otros.
Es mera curiosidad. En este tipo de cosas lo uso como divertimento.