Idea chapucera para comprimir archivos

1- Cojer un archivo cualquiera que NO lleve firma digital.
2- Abrirlo con el Bloc de notas (o cualquier editor de texto)
3- Lo complicado (punto crítico de la idea): Comprimir ese texto.
4- Copy & paste del nuevo texto, listo para postear en cualquier foro, o archivo de texto más ligero listo para ser enviado por email. Whatever.

Creo que había un programa (CriptoQ) que dejaba más ligero el texto y lo encriptaba. ¿Hay archivos de texto que ocupen menos que .txt? Es necesario que no rompan la estructura base del texto: tienen que respetar carácteres, espacios y saltos de linea.
Estooooo, precisamente comprimir ese "texto" que dices es lo que hace un compresor (como el 7zip, gratis y sencillo). No te voy a contar cómo se comprime y descomprime un archivo ni en qué consiste ese proceso, pero sí te digo que tu idea no sólo es chapucera sino que no serviría de nada: tienes que comprimir ese texto que es como comprimir directamente el archivo sin tanta parafernalia. Por no añadir que si quieres, pruebes a abrir con el editor de texto un archivo de unos 10 megas, por ejemplo, a ver cómo te va [sonrisa]
Veamos... un poco de explicación

La compresión de un archivo puede realizarse de dos modos: Con perdida, y sin perdida

Empecemos por la "sin perdida", que debe de aplicarse a archivos de texto, programas, etc... obviamente si un archivo de texto es comprimido, y pierde datos... la compresión no nos sirve de nada, y lo mismo se aplica a un programa porque obviamente al descomprimirlo, si no es igual que antes de la compresión simplemente no funciona. ¿Me sigues?

Básicamente, cualquier programa de compresión lo que hace es buscar partes que se repitan y sustituirlas con una marca que indique "esto equivale a"... claro que esto es simplificando enormemente la cuestión, las matemáticas y las rutinas que se usan pueden llegar a ser extremadamente complejas, pero la principio es ese.

Por ejemplo, puedes ver que en este texto aparecen muchas veces palabras como "es", "que", etc... cada una de esas palabras tiene 2 caracteres, simplemente sustituyendolos por 1 ya reducen bastante el tamaño del archivo. Obviamente hablamos de generalidades... la wiki es tu amiga para ampliar esta información.

El texto es particularmente fácil de comprimir, porque usamos un juego de caracteres reducido, se repiten muchas palabras... en el caso de programas suele haber partes que se repiten, trozos en blanco, etc...

Esto sería para la compresión SIN perdida, ahora hablemos de la compresión con perdida.

¿Para que querriamos comprimir algo perdiendo datos?... pues porque el método es "parecido", pero los ratios de compresión son mucho mas elevados. Hablamos por ejemplo de imagenes, vídeo, audio... en general todos los derivados del clásico MPG, ya sea Mp3, XVID, DIV-X, MPG, MPG-2 etc... son variaciones sobre lo mismo.

En una imagen, hay trozos con colores MUY similares, que el ojo no distingue fácilmente, y reduciendolos a colores muy similares podemos crear "bloques" de colores similares susceptibles de ser almacenados de forma mas simple, y lo mismo vale para el audio, el vídeo, etc... todos esos formatos tienen una perdida de información sobre el original, así un Mp3 nunca, nunca suena exactamente igual que el archivo original, ya que corta frecuencias generalmente inapreciables y tiene una pequeña perdida de calidad respecto al original, la cuestión es si es realmente apreciable o no... y ahi depende obviamente del oido de cada persona, y hay niveles de compresión en los que la perdida es en la practica, inapreciable, pero la reducción de tamaño es importante

Pero... la composición de un archivo de imagen, audio o vídeo y la de un texto (por ejemplo) son muy diferentes en lo que hace referencia a la cantidad de "bloques"... las imágenes pueden usar 3 bytes por cada pixel de la imagen (24 bits) o incluso mas si usamos un canal de transparencia, mientras que el texto... bueno, usamos mayusculas, minusculas, letras acentuadas y algunos caracteres especiales... claramente es algo mucho menor.

Esto es una mera introducción para que te hagas una idea de como funcionan las compresiones y porque lo que propones no tiene una utilidad practica... si quieres informarte mas al respecto te recomiendo que explores un poco por la red
2 respuestas