la pagina de gutenberg ya la tenia, y he sacado muchas pero me hacen falta mas, nunca pense q 15 millones de palabras fuesen tantas....
los libros de harry potter, TODOS, no llegan al medio millon, la biblia algo menos de dos millones y bueno poco a poco... va saliendo la cosa.
Lo de la wikipedia tambien me sera muy util gracias a todos por las ideas, ya estamos cerca de la cifra.
Respecto a lo de porque un trabajo tan inutil pues no lo se... es el trabajo mas absurdo que he visto en mi vida.os explico en que consiste pal q este interesado y vereis que es mas absurdo aun...
Se reunen 15millones de palabras, se pasan a formato TXT y se "limpian", osea se le quitan impurezas al texto, caracteres raros, tabulaciones y formatos...
En base a ese texto se debe de hacer una pagina web en html con el bloc de notas (ojo q no se puede usar editor, si no te cascan).
Se coje una palabra que aparezca mas de 300 veces y explicar el sentido de la palabra en la frase y analizar la frase y demas polladas de linguistica.Todo en ingles y con el bloc de notas y otros cutreprogrmas de Ms-dos (q por suerte rulan desde windows)
Yo se lo he dicho a mi novia, "Es el trabajo mas absurdo que he visto en mi vida"
No seria mas coger un simple libro, o 5 o 10, y buscar una palabra q aparezca mucho, pero tio 15 millones de palabras... es por putear.