A TENER EN CUENTA
El libro de Don Quijote de la Mancha consta de dos partes, un prólogo y la novela de Don Quijote.
- El prólogo del libro de Don Quijote, escrito por Miguel de Cervantes Saavedra tiene unas 4.702 palabras, 21.335 letras (sin contar los espacios en blanco).
- La parte principal del libro de Don Quijote, si contamos a partir de la parte que dice «En un lugar de la Mancha, de cuyo nombre no quiero acordarme…» tiene 377.032 palabras, 1.687.570 caracteres (sin contar espacios en blanco, si los contásemos entonces saldrían un total de 2.034.611 caracteres).
CONTAMOS LAS PALABRAS TOTALES Y OTRAS COSAS
El libro Don Quijote de la Mancha tiene un total de 381.104 palabras (prólogo + novela) utilizando un vocabulario de 22.939 palabras distintas.
La cifra es aproximada porque en cada versión del libro, quitan o añaden palabras para que se entienda mejor, ya que el castellano antiguo utiliza palabras que hoy en día nos sonaría demasiado extraño.
El libro libro de Don Quijote la Mancha tiene…
- Número total de palabras: 381.104
- Número de palabras diferentes: 22.939
- Número de caracteres utilizados : 2.059.005
- Puntos y aparte: 4.046
- Puntos y seguido: 4.161
- Comas: 40.167
- Puntos y comas: 4.800
- Exclamaciones (!): 690
- Interrogaciones (?): 960
- Dos puntos: 2046
Las 11.184 palabras menos utilizadas en el famoso libro de Cervantes (sólo utilizadas 1 vez) no las podemos publicar aquí por ser la lista demasiado grande (os podéis descargar el archivo completo de palabras), pero aquí van 80 palabras de muestra:
abaja, abarraganados, abatanar, Abencerraje, aberenjenado, abomino, Abrenuncio, acendradísimo, acetarlos, adeliñase, adeliño, alanceallas, Alastrajareas, albanega, aljamiado, boquirruque, botillerías, cabrahígo, Cachidiablo, Cachopines, cadahalso, colmilludo, cordelejo, desalforjó, enalbardando, jurisconsultos, maesecoral, malbaratándolas, nizarani, pártome, quebrantáredes, quedáronse, quejosos, quidem, quisierdes, quisieridísimis, rafigurarle, raheces, raigones, rayaba, Regostóse, reverendísimas, roguéle, sacabuches, salmanticenses, silguero, sinabafas, solus, tajadicas, tañedores, téngolo, tobosescas, tobosina, Tonante, torniscones, trabazón, trillando, turres, túvola, Túvolos, Urbina, valederas, véome, vistióle, voquibles, Xenofonte, yerres, zagala, zagalejas, zahareña, zaquizamí, zoltanís, Zonzorino, Zopiro, Zoroastes, zoroástrica, Zorruna, Zulema, zurrón, zuzaban.
Las 98 palabras más utilizadas en el libro Don Quijote de la Mancha:
Palabra |
Frecuencia |
% aparición |
que |
20617 |
5.41 |
de |
18210 |
4.78 |
y |
18181 |
4.77 |
la |
10362 |
2.72 |
a |
9820 |
2.58 |
en |
8238 |
2.16 |
el |
8209 |
2.15 |
no |
6334 |
1.66 |
los |
4748 |
1.25 |
se |
4689 |
1.23 |
con |
4202 |
1.10 |
por |
3937 |
1.03 |
las |
3468 |
0.91 |
lo |
3459 |
0.91 |
le |
3398 |
0.89 |
su |
3352 |
0.88 |
don |
2646 |
0.69 |
del |
2490 |
0.65 |
me |
2345 |
0.62 |
como |
2263 |
0.59 |
Quijote |
2174 |
0.57 |
Sancho |
2147 |
0.56 |
es |
2142 |
0.56 |
yo |
2077 |
0.54 |
más |
2044 |
0.54 |
si |
1965 |
0.52 |
un |
1936 |
0.51 |
dijo |
1808 |
0.47 |
al |
1736 |
0.46 |
mi |
1704 |
0.45 |
para |
1460 |
0.38 |
porque |
1394 |
0.37 |
ni |
1376 |
0.36 |
una |
1329 |
0.35 |
él |
1278 |
0.34 |
tan |
1243 |
0.33 |
o |
1213 |
0.32 |
todo |
1180 |
0.31 |
sin |
1156 |
0.30 |
así |
1065 |
0.28 |
señor |
1063 |
0.28 |
respondió |
1063 |
0.28 |
ser |
1056 |
0.28 |
ha |
1052 |
0.28 |
bien |
1050 |
0.28 |
sus |
1049 |
0.28 |
había |
1034 |
0.27 |
pero |
1014 |
0.27 |
merced |
900 |
0.24 |
esto |
886 |
0.23 |
pues |
865 |
0.23 |
vuestra |
851 |
0.22 |
qué |
849 |
0.22 |
todos |
816 |
0.21 |
ya |
785 |
0.21 |
cuando |
756 |
0.20 |
era |
754 |
0.20 |
te |
726 |
0.19 |
cual |
704 |
0.18 |
sino |
694 |
0.18 |
dos |
684 |
0.18 |
donde |
674 |
0.18 |
caballero |
661 |
0.17 |
fue |
651 |
0.17 |
este |
642 |
0.17 |
esta |
623 |
0.16 |
quien |
618 |
0.16 |
ella |
603 |
0.16 |
decir |
578 |
0.15 |
he |
537 |
0.14 |
muy |
535 |
0.14 |
hacer |
535 |
0.14 |
dios |
531 |
0.14 |
aunque |
531 |
0.14 |
otra |
517 |
0.14 |
señora |
516 |
0.14 |
aquí |
516 |
0.14 |
otro |
511 |
0.13 |
mí |
501 |
0.13 |
aquel |
487 |
0.13 |
son |
485 |
0.13 |
estaba |
478 |
0.13 |
hay |
471 |
0.12 |
os |
463 |
0.12 |
mal |
459 |
0.12 |
sobre |
454 |
0.12 |
nos |
450 |
0.12 |
cosa |
447 |
0.12 |
buen |
442 |
0.12 |
está |
441 |
0.12 |
verdad |
431 |
0.11 |
tal |
428 |
0.11 |
tanto |
420 |
0.11 |
allí |
420 |
0.11 |
ver |
408 |
0.11 |
tengo |
402 |
0.11 |
mundo |
394 |
0.10 |
luego |
390 |
0.10 |
iene |
389 |
0.10 |
mis |
388 |
0.10 |
Un regalito para los que quieran todo el vocabulario completo:
- Descargar Listado de las 22.939 palabras (únicas, sin repetir) utilizadas para escribir Don Quijote de la Mancha. El listado está en formato texto y ordenadas por frecuencia de aparición. Está en formato texto (.txt) para poder abrirse con cualquier programa que procese texto (incluso con un navegador de Internet). Si alguien lo utiliza en su página web o en otro sitio, agradecería un link a esta página que estás leyendo O:)
DESCARGAR EL LIBRO
Quién quiera el libro, aquí se encuentra en dos formatos diferentes:
- Descargar libro Don Quijote de la Mancha de Miguel de Cervantes en formato Word (.doc)
- Descargar libro Don Quijote de la Mancha de Miguel de Cervantes en formato Acrobat (.pdf)
OTROS ENLACES CURIOSOS
Si te ha interesado este artículo, quizás también te interese lo siguiente:
- ¿Qué es un trifelio? monjamonjamón
- Palabras sólo con una de las vocales a,e,i,o,u
- Palabras con todas las vocales a,e,i,o,u (hay 42.266!)
- Todas las canciones que utilizan una sola vocal
- Las palabras más largas en español
Y esto es todo ami@s. si te gusta este artículo por favor, deja un comentario.
15 comentarios
Saltar al formulario de comentarios
98 0 100 palabras?
salu2
Autor
Glups! es verdad, hay 98! (cuando pueda pondré las que faltan)
Autor
Bueno, ya está, he modificado la lista y ahora si que hay 100. :P
La palabra que Cervantes usa tan sólo una vez es «evidentemente»: capítulo cuarenta y ocho de la primera parte.
Con lo que respecta a número de palabras, va en relación a la edición con la que contemos; no todas las ediciones del Quijote son iguales.
Autor
La palabra «evidentemente» aparece en el párrafo que dice:
-¡Válame Nuestra Señora! -respondió Sancho, dando una gran voz-. Y ¿es posible que sea vuestra merced tan duro de celebro, y tan falto de meollo, que no eche de ver que es pura verdad la que le digo, y que en esta su prisión y desgracia tiene más parte la malicia que el encanto? Pero, pues así es, yo le quiero probar evidentemente como no va encantado. Si no, dígame, así Dios le saque desta tormenta, y así se vea en los brazos de mi señora Dulcinea cuando menos se piense…
Lo que dices que el número de palabras depende de la edición, tienes toda la razón. En este caso, me baso en la edición en PDF que dejo colgado, donde pone «Descargar libro Don Quijote de la Mancha de Miguel de Cervantes en formato Acrobat (.pdf)», tal como explico también en el texto… ;)
Está claro que esta edición no es exactamente la misma que utilizó originalmente Cervantes (con expresiones en castellano antiguo que hoy en día no entenderíamos), pero por más que he buscado dicha versión, no la he encontrado.
En todo caso, esta versión de Don Quijote que he colgado en DOC y en PDF, es la más extendida por Internet y se la considera una de las más «fieles» a la original, por eso considero que los datos que me han proporcionado mis programas «contadores de palabras» (y que en esta página publico) son bastante exactos.
Orale, interesante lo del programa contador de palabras… Saludos desde México
He regresado a esta publicación un montón de veces en los últimos años, es mi referencia obligada para hacerle ver a un cliente lo ridículamente larga que es la información que me está pidiendo que analice. ¡Muchas gracias!
Autor
Por curiosidad, ¿a qué tipo de clientes te refieres?
Soy consultor de análisis de datos. Trabajo con frecuencia en organizar información no estructurada y el número de caracteres es un factor para determinar el precio del proyecto, entonces uso el ejemplo del Quijote para que los clientes puedan dimensionar a qué me refiero. Recuerdo haberlo utilizado para compararlo con una lista de títulos de sentencias judiciales y con una relación de llamados de personal de una empresa. En ambos casos, la información equivalía a más de 10 copias del Quijote. La comparación ha tenido el efecto esperado siempre.
En promedio, Cervantes introduce una nueva palabra cada 16.2 palabras escritas.
Si el Quijote tiene un total de 381.104 palabras de las que 22.939 son diferentes, ésto significa un 6,019 %.
Visto este dato en su página, he contado las palabras diferentes de unas pocas páginas de una novela y el porcentaje, supera el 15 %.
Tiene esto alguna relevancia?
Gracias
Por último, existe algún sistema para contar palabras diferentes de un texto literario?
El Quijote de Francisco Rico, creo de 1997, acompañaba un CD con una base de datos. En ella podías localizar las veces y los párrafos que aparecía un palabra cualquiera. Lo que a los estudiosos nos venía muy bien. Sólo poner la palabra, y te la buscaba y localizaba en el párrafo.
He intentado hacerlo ahora, y los actuales ordenadores no pueden leer la base de datos. Y no puedo creer que no se ha hecho una versión moderna, para poder seguir utilizando un trabajo de una de las universidadades de Barcelona, que debió ser largo y arduo. Me gustaría tener noticias sobre este asunto.
Todo ello, sin dejar de reconocer y agradecer el importante trabajo de Sócrates. Muchas gracias.
Excelente información.
Ingrese a este sitio solo para saber cuantas palabras distintas habían en el Quijote de la mancha porque quería escribir un artículo por el día del idioma, pero terminé fascinado con tanta información!
¿Estos datos son efectivos para la edición Princesp (1605)?
Creo que lo más acertado para el análisis cuantitativo de palabras , letras, acentos ,etc ., sería calcularlas en la edición Príncipe de Juan de la Cuesta…
Otro asunto interesante sería un análisis semejante de los 35 capítulos del Quijote apócrifo de Avellaneda, dada la influencia que indirectamente tiene en la segunda parte de Don Quijote..