Una foto aleatoria

Una foto aleatoria


(Foto de )

Una frase aleatoria

(Cita de )

lunes, 5 de abril de 2010

Cien columnas

Hace algunas semanas, he publicado cien columnas en el diario El Día de Ciudad Real durante cien semanas ininterrumpidas. Por curiosidad he calculado algunos datos:
a)      Entre todas suman 67.607 palabras. No he contado aquí los números, que han sido unos cuantos cientos.
b)      Muchas de esas palabras aparecen más de una vez: “de”, por ejemplo, es la palabra más corriente y aparece 4.006 veces; la siguiente es “que”, con 3.111; después vienen “la”, “y”, “el” y “en”, con 2.287, 2.051, 1.924 y 1.841 apariciones respectivamente.
c)      Realmente, el número de palabras distintas utilizadas ha sido de 11.699: “abad” o “abanderado” aparecen una sola vez. “Abandonaba” también, pero luego aparecen más veces otras formas verbales del verbo “abandonar”, como “abandonó” o “abandonando”. Solamente hay 7022 palabras que aparecen una sola vez. El resto aparece más de una vez.
d)      Por letras: 5266 empiezan por A, 737 por B, 5035 por C, 7356 por D, 7779 por E, 1020 por F, 663 por G, 1900 por H, 1387 por I, 335 por J, 32 por K, 5933 por L, 3401 por M, 1905 por N, 2 por Ñ (la propia letra “ñ”), 1631 por O, 5200 por P, 3459 por Q, 1540 por R, 4501 por S, 2192 por T, 2063 por U, 1208 por V, 34 por W, 15 por X (Xavier, xenófoba, xenófobos, Xunta y algunos siglos), 2321 por Y y 49 por Z.
e)      Aisladamente, la letra “a” aparece 1454 veces; la “e” 45; la “i”, una vez (supongo que procedente de algún texto en inglés); la “o”, 564; la “u”, 8.
f)        La “y”, como conjunción, aparece 2051 veces.
g)      En total, aparecen 308.876 letras (entre la A y la Z) en los 100 textos. La E es la más frecuente, con 42.173 ejemplares (13,65%), seguida de la A, con 36087 (11,68%). Después vienen la O, la S y la N, respectivamente con el 9,14, el 7,62 y el 7,33 por ciento. Estas cinco letras (E, A, O, S y N) acumulan casi el 50% de las apariciones. Y, de entre las 3125 combinaciones posibles que pueden conseguirse con ellas cinco, encontramos las siguientes palabras castellanas: anoas (un tipo de búfalo), anona (un árbol), ansas (un asa), asaos, asase, asean, aseas, aseen, asees, aseos, asesa, aseso, asnas, asnos, enana (de “enanar”: hacer enano), enane, enano, nanas, nanea (de “nanear”: andar como los patos), nanee, naneo, nansa (nasa de pescar), nenas, nenes, nones, nonos (novenos), osaos, osase, osean (del verbo “osear”), ososa y ososo (relativos al hueso), sanan, sanas, sanea, sanee, sanen, saneo, sanes, sanos, sansa (orujo de aceituna), sanso (en Vizcaya, según el diccionario, es un grito de alegría), senas (conjunto de seis puntos señalados en la cara de un dado), senos, sesee (de sesear), seseo, sesos, soasa, soase, soaso, sones, sonsa y sonso (tonta y tonto), sosas y sosos.
h)      Después vienen, ordenadamente, la R, I, L, D, U, C, T, M, P, B, Q, G, Y, V, H, F, J, Z, Ñ, X, K y W.
La longitud media de las palabras usadas es de 7,85 letras. La más larga, “inconstitucionalidad”, seguida de “medioambientalmente”, “democratacristianos” y “castellanomanchegos”. Como se ve en el gráfico, las palabras más frecuentes tienen entre 7 y 8 caracteres.

2 comentarios:

  1. La curiosidad. ¿No sería el aburrimiento el que te incitó al cálculo de estos datos sobre tus cien columnas?

    ResponderEliminar
  2. ese anónimo estará aburrido por leer los datos sobre las columnas

    ResponderEliminar