Una base de datos de cien millones (sí, cien millones) de palabras registra toda la vida del idioma español. La base de datos reside en la Unversidad de Ilinois y ha sido construida por un equipo dirigido por el profesor Mark Davies.
El Corpus del Español permite realizar nuevos tipos de búsquedas, que hasta ahora no era posible realizar
- búsquedas de sinónimos para más de 30.000 palabras: p. ej., cuáles son los sinónimos más comunes de 'inteligente', 'rico',etc.
- búsquedas de colocaciones, es decir, búsquedas de coocurrencias entre palabras, en función de su frecuencia, p. ej., cuáles son los adjetivos más comunes con 'cara', los sustantivos que concurren con más frecuencia después de 'suave', o los verbos máscomunes con 'chistes'
- búsquedas de frecuencias, como p. ej., qué verbos nuevos han aparecido desde el siglo XIX, o qué sinónimos de 'roto' son más comunes en el español escrito que en el español hablado;
- búsqueda de frecuencias en función de: la categoría gramatical, p. ej., los infinitivos más comunes después de 'imposible de', o los adjetivos más comunes después de 'noche'
- búsquedas de palabras en función de sufijos, p. ej., las palabras que terminan en '-azo' o búsquedas en función de cadenas de caracteres internas, p. ej., las palabras que tienen la cadena '-camin-' en su interior;
- posibilidad de creación de listas de palabras personalizadas, así p. ej., se pueden crear listas de palabras relacionadas con las emociones, la ropa, etc., y después se pueden usar en otras búsquedas;
- búsquedas a partir de combinaciones de búsquedas más sencillas, p. ej., todas las formas de todos los sinónimos de 'decir', seguidas de todas las formas de todos los sinónimos de 'chiste'.