Se ha confeccionado un corpus nuclear de la lengua española, como punto de partida para la elaboración del diccionario, pues de él se extrae el lemario básico para esta primera etapa de redacción. El Corpus del Nuevo diccionario histórico (CDH) cuenta con más de 53 millones de ocurrencias, de las cuales 32 pertenecen a textos españoles y más de 20 millones a obras americanas. Los textos que conforman el corpus (en buena medida, comunes al CORDE y al CREA) se han sometido a un proceso semiautomático de anotación lingüística (operación llevada a cabo por el Departamento de Tecnología de la Real Academia Española), lematización que constituye un punto de partida para el manejo de los datos en el trabajo lexicográfico. Posteriormente, en la Fundación Lapesa se desarrolló una interfaz de consulta para el CDH, aplicación que permite realizar una variada gama de consultas, motivo por el que se ha utilizado para la presentación de otros corpus de la Academia. Más adelante se ofrecerá la consulta del CREA y de una versión reducida del CORDE, desprovista de los textos latino-romances y aljamiados, anotadas lingüísticamente.