O projeto Corpus Eletrônico de Documentos Históricos do Sertão é constituído de documentação escrita (manuscrita e impressa) e amostras de fala, do século XVI ao XX, representativas, especialmente, do português brasileiro – variedades socialmente prestigiadas e variedades socialmente estigmatizadas – e do sertão baiano. As amostras orais, já editadas em linguagem XML e disponibilizadas, são produto do projeto A Língua Portuguesa no Semiárido Baiano (UEFS), vinculado ao Núcleo de Estudos de Língua Portuguesa (NELP-UEFS), e do Programa de Estudos sobre o Português Popular de Salvador (PEPP-UNEB). Há, também, outras amostras do Projeto Norma Linguística Urbana Culta do Brasil - NURC/Salvador (UFBA) e do Projeto Estudos Linguísticos e Históricos do Sertão - Chapada Diamantina (LiHS-UNEB).