A plataforma Corpus Eletrônico de Documentos Históricos do Sertão (CE-DOHS), pioneira no Nordeste, reúne extensa base documental, que já ultrapassou as fronteiras dos sertões, constituída para estudo da história do português brasileiro e apresentada em dois conjuntos, editados em linguagem xml, a partir da edição semidiplomática: conjunto 1 – composto por manuscritos escritos entre 1808 e 2000, por indivíduos nascidos no Brasil, a partir de 1756, e por amostras de fala de brasileiros, gravadas nas últimas décadas do século XX, na Bahia; conjunto 2 – composto por manuscritos produzidos entre 1640 e 1808, por diferentes populações nascidas no Brasil, a partir de 1590, e, como documentação adicional, por manuscritos produzidos por portugueses, no Brasil, nos primeiros 150 anos de colonização e por textos impressos e sem circulação, em Portugal, a pedido de brasileiros. No total, a plataforma CE-DOHS disponibiliza ao consulente, por meio de acesso livre e gratuito, cerca de 2,3 milhões de palavras de quase 5 mil documentos, tendo atingido a meta traçada quando de sua criação, em 2010, consolidando-se como um banco de textos, com criterioso controle sócio-histórico e interfaces para a exploração de dados.