A partir do banco de textos formado digitalizados dispõe, está sendo composto um corpus mínimo a ser compartilhado por pesquisadores associados em estudos lingüísticos específicos.
A organização desse corpus segue as normas do Projeto Nacional para a História do Português Brasileiro/PHPB, ao qual o projeto é filiado, obedecendo em linhas gerais as categorias de entrada especificadas em Barbosa (2009):
1) Séculos: XVII, XVIII, XIX e XX;
2) Impressos e manuscritos;
3) Esferas: institucional privada e particular e institucional pública:
3.1 Manuscritos na esfera privada:
3.1 (a) Correspondência particular XIX – cartas pessoais em circulação restrita – família, amigos, colegas, etc.
3.1 (b) Correspondência institucional privada XIX – cartas pessoais em circulação na esfera administrativa de instituições privadas – casas de comércio, pequenas lojas, ordens religiosas fora da máquina pública, irmandades laicas, hospitais, clubes.
3.1 (c) Demais documentação privada – documentação geral da esfera institucional privada – casas de comércio, pequenas lojas, ordens religiosas fora da máquina pública, irmandades laicas, hospitais, clubes.
3.2. Manuscritos na esfera pública:
3.2.1 (a) Correspondência oficial XIX – cartas pessoais em circulação na esfera administrativa de instituições públicas.
3.2.2 (b) Demais documentações: oficial – documentação geral da esfera pública – notariais, jurídico, administrativos, relatórios, etc.
3.3 Manuscritos na esfera Literária.
Além dessas, é feita, ainda, uma separação dos manuscritos de acordo com o domínio da escrita do escrevente:
4) Textos manuscritos mais formuláicos e textos menos formuláicos (correspondências);
5) Rótulos de época usados nos periódicos impressos (cartas de leitores, editorias, notícias e anúncios) e nos livros (textos literários).
Para acessar os documentos já disponibilizados, veja os bancos de texto do projeto DOHS.
Universidade Estadual de Feira de Santana
CNPq