A Plataforma CE-DOHS apresenta uma base documental, majoritariamente inédita, para estudo do português brasileiro (PB), no âmbito da Linguística Histórica e da Linguística Diacrônica, e das demais disciplinas da Linguística, bem como de outras áreas do conhecimento.
A formação do CE-DOHS atual, que faz parte do Projeto Guarda-Chuva, intitulado “CE-DOHS: um corpus para uma caracterização linguístico-gramatical do português brasileiro - fase colonial e fase pós-colonial”, criado em 2010, deu-se no Núcleo de Estudos de Língua Portuguesa (NELP), que completou, em 2023, 25 anos de existência no Departamento de Letras e Artes da Universidade Estadual de Feira de Santana (DLA/UEFS). O projeto tem sido coordenado, desde a sua implementação, pela Professora Doutora Zenaide de Oliveira Novais Carneiro e pela Professora Doutora Mariana Fagundes de Oliveira Lacerda. Esta plataforma deriva de desdobramentos dos seguintes projetos: projeto “Contribuições para a constituição de um banco de textos e de um banco de dados para o estudo da história do português do Brasil, do séc. XVII ao XX”, elaborado pela Professora Doutora Ilza Maria de Oliveira Ribeiro, em 1997, e aprovado pelo CONSEPE/UEFS 2597, em 1998, tendo sido por ela coordenado até sua aposentadoria; do projeto “Vozes do Sertão em Dados: história, povos e formação do português brasileiro” (CNPq 40143372009/2009-9), coordenado pela Professora Doutora Zenaide de Oliveira Novais Carneiro e pela Professora Doutora Mariana Fagundes de Oliveira Lacerda; do projeto “A Língua Portuguesa no Semi-árido Baiano” (CONSEPE 1998), financiado pela FAPESB, coordenado, nas fases 1-4, pelas Professoras Doutoras Norma Lucia Fernandes de Almeida e Zenaide de Oliveira Novais Carneiro.
A Plataforma CE-DOHS constitui-se em um corpus resultante de intensa prospecção em fontes confiáveis, para a elaboração das biografias de seus autores, com textos editados de forma fidedigna e com autoria bem controlada e diversificada. O CE-DOHS permite que se personalize o corpus, de acordo com o interesse do pesquisador, que, entre inúmeras possibilidades, pode optar em o separar, no que concerne ao autor, por: etnia (indígenas, brancos, negros do Brasil, mulatos, mamelucos e pardos, entre outras); nível de escolarização e habilidade/inabilidade com a escrita; sexo; profissão; estratificação social; data e local de nascimento do autor (naturalidade e nacionalidade); e, no que concerne ao documento, por: data e local de escrita, meio urbano e meio rural, a quem foi destinado e para quê . Informações sobre a identificação do arquivo, onde está preservado o original, entre outras, podem ser acessadas nos metadados, nesta Plataforma. A pesquisa com fontes produzidas por indígenas e por mamelucos – no âmbito dos aldeamentos e da implantação das vilas, durante o Diretório Pombalino e em fases anteriores, a partir de 1591 – tem-se revelado um campo bastante profícuo, embora de difícil execução. Recentemente, essa agenda vem sendo desenvolvida também por diversos outros pesquisadores do Programa para a História da Língua Portuguesa (PROHPOR), fundado, na Universidade Federal da Bahia (UFBA), pela Profa. Dra. Rosa Virgínia Mattos e Silva, em 1990.
Na parte em que foi feita a edição em linguagemxml (Extensible Markup Language), a Plataforma CE-DOHS usa a ferramenta de edição eletrônica eDictor, desenvolvida por Maria Clara Paixão de Sousa, Fábio Kepler, Pablo Faria (2010), linguagem que permite a manipulação eletrônica do corpus, por meio de anotação e do uso de ferramentas de buscas de dados linguísticos, sintáticos e lexicais. A tecnologia de edição digital permite gerar versões diversas. No CE-DOHS, na fase inicial, fez-se a conversão da versão word da edição diplomático-interpretativa para a versão em xml, preservando o formato original da edição, que se adéqua às normas de edição filológica do Projeto Nacional Para a História do Português Brasileiro (PHPB), implementado pelo Prof. Dr. Ataliba Castilho, em 1997; disponibilizam-se também, na plataforma, a versão fac-similar do manuscrito e as transcrições fidedignas das amostras de fala. Todos os materiais estão sendo, paulatinamente, disponibilizados na rede mundial de computadores, com acesso gratuito, para além de um acesso específico e parcial do Corpus, por meio de publicações de Coletâneas e Séries , e dos repositórios, onde estão depositadas as monografias, dissertações e teses dos pesquisadores que fizeram as edições originais das coleções documentais.
Um cenário, portanto, que coloca inúmeros desafios para a formação de um corpus que o caracterize adequadamente, sobretudo porque o acesso à tradição escrita no Brasil Colonial era bastante limitado e se restringia, quase completamente, a uma pequena parcela da população, notadamente branca e pertencente à elite econômica e social da época, gerando uma grande desigualdade e desproporcionalidade. Para essa população, o corpus é mais robusto, contrapondo-se ao da imensa maioria da população não branca, para a qual o corpus não é somente escasso, mas de natureza arqueológica e rara (Mattos e Silva, 2002). No entanto, a escrita de brasileiros do século XIX é mais abundante, comprovando o que disse Fernando Tarallo, em 1993, sobre o aparecimento da gramática do PB nos textos desse período, em contraposição a uma gramática do Português Europeu (PE). Outros estudos evidenciam, nos textos escritos nos século XIX, o aparecimento de uma incrível competição entre três gramáticas, o português Clássico (PCl), o PB e o PE (Pagotto (1992), Carneiro (2005) e Martins (2009)). Carneiro e Galves (2010) detalham esse cenário incrível de competição entre três gramáticas nos textos, interpretando-a como gerada a partir da articulação de competições entre duas gramáticas, ocorrendo simultaneamente ou sucessivamente. Esse estudo foi inicialmente apresentado em 2006, pelas autoras, no DiGS 9: The 9th Diachronic Generative Syntax Conference, na Universitàdi Trieste.
O CE-DOHS tinha, como objetivo inicial, centrar-se em
fontes documentais, provenientes dos sertões baianos
coloniais (1640-1749), que, nesse período, abrangia o
interior da
Capitania da Bahia, Piauí, Norte do atual Estado de
Minas Gerais e a margem esquerda do médio São Francisco
(Santos, 2010); também em
transcrições de amostras de fala, gravadas
na década de 90 do século XX, na Bahia, ilustrativas da
grande área do semiárido baiano, que apresenta grande
diversidade geoambiental, englobando, atualmente, a
maioria das regiões econômicas e de identidades do Estado
da Bahia, como resultado de um projeto proposto por Dante
Lucchesi, em 1993, e implementado por Norma Lucia
Fernandes de Almeida e Zenaide de Oliveira Novais
Carneiro, em 1994, no DLA/UEFS.
A base documental resulta de pesquisa em dezenas de arquivos públicos e privados, nacionais e internacionais – in loco e, também, em suas plataformas digitais e online –, e de gravações de fala, em diversas regiões da Bahia, mediante a execução de subprojetos por professores e por estudantes bolsistas de Pós-Graduação e de Iniciação Científica, do DLA/UEFS e das Universidades parceiras (UFBA, UNEB e UESC), em diversas frentes, a saber:
Adicionalmente, o corpus oferece textos escritos por portugueses, com base nos quais se pode buscar responder à pergunta de professora doutora Ilza Maria de Oliveira Ribeiro: “a mudança sintática do português brasileiro é mudança em relação a que gramática?” (Ribeiro, 1998, p. 101). Trata-se da compilação de documentos escritos por indivíduos nascidos em Portugal, entre 1450 e 1850, que migraram para o Brasil, sobretudo na ocasião da administração dos governadores gerais e vices-reis, entre 1549 e 1750. Há também uma pequena coleção documental pessoal escrita no Brasil por portugueses no século XIX. Constam, ainda, edições impressas de anúncios e cartas de leitores e redatores, publicadas na Bahia, entre 1811 e 2006.
O CE-DOHS faz parte, desde 2010, do Núcleo de Estudos de Língua Portuguesa (NELP), criado em 1997, no Departamento de Letras e Artes (DLA) da Universidade Estadual de Feira de Santana (UEFS).
O NELP trabalha com três agendas: formação de banco de textos de língua portuguesa, estudo sócio-histórico e estudo linguístico do português.
Criado em 2010, com financiamento da Fundação de Amparo à Pesquisa do Estado da Bahia (FAPESB), o projeto CE-DOHS aproxima o campo filológico e o campo computacional, oferecendo uma parte de seus documentos em edição xml, com uso do eDictor (Paixão de Sousa; Kepler; Faria, 2010), a partir da edição semidiplomática tradicional, segundo critérios paleográfico-filológicos, realizada por pesquisadores do projeto “Vozes do Sertão em Dados: história, povos e formação do português brasileiro”, criado em 2009, e por pesquisadores do projeto CE-DOHS, que vêm sempre buscando diversificar o banco, com textos ilustrativos das vertentes “popular”, sobretudo, e “culta” do português brasileiro.
A primeira fase do projeto teve por objetivo compor um banco de textos de 1808-2000, ilustrativos do período histórico do português brasileiro caracterizado pelo multilinguismo localizado; permite estudar a história do português brasileiro socialmente prestigiado, “semi-culto” e socialmente estigmatizado, nesse contexto. Há, como resultado dessa fase, vários trabalhos publicados pela equipe (cf. Lattes dos participantes da equipe).
A segunda fase, iniciada em 2019, recua ainda mais no tempo (1640-1808) e enfrenta, por isso, a raridade das fontes, sobretudo de populações que tradicionalmente tiveram pouco acesso à escola formal; o projeto, todavia, tem pequenas coleções documentais desse período e bastante significativas, em breve disponibilizadas na Plataforma.
Os logotipos CE-DOHS e DOHS são formas gráficas únicas, exclusivas e padronizadas para veicular os sinais básicos de identificação da Plataforma e do Projeto Guarda-Chuva. Devem desempenhar as seguintes funções: identificar as mensagens visuais do CE-DOHS e do DOHS, de forma imediata, unívoca e marcante; unificar e integrar as mensagens visuais do CE-DOHS e do DOHS, consolidando sua identidade visual.
Os logotipos foram criados, a pedido, pelo artista Juraci Dória, em 2010, tendo, como inspiração, os sertões baianos, área de abrangência prioritária do projeto.
Cumpre salientar que, independentemente da maneira como venham a ser utilizados, os logotipos CE-DOHS e DOHS deverão ser sempre apresentados na íntegra; ficam, portanto, vedadas estilizações, acréscimos ou supressões, variações de qualquer natureza em suas formas.
Núcleo de Estudos de Língua Portuguesa (NELP)
NELP - Núcleo de Estudo de Língua Portuguesa
NELP - Núcleo de Estudo de Língua Portuguesa (1997 - 2008)
O Núcleo de Estudos de Língua Portuguesa (NELP) da UEFS, do qual faz parte o projeto CE-DOHS, foi criado pelas professoras doutoras Zenaide de Oliveira Novais Carneiro e Norma Lucia Fernandes de Almeida, em 1997, no Departamento de Letras e Artes (DLA) da Universidade Estadual de Feira de Santana (UEFS), a partir das pesquisas desenvolvidas no âmbito do projeto A Língua Portuguesa no Semiárido Baiano, por elas coordenado e fruto de estudos iniciados, na instituição, pela professora doutora Ilza Ribeiro e pelo professor doutor Dante Lucchesi, sobre a constituição de banco de dados para investigação da história do português brasileiro. Hoje, fazem parte do NELP diversos projetos de pesquisa, coordenados por pesquisadores da UEFS, em parceria com outras universidades, brasileiras e estrangeiras. O NELP – coordenado, desde 2017, pela professora doutora Mariana Fagundes de Oliveira Lacerda –, ao lado de outros núcleos de pesquisa do departamento, fortalece a linha de pesquisa Variação e Mudança Linguística no Português, do Programa de Pós-Graduação em Estudos Linguísticos (PPGEL) da UEFS(https://ppgel.uefs.br/).