Projeto CE-DOHS
Corpus Eletrônico de Documentos Históricos do Sertão


FAPESB, Processo 5566/2010/Consepe: 202/2010

Coordenação:

Zenaide de Oliveira Novais Carneiro
(UEFS/Fapesb/CNPq)

Mariana Fagundes de Oliveira Lacerda
(UEFS/Fapesb)

Feira de Santana - BA, Brasil

Corpus Eletrônico de Documentos Históricos do Sertão [ CE-DOHS ]

Voltar

Corpus Compartilhado Diacrônico - Amostras de fala (PHPB-BA/Tycho Brahe/PROHPOR)

Os documentos estão editados em XML, utilizando a ferramenta eDictor (desenvolvida por Pablo Faria, Fábio Kepler e Maria Clara Paixão de Sousa). Essa tecnologia de edição digital foi inspirada no Corpus Histórico do Português Tycho Brahe, coordenado por Charlotte Galves.

Coleções documentais/Edições em diferentes formatos Número de documentos
Piemonte da Diamantina: Piabas – Projeto A Língua portuguesa no Semiárido Baiano: fala popular 12 Entrevistas
Este corpus oral dispõe de 12 entrevistas com falantes analfabetos ou pouco escolarizados, de ambos os sexos, divididos em três faixas etárias. A metodologia de coleta foi feita nos moldes da sociolinguística quantitativa (Labov, 1972, 1982). Os inquéritos foram gravados na fase I do projeto “A língua portuguesa falada no semiárido baiano”, entre 1997 e 1999. Nesta fase, a intenção era contribuir para o conhecimento da realidade linguística brasileira e, de forma específica, para o estudo da língua falada em áreas do semiárido baiano. As comunidades foram escolhidas de forma que representassem o avanço da língua portuguesa na Bahia, a partir do século XVII, numa perspectiva sócio-histórica. Piabas, região de transição entre o processo histórico-econômico que se define como área de pecuária e zona de mineração, é uma comunidade que tem, como formação étnica marcante, a matriz africana. 
Chapada Diamantina: Barra dos Negros/Bananal – Projeto A Língua portuguesa no Semiárido Baiano: fala popular (fase 1 e 2) 12 Entrevistas
Este corpus oral dispõe de 12 entrevistas com falantes analfabetos ou pouco escolarizados, de ambos os sexos, divididos em três faixas etárias. A metodologia de coleta foi feita nos moldes da sociolinguística quantitativa (Labov, 1972, 1982). Os inquéritos foram gravados na fase I do projeto “A língua portuguesa falada no semiárido baiano”, entre 1997 e 1999. Nesta fase, a intenção era contribuir para o conhecimento da realidade linguística brasileira e, de forma específica, para o estudo da língua falada em áreas do semiárido baiano. As comunidades foram escolhidas de forma que representassem o avanço da língua portuguesa na Bahia, a partir do século XVII, numa perspectiva sócio-histórica. Barra dos Negros e Bananal, representativas da zona de mineração que, atualmente, tem como uma das principais atividades econômicas o turismo, é uma comunidade que tem, como formação étnica marcante, a matriz africana. 
Chapada Diamantina: Mato Grosso – Projeto A Língua portuguesa no Semiárido Baiano: fala popular 12 Entrevistas
Este corpus oral dispõe de 12 entrevistas com falantes analfabetos ou pouco escolarizados, de ambos os sexos, divididos em três faixas etárias. A metodologia de coleta foi feita nos moldes da sociolinguística quantitativa (Labov, 1972, 1982). Os inquéritos foram gravados na fase I do projeto “A língua portuguesa falada no semiárido baiano”, entre 1997 e 1999. Nesta fase, a intenção era contribuir para o conhecimento da realidade linguística brasileira e, de forma específica, para o estudo da língua falada em áreas do semiárido baiano. As comunidades foram escolhidas de forma que representassem o avanço da língua portuguesa na Bahia, a partir do século XVII, numa perspectiva sócio-histórica. Mato Grosso, representativa da zona de mineração que, atualmente, tem como uma das principais atividades econômicas o turismo, é uma comunidade que tem, como formação étnica marcante, a matriz portuguesa. 
Nordeste/Jeremoabo: Casinhas– Projeto A Língua portuguesa no Semiárido Baiano: fala popular 12 Entrevistas
Este corpus oral dispõe de 12 entrevistas com falantes analfabetos ou pouco escolarizados, de ambos os sexos, divididos em três faixas etárias. A metodologia de coleta foi feita nos moldes da sociolinguística quantitativa (Labov, 1972, 1982). Os inquéritos foram gravados na fase II do projeto “A língua falada no semiárido baiano”, entre 1999 e 2003. Nesta fase, o projeto voltou-se para duas regiões da Bahia: a Nordeste, uma das mais antigas, e a Paraguaçu, ponto de passagem para o interior do estado. Casinhas é uma comunidade formada de descendentes de africanos, da região Nordeste. 
Nordeste/Jeremoabo: Tapera – Projeto A Língua portuguesa no Semiárido Baiano: fala popular 6 Entrevistas
Este corpus oral dispõe de 6 entrevistas com falantes analfabetos ou pouco escolarizados, de ambos os sexos, divididos em três faixas etárias. A metodologia de coleta foi feita nos moldes da sociolinguística quantitativa (Labov, 1972, 1982). Os inquéritos foram gravados na fase II do projeto “A língua falada no semiárido baiano”, entre 1999 e 2003. Nesta fase, o projeto voltou-se para duas regiões da Bahia: a Nordeste, uma das mais antigas, e a Paraguaçu, ponto de passagem para o interior do estado. Tapera é uma comunidade formada de descendentes de indígenas, da região Nordeste. 
Nordeste/Jeremoabo: Lagoa do Inácio – Projeto A Língua Portuguesa no Semiárido Baiano: fala popular 6 Entrevistas
Este corpus oral dispõe de 6 entrevistas com falantes analfabetos ou pouco escolarizados, de ambos os sexos, divididos em três faixas etárias. A metodologia de coleta foi feita nos moldes da sociolinguística quantitativa (Labov, 1972, 1982). Os inquéritos foram gravados na fase II do projeto “A língua falada no semiárido baiano”, entre 1999 e 2003. Nesta fase, o projeto voltou-se para duas regiões da Bahia: a Nordeste, uma das mais antigas, e a Paraguaçu, ponto de passagem para o interior do estado. Tapera é uma comunidade formada de descendentes de indígenas, da região Nordeste. 
Paraguaçu: Matinha – Projeto A Língua Portuguesa no Semiárido Baiano: fala popular 12 Entrevistas
Este corpus oral dispõe de 12 entrevistas com falantes analfabetos ou pouco escolarizados, de ambos os sexos, divididos em três faixas etárias. A metodologia de coleta foi feita nos moldes da sociolinguística quantitativa (Labov, 1972, 1982). Os inquéritos foram gravados na fase II do projeto “A língua falada no semiárido baiano”, entre 1999 e 2003. Nesta fase, o projeto voltou-se para duas regiões da Bahia: a Nordeste, uma das mais antigas, e a Paraguaçu, ponto de passagem para o interior do estado. Matinha é uma comunidade formada, majoritariamente, por descendentes de africanos, da Região Paraguaçu, uma zona de transição entre o recôncavo e o sertão baiano. 
Região Metropolitana: Salvador – Capital – Fala popular (PEPP) 48 Entrevistas
O corpus do Programa de Estudos sobre o Português Popular de Salvador (PEPP), constituído entre os anos de 1998 e 2000 e coordenado pela professora doutora Norma da Silva Lopes, da Universidade do Estado da Bahia (UNEB), é formado por 48 gravações de, aproximadamente, 40 minutos, transcritas segundo as normas definidas pelo Projeto Norma Linguística Urbana Culta (NURC/Salvador). Os informantes estão distribuídos em quatro faixas etárias: de 15 a 24 anos, de 25 a 35 anos, de 45 a 55 anos e de 65 anos em diante. Quanto à sua escolaridade, varia entre mínima, de 1 a 4 anos (pouca escolaridade), e máxima, de 11 anos de permanência na escola (média escolaridade). O PEPP é um programa pioneiro, tendo com ele sido iniciadas as pesquisas sobre a fala popular na Bahia. 
Região Metropolitana: Salvador – Capital – Fala culta (NURC) 0 Entrevistas
O corpus do Projeto Norma Linguística Urbana Culta (NURC) foi criado em âmbito nacional, em 1969, com o propósito de reunir um banco de dados da fala culta de várias capitais do Brasil. O de Salvador foi constituído entre 1973 e 1983 e reúne 360 inquéritos, com registro de 461 informantes; 58 inquéritos em elocuções em situação formal, 201 em diálogos entre informante e documentador e 101 em diálogos entre dois informantes. A fase de constituição do corpus de Salvador foi coordenada por Nelson Rossi, também coordenador nacional do Projeto NURC/Brasil em vários períodos. 
Projeto Estudos Linguísticos e Históricos do Sertão (ELiHS) – Irecê-Bahia 0 Entrevistas
Este corpus é constituído por 12 (doze) amostras de língua oral, com falantes analfabetos ou pouco escolarizados (até a quarta série), de ambos os sexos, divididos em três faixas etárias, de comunidades quilombolas do território de identidade de Irecê-Bahia. O objetivo é caminhar em direção à reconstrução da história do português popular brasileiro, por meio do estudo vertical de suas variantes populares, não só urbanas, mas também rurais. 
 
Corpus compactado: Para ter acesso a todo o corpus editado nas
versões texto (TXT) original e modernizado, favor clicar aqui.


Universidade Estadual de Feira de Santana
Departamento de Letras
e Artes

Núcleo de Estudos de Língua Portuguesa (NELP)

Projeto Vozes do Sertão em Dados: história, povos e formação do português brasileiro (DOHS - Documentos Históricos do Sertão)

Processo CNPq 401433/2009-9. Consepe 102/2009.

Coordenação:

Zenaide de Oliveira Novais Carneiro
(UEFS/Fapesb/CNPq)