
Projeto CE-DOHS
Corpus Eletrônico de Documentos Históricos do Sertão
FAPESB, Processo 5566/2010/Consepe: 202/2010 Coordenação:
Zenaide de Oliveira Novais Carneiro (UEFS/Fapesb/CNPq)
Mariana Fagundes de Oliveira Lacerda (UEFS/Fapesb)
|
Os documentos estão editados em XML, utilizando a ferramenta eDictor (desenvolvida por Pablo Faria, Fábio Kepler e Maria
Clara Paixão de Sousa). Essa tecnologia de edição digital foi inspirada no Corpus Histórico do Português Tycho Brahe, coordenado por Charlotte Galves.
Coleções documentais/Edições em diferentes formatos
|
Número de documentos
|
Piemonte da Diamantina: Piabas – Projeto A Língua portuguesa no Semiárido Baiano: fala popular |
12 Entrevistas |
Este corpus oral dispõe de 12 entrevistas com falantes analfabetos ou pouco escolarizados, de ambos os sexos, divididos em
três faixas etárias. A metodologia de coleta foi feita nos moldes da sociolinguística quantitativa (Labov, 1972, 1982). Os
inquéritos foram gravados na fase I do projeto “A língua portuguesa falada no semiárido baiano”, entre 1997 e 1999. Nesta
fase, a intenção era contribuir para o conhecimento da realidade linguística brasileira e, de forma específica, para o estudo
da língua falada em áreas do semiárido baiano. As comunidades foram escolhidas de forma que representassem o avanço da língua
portuguesa na Bahia, a partir do século XVII, numa perspectiva sócio-histórica. Piabas, região de transição entre o processo
histórico-econômico que se define como área de pecuária e zona de mineração, é uma comunidade que tem, como formação étnica
marcante, a matriz africana.
|
Chapada Diamantina: Barra dos Negros/Bananal – Projeto A Língua portuguesa no Semiárido Baiano: fala popular (fase 1 e 2) |
12 Entrevistas |
Este corpus oral dispõe de 12 entrevistas com falantes analfabetos ou pouco escolarizados, de ambos os sexos, divididos em
três faixas etárias. A metodologia de coleta foi feita nos moldes da sociolinguística quantitativa (Labov, 1972, 1982). Os
inquéritos foram gravados na fase I do projeto “A língua portuguesa falada no semiárido baiano”, entre 1997 e 1999. Nesta
fase, a intenção era contribuir para o conhecimento da realidade linguística brasileira e, de forma específica, para o estudo
da língua falada em áreas do semiárido baiano. As comunidades foram escolhidas de forma que representassem o avanço da língua
portuguesa na Bahia, a partir do século XVII, numa perspectiva sócio-histórica. Barra dos Negros e Bananal, representativas
da zona de mineração que, atualmente, tem como uma das principais atividades econômicas o turismo, é uma comunidade que tem,
como formação étnica marcante, a matriz africana.
|
Chapada Diamantina: Mato Grosso – Projeto A Língua portuguesa no Semiárido Baiano: fala popular |
12 Entrevistas |
Este corpus oral dispõe de 12 entrevistas com falantes analfabetos ou pouco escolarizados, de ambos os sexos, divididos em
três faixas etárias. A metodologia de coleta foi feita nos moldes da sociolinguística quantitativa (Labov, 1972, 1982). Os
inquéritos foram gravados na fase I do projeto “A língua portuguesa falada no semiárido baiano”, entre 1997 e 1999. Nesta
fase, a intenção era contribuir para o conhecimento da realidade linguística brasileira e, de forma específica, para o estudo
da língua falada em áreas do semiárido baiano. As comunidades foram escolhidas de forma que representassem o avanço da língua
portuguesa na Bahia, a partir do século XVII, numa perspectiva sócio-histórica. Mato Grosso, representativa da zona de mineração
que, atualmente, tem como uma das principais atividades econômicas o turismo, é uma comunidade que tem, como formação étnica
marcante, a matriz portuguesa.
|
Nordeste/Jeremoabo: Casinhas– Projeto A Língua portuguesa no Semiárido Baiano: fala popular |
12 Entrevistas |
Este corpus oral dispõe de 12 entrevistas com falantes analfabetos ou pouco escolarizados, de ambos os sexos, divididos em
três faixas etárias. A metodologia de coleta foi feita nos moldes da sociolinguística quantitativa (Labov, 1972, 1982). Os
inquéritos foram gravados na fase II do projeto “A língua falada no semiárido baiano”, entre 1999 e 2003. Nesta fase, o projeto
voltou-se para duas regiões da Bahia: a Nordeste, uma das mais antigas, e a Paraguaçu, ponto de passagem para o interior do
estado. Casinhas é uma comunidade formada de descendentes de africanos, da região Nordeste.
|
Nordeste/Jeremoabo: Tapera – Projeto A Língua portuguesa no Semiárido Baiano: fala popular |
6 Entrevistas |
Este corpus oral dispõe de 6 entrevistas com falantes analfabetos ou pouco escolarizados, de ambos os sexos, divididos em
três faixas etárias. A metodologia de coleta foi feita nos moldes da sociolinguística quantitativa (Labov, 1972, 1982). Os
inquéritos foram gravados na fase II do projeto “A língua falada no semiárido baiano”, entre 1999 e 2003. Nesta fase, o projeto
voltou-se para duas regiões da Bahia: a Nordeste, uma das mais antigas, e a Paraguaçu, ponto de passagem para o interior do
estado. Tapera é uma comunidade formada de descendentes de indígenas, da região Nordeste.
|
Nordeste/Jeremoabo: Lagoa do Inácio – Projeto A Língua Portuguesa no Semiárido Baiano: fala popular |
6 Entrevistas |
Este corpus oral dispõe de 6 entrevistas com falantes analfabetos ou pouco escolarizados, de ambos os sexos, divididos em
três faixas etárias. A metodologia de coleta foi feita nos moldes da sociolinguística quantitativa (Labov, 1972, 1982). Os
inquéritos foram gravados na fase II do projeto “A língua falada no semiárido baiano”, entre 1999 e 2003. Nesta fase, o projeto
voltou-se para duas regiões da Bahia: a Nordeste, uma das mais antigas, e a Paraguaçu, ponto de passagem para o interior do
estado. Tapera é uma comunidade formada de descendentes de indígenas, da região Nordeste.
|
Paraguaçu: Matinha – Projeto A Língua Portuguesa no Semiárido Baiano: fala popular |
12 Entrevistas |
Este corpus oral dispõe de 12 entrevistas com falantes analfabetos ou pouco escolarizados, de ambos os sexos, divididos em
três faixas etárias. A metodologia de coleta foi feita nos moldes da sociolinguística quantitativa (Labov, 1972, 1982). Os
inquéritos foram gravados na fase II do projeto “A língua falada no semiárido baiano”, entre 1999 e 2003. Nesta fase, o projeto
voltou-se para duas regiões da Bahia: a Nordeste, uma das mais antigas, e a Paraguaçu, ponto de passagem para o interior do
estado. Matinha é uma comunidade formada, majoritariamente, por descendentes de africanos, da Região Paraguaçu, uma zona de
transição entre o recôncavo e o sertão baiano.
|
Região Metropolitana: Salvador – Capital – Fala popular (PEPP) |
48 Entrevistas |
O corpus do Programa de Estudos sobre o Português Popular de Salvador (PEPP), constituído entre os anos de 1998 e 2000 e coordenado
pela professora doutora Norma da Silva Lopes, da Universidade do Estado da Bahia (UNEB), é formado por 48 gravações de, aproximadamente,
40 minutos, transcritas segundo as normas definidas pelo Projeto Norma Linguística Urbana Culta (NURC/Salvador). Os informantes
estão distribuídos em quatro faixas etárias: de 15 a 24 anos, de 25 a 35 anos, de 45 a 55 anos e de 65 anos em diante. Quanto
à sua escolaridade, varia entre mínima, de 1 a 4 anos (pouca escolaridade), e máxima, de 11 anos de permanência na escola
(média escolaridade). O PEPP é um programa pioneiro, tendo com ele sido iniciadas as pesquisas sobre a fala popular na Bahia.
|
Região Metropolitana: Salvador – Capital – Fala culta (NURC) |
0 Entrevistas |
O corpus do Projeto Norma Linguística Urbana Culta (NURC) foi criado em âmbito nacional, em 1969, com o propósito de reunir
um banco de dados da fala culta de várias capitais do Brasil. O de Salvador foi constituído entre 1973 e 1983 e reúne 360
inquéritos, com registro de 461 informantes; 58 inquéritos em elocuções em situação formal, 201 em diálogos entre informante
e documentador e 101 em diálogos entre dois informantes. A fase de constituição do corpus de Salvador foi coordenada por Nelson
Rossi, também coordenador nacional do Projeto NURC/Brasil em vários períodos.
|
Projeto Estudos Linguísticos e Históricos do Sertão (ELiHS) – Irecê-Bahia |
0 Entrevistas |
Este corpus é constituído por 12 (doze) amostras de língua oral, com falantes analfabetos ou pouco escolarizados
(até a quarta série), de ambos os sexos, divididos em três faixas etárias, de comunidades quilombolas do território de identidade
de Irecê-Bahia. O objetivo é caminhar em direção à reconstrução da história do português popular brasileiro, por meio do estudo
vertical de suas variantes populares, não só urbanas, mas também rurais.
|
|
Corpus compactado: Para ter acesso a todo o corpus editado nas
versões texto (TXT) original e modernizado, favor clicar aqui.
|
|
|

Universidade Estadual de Feira de Santana
Departamento de Letras e Artes
Núcleo de Estudos de
Língua Portuguesa (NELP)
Projeto Vozes do Sertão em Dados: história, povos e formação do português brasileiro
(DOHS - Documentos Históricos do Sertão)
Processo CNPq 401433/2009-9. Consepe 102/2009.
Coordenação:
Zenaide de Oliveira Novais Carneiro
(UEFS/Fapesb/CNPq)
|