O Banco de dados Iboruna constitui-se de dois tipos de amostras coletados na comunidade:
(i) Amostra Censo ou Amostra Comunidade, composta por 151 entrevistas sociolinguísticas;
(ii) e Amostra de Interação, composta por 11 interações dialógicas. Para acessá-las, siga abaixo.

Acesse aqui as amostras e, mais abaixo, informações sobre cada uma delas. 

Amostra Censo Amostra de Interação

A AMOSTRA

A Amostra Censo ou Amostra comunidade compõe-se de 151 entrevistas sociolinguísticas representativas do censo linguístico realizado em sete cidades da região noroeste do estado de São Paulo, com o controle de quatro variáveis censitárias.

De 152 perfis sociais resultantes do cruzamento das variáveis sociais, apenas um (identificado como AC-060) não foi localizado na fase de coleta das entrevistas, dadas as restrições da própria estratificação social da  comunidade. Essas mesmas restrições justificam também o fato de não ter sido possível localizar, na comunidade, alguns perfis sociais exatos, tendo sido necessário, nesses poucos casos, estender os limites de algumas variantes sociais, para pouco mais ou para pouco menos, de modo a compor a amostra na sua totalidade. Na busca dos perfils sociais disponível neste site, alertas são feitos quando o perfil social do informante diverge do exigido pela metodologia da coleta.  

Variáveis censitárias

a) Sexo/gênero (masculino e feminino).

b) faixa etária, contemplando cinco faixas: 7 a 15 anos; 16 a 25 anos; 26 a 35 anos; 36 a 55 anos; superior a 55 anos. A primeira faixa etária representa a fase em que padrões linguísticos estão ainda em fixação e, da segundo em diante, a pressão social sobre a linguagem do indivíduo.

c) escolaridade, segmentada em quatro níveis, de acordo com os anos de escolarização:  até 4 anos (ou até o 1º. ciclo do ensino fundamental); de 5 a 8 anos ( ou até o 2º. Ciclo do ensino fundamental); de 9 a 11 anos (ou até o Ensino médio); mais de 11 anos (ou ensino superior completo ou não). A segmentação dos níveis de escolaridade, embora pedagogicamente extinta nos dois primeiros ciclos do ensino fundamental, preserva diferenças em termos de currículo e metodologia de ensino e representa a divisão escolar em vigor no tempo em que a maioria dos informantes se enquadrava

d) renda familiar, estratificada em quatro faixas: até 5 salários-mínimos; de 6 a 10 salários-mínimos; de 11 a 24 salários-mínimos; de mais de 25 salários-mínimos. Dada a complexidade de operacionalizar indicadores sociais para a definição de classe social, adotou-se, de forma simplificada, a variável renda familiar, usando-se o indicador salário-mínimo. Na composição da amostra, nem sempre foi possível atender ao preenchimento das células sociais dessa variável no cruzamento com as das demais e, quando esse requisito dificultava a localização do perfil social na comunidade, essa variável foi então desprezada em favor do atendimento das demais. No banco de dados, quando esse é o caso, um alerta é feito no momento de baixar os arquivos correspondentes aos perfis sociais.  Assim, recomenda-se que essa variável seja utilizada com cautela. 

e) origem geográfica do informante. Para a composição da Amostra Censo, consideraram-se sete cidades circunvizinhas da região noroeste do estado de São Paulo, nucleadas pela cidade de São José do Rio Preto. Sete cidades estão representadas no censo linguístico: Bady Bassit; Cedral; Guapiaçu; Ipiguá; Mirassol; Onda Verde e São José do Rio Preto.

A origem geográfica dos informantes não constituiu variável estratificada para a coleta das entrevistas sociolinguísticas. Seguiu-se o Método da distribuição aleatória de amostragem para definir a localização geográfica dos 151 informantes na região, garantindo-se, assim, a mesma probabilidade de qualquer perfil social pertencer a qualquer uma das sete cidades. Os total de informantes foram distribuídos proporcionalmente à densidade populacional das setes cidades abrangidas pelo Projeto. A distribuição dos perfis sociais por cidades da região é a mostrada no quadro abaixo.

Quadro - Distribuição dos perfis sociais da Amostra Censo por cidades da Região

 

A COLETA DA AMOSTRA

As entrevistas sociolinguísticas da Amostra Censo foram direcionadas por um roteiro de perguntas visando à obtenção de cinco tipos de textos orais:

       - Narrativas de experiência pessoal;
       - Narrativa recontada (sem a participação direta do informante);
       - Relato de opinião;
       - Relato de procedimento;
       - Descrição (de espaço, de objeto etc.).

A localização do informante na comunidade coube aos documentadores selecionados para a execução do projeto. Todos os entrevistados foram previamente esclarecidos dos objetivos do projeto e assinaram termo de participação livre e consentida para a cessão das amostras de suas falas ao Projeto ALIP.

 

A DOCUMENTAÇÃO DA AMOSTRA

A preparação definitiva da amostra para o banco de dados envolveu as seguintes etapas: (i) a validação das entrevistas, mediante análise do seu conteúdo, da qualidade do áudio e do relatório de coleta (diário de campo e ficha social dos informantes);  (ii) a transcrição das gravações; (iii) a validação das transcrições. 

A documentação completa de uma entrevista compreende:

- 151 arquivos de áudio (em formato mp3);
- 151 arquivo de transcrição da entrevista (em formato .doc e .pdf);
- 151 arquivo de ficha social do informante (em formato .doc e .pdf);
- 151 arquivo de validação da gravação (em formato .doc e .pdf).
- 151 arquivo de diário de campo (em formato .doc e .pdf);

Cada arquivo é identificado pelo tipo de amostra (AC), seguido do número do perfil social (001, 002 etc.) e do tipo de arquivo (áudio, transcrição, ficha social, ficha de valiração e diário de campo).

Exemplo da documentação completa da primeira entrevista:
AC-001-AUD.mp3; 
AC-001-TRANS.doc (ou .pdf); 
AC-001-FS.doc (ou .pdf);
AC-001-VAL.doc (ou .pdf); 
AC-001-DC.doc (ou pdf). 

O Projeto permite acesso livre de uma subamostra composta da documentação completa de 10 entrevistas sociolinguísticas. Para acesso à documentação linguística completa das 151 entrevistas, o interessado deve preencher um cadastro (clique aqui para acessar o cadastro), que será avaliado pela equipe do projeto.

Pesquise aqui a Amostra Censo.

A AMOSTRA

A Amostra de interação compõe-se de 11 interações dialógicas, gravadas secretamente em contextos de interação livre, sem controle de qualquer variável social. A expectativa é a de que esse tipo de amostra represente mais fielmente o vernáculo, uma vez que representa a fala coloquial e distensa do dia a dia dos falantes da comunidade.

 

A COLETA DA AMOSTRA

Para a coleta das gravações da amostra, a recomendação aos documentadores do Projeto era apenas a de observar atentamente a adequação do contexto de interação entre os participantes (local silencioso, participantes cooperativos na interação, tema de conversa não comprometedor etc.), de modo a garantir a boa qualidade da gravação.  Após a gravação, os informantes foram cientificados da coleta e consentiram, por meio de assinatura de termo de participação livre e consentida, o uso da amostra pelo Projeto ALIP. O número de participantes por gravação variou de 2 a 5, totalizando, ao final, o registro da fala espontânea de 28 informantes de perfis sociais variados, embora alguns perfis sejam mais recorrentes do que outros no total das amostras. Como a gravação não previa o controle de perfis sociais, há na amostra participantes oriundos de outras cidades que não somente aquelas definidas para a realização do censo linguístico na região de São José do Rio Preto. Os temas presentes nas interações também são variados, em razão de esta ser uma decisão dos próprios participantes.  O quadro abaixo oferece um panorama geral dos participantes da amostra.

Quadro - Informações sobre as interações dialógicas da Amostra de Interação

CONTEXTO DE INTERAÇÃO – INFORMANTES ENVOLVIDOS

AI-001

Diálogo entre 2 homens e 3 mulheres de diferentes idades e escolaridades em ambiente familiar.

AI-002

Diálogo entre 2 amigas vizinhas de perfil social semelhante, no portão da casa de uma delas.

AI-003

Diálogo entre tia e sobrinha, de diferentes idades e escolaridades, em ambiente familiar.

AI-004

Diálogo entre 2 irmãs, de mesma faixa de idade e diferentes escolaridades, em ambiente familiar.

AI-005

Diálogo entre 2 estudantes de mesmo perfil social, em ambiente universitário.

AI-006

Conversa entre 4 mulheres de perfis sociais diferentes, em ambiente familiar.

AI-007

Diálogo entre marido e esposa de mesma faixa etária e de níveis de escolaridade diferentes, em ambiente familiar.

AI-008

Conversa entre 3 estudantes do sexo masculino de mesmos perfis sociais, em ambiente universitário.

AI-009

Diálogo entre advogado e cliente, de perfis sociais diferentes, em escritório de advocacia.

AI-010

Discussão de peça jurídica entre 2 advogados de mesmo perfil social, em escritório de advocacia.

AI-011

Diálogo entre casal de namorados universitários de mesma faixa etária, em ambiente familiar.

Total de informantes: 28 informantes

 

A DOCUMENTAÇÃO DA AMOSTRA

 A preparação definitiva da amostra para o banco de dados envolveu as seguintes etapas: (i) a validação das gravações, mediante análise do seu conteúdo, da qualidade do áudio e do relatório de coleta (diário de campo e ficha social dos informantes);  (ii) a transcrição das gravações; (iii) a validação das transcrições. 

 A documentação completa de uma amostra de interação compreende:

       - 11 arquivos de áudio (em formato mp3)
       - 11 arquivos com ficha social dos participantes de cada gravação (em formato .doc e .pdf)
       - 11 arquivos de diário de campo (em formato .doc e .pdf)
       - 11 arquivos de validação da gravação (em formato .doc e .pdf)
       - 11 arquivos de transcrição da entrevista (em formato .doc e .pdf).

Cada arquivo é identificado pelo tipo de amostra (AI), seguido do número da gravação (001, 002 etc.) e do tipo de arquivo (áudio, transcrição, ficha social etc.).

Exemplo da documentação completa da primeira gravação de AI, da qual participam 5 informantes:
AI-001-AUD.mp3;
AI-001-TRANS.doc (ou .pdf);
AI-001-FS.doc (ou .pdf);
AI-001-VAL.doc (ou .pdf);
AI-001-DC.doc (ou .pdf). 

Para facilitar a busca no bando de dados, repete-se, para participantes diferentes em uma mesma sessão de gravação, os mesmos arquivos.

O Projeto permite acesso livre de uma subamostra composta da documentação completa de três interações dialógicas.  Para acesso à documentação linguística completa das 11 interações dialógicas, o interessado deve preencher um cadastro (clique aqui para acessar o cadastro), que será avaliado e autorizado pela equipe do projeto.

Pesquise aqui a Amostra de interação.

Entre em contato

Envie uma mensagem
para o Projeto ALIP

Para entrar em contato, basta preencher o formulário.

Apoio

Sede