A face quantitativa da linguagem: um dicionário de freqüências do português
O Dicionário de Freqüências do léxico do português brasileirocontemporâneo baseou-se num corpus de língua escrita, variedade brasileirade 5 milhões de palavras (1950 a 1990). Alguns resultados quantitativos:apenas 42.212 unidades léxicas diferentes totalizaram os 5 milhões de ocorrênciasdo corpus, e...
Autor principal: | |
---|---|
Formato: | Artículo publishedVersion |
Lenguaje: | Portugués |
Publicado: |
ALFA: Revista de Linguística
2001
|
Materias: | |
Acceso en línea: | https://periodicos.fclar.unesp.br/alfa/article/view/4049 http://biblioteca.clacso.edu.ar/gsdl/cgi-bin/library.cgi?a=d&c=br/br-048&d=article4049oai |
Aporte de: |
id |
I16-R122-article4049oai |
---|---|
record_format |
dspace |
institution |
Consejo Latinoamericano de Ciencias Sociales |
institution_str |
I-16 |
repository_str |
R-122 |
collection |
Red de Bibliotecas Virtuales de Ciencias Sociales (CLACSO) |
language |
Portugués |
topic |
Lexicoestatística; dicionário de freqüências; hapax legomena; index verborum; vocabulário multiuso; |
spellingShingle |
Lexicoestatística; dicionário de freqüências; hapax legomena; index verborum; vocabulário multiuso; Biderman, Maria Tereza Camargo A face quantitativa da linguagem: um dicionário de freqüências do português |
topic_facet |
Lexicoestatística; dicionário de freqüências; hapax legomena; index verborum; vocabulário multiuso; |
description |
O Dicionário de Freqüências do léxico do português brasileirocontemporâneo baseou-se num corpus de língua escrita, variedade brasileirade 5 milhões de palavras (1950 a 1990). Alguns resultados quantitativos:apenas 42.212 unidades léxicas diferentes totalizaram os 5 milhões de ocorrênciasdo corpus, excluídos topónimos e antropônimos. Os dados estatísticosdo dicionário registram altíssima freqüência das palavras instrumentais(artigos, preposições, pronomes, conjunções etc.) bem como de verbos auxiliarese modalizadores. O mesmo ocorre com palavras de significação muito geral, arquilexemas, altamente polissêmicos. Na vertente oposta estão as palavras de baixa freqüência sobretudo os hapax legomena, que contribuemmaciçamente para o total de 42.212 lexias registradas neste corpus. De fato,as palavras de baixa freqüência totalizam grande parte desse index verborum;caso contrário, o repertório vocabular seria muito menor. A categoria substantivo contribui com a maioria de vocábulos que ocorreram apenas uma vez no corpus, assim como os tecnicismos da linguagem científica. O vocabulário jornalístico é o mais neutro e o menos temático, constituindo uma espéciede média entre os outros gêneros de linguagem. |
format |
Artículo publishedVersion Artículo publishedVersion |
author |
Biderman, Maria Tereza Camargo |
author_facet |
Biderman, Maria Tereza Camargo |
author_sort |
Biderman, Maria Tereza Camargo |
title |
A face quantitativa da linguagem: um dicionário de freqüências do português |
title_short |
A face quantitativa da linguagem: um dicionário de freqüências do português |
title_full |
A face quantitativa da linguagem: um dicionário de freqüências do português |
title_fullStr |
A face quantitativa da linguagem: um dicionário de freqüências do português |
title_full_unstemmed |
A face quantitativa da linguagem: um dicionário de freqüências do português |
title_sort |
face quantitativa da linguagem: um dicionário de freqüências do português |
publisher |
ALFA: Revista de Linguística |
publishDate |
2001 |
url |
https://periodicos.fclar.unesp.br/alfa/article/view/4049 http://biblioteca.clacso.edu.ar/gsdl/cgi-bin/library.cgi?a=d&c=br/br-048&d=article4049oai |
work_keys_str_mv |
AT bidermanmariaterezacamargo afacequantitativadalinguagemumdicionariodefrequenciasdoportugues AT bidermanmariaterezacamargo facequantitativadalinguagemumdicionariodefrequenciasdoportugues |
bdutipo_str |
Repositorios |
_version_ |
1764820435837386757 |