corpus

Do latim 'corpus', significando 'corpo'.

Origem

Latim

Do latim 'corpus', que significa 'corpo'. A palavra latina possui uma vasta gama de significados relacionados à materialidade, mas também a conjuntos e totalidades.

Mudanças de sentido

Entrada no Português

Inicialmente, o termo 'corpus' no português manteve o sentido literal de 'corpo'. Com o tempo, especialmente em contextos acadêmicos, passou a designar um conjunto de textos ou dados.

Século XX

Consolidação como termo técnico em linguística.

A partir do século XX, 'corpus' se estabelece como um conjunto de textos (escritos ou falados) coletados e organizados de forma sistemática para serem usados como base para a análise linguística. Este uso se tornou fundamental com o advento da linguística computacional.

Atualidade

Ampliação para outros campos de dados.

Hoje, 'corpus' é usado em diversas áreas que lidam com grandes volumes de dados, como bioinformática (corpus genômico), direito (corpus legal) e ciência de dados em geral, sempre referindo-se a um conjunto estruturado de informações para estudo e processamento.

Primeiro registro

Século XVI

O termo 'corpus' em seu sentido literal de 'corpo' já aparece em textos portugueses desde o século XVI. O uso técnico em linguística se consolida mais tarde, a partir do século XIX.

Momentos culturais

Século XX

A fundação de grandes corpora linguísticos, como o Brown Corpus (inglês) e o Corpus do Português, marca um ponto crucial no desenvolvimento da linguística moderna e da análise computacional da linguagem.

Comparações culturais

Inglês: 'Corpus' é amplamente utilizado com o mesmo sentido técnico em linguística e em outras áreas que lidam com dados. Espanhol: 'Corpus' também é usado com o mesmo significado técnico, especialmente em linguística e direito. Francês: 'Corpus' é empregado de forma similar, mantendo o sentido de conjunto de textos ou dados.

Relevância atual

O termo 'corpus' é fundamental na linguística computacional, processamento de linguagem natural (PLN) e inteligência artificial. A criação e análise de corpora são essenciais para o desenvolvimento de modelos de linguagem, tradutores automáticos e assistentes virtuais. Sua relevância se estende a áreas como direito, medicina e ciência de dados, onde 'corpus' se refere a coleções de documentos, dados ou informações para análise e pesquisa.

Origem Latina e Entrada no Português

Século XVI - Derivado do latim 'corpus', significando 'corpo'. A palavra entra no português com seu sentido literal e, posteriormente, em acepções mais abstratas.

Uso Acadêmico e Científico

Séculos XIX e XX - Consolidação do termo 'corpus' no meio acadêmico e científico, especialmente em linguística, para designar um conjunto organizado de textos ou dados para análise.

Era Digital e Linguística de Corpus

Final do Século XX e Início do Século XXI - A expansão da computação e da internet impulsiona a Linguística de Corpus, tornando o termo 'corpus' central em estudos computacionais da linguagem.

Atualidade e Diversificação de Uso

Atualidade - O termo 'corpus' é amplamente utilizado em diversas áreas, mantendo seu sentido técnico em linguística e expandindo-se para outras disciplinas que lidam com grandes volumes de dados.

corpus

Do latim 'corpus', significando 'corpo'.

PalavrasConectando idiomas e culturas