Ugrás a tartalomhoz

Korpusz

Ellenőrzött
A Wikipédiából, a szabad enciklopédiából

A korpusz nyelvészeti szakkifejezés, jelentése egy adott nyelv adott időpontban használt változatára vonatkozó szövegek összessége.

A szó a latin corpus (test) szóból ered, és a "nyelvi test", nyelvi összesség értelemben használt.

A nyelvi korpusz felhasználásaira lehet példa szótárak létrehozása, nyelv jellegzetességeinek elemzése.

Létrehozásakor fontos szempont, hogy lehetőség szerint ne keveredjen benne az adott nyelv eltérő időszakokban használt (új, és régies) formája.

Az informatika terjedésével egyre könnyebb igen nagy mennyiségű, természetes szöveget tartalmazó korpuszok létrehozása, ilyen célra használhatóak például a digitalizált lexikonok, a Wikipédia, de például az internetes weblapok egy adott köre is (pl. sajtó).

Lásd még a Wikipédiában

[szerkesztés]

Források

[szerkesztés]

Kiegészítő irodalom

[szerkesztés]

További kiegészítések

[szerkesztés]