Jump to content

ഭാഷാ കോർപ്പസ്

വിക്കിപീഡിയ, ഒരു സ്വതന്ത്ര വിജ്ഞാനകോശം.
അച്ചടി പതിപ്പ് നിലവിൽ പിന്തുണയ്ക്കുന്നില്ല, അതിൽ റെൻഡറിങ് പിഴവുകൾ ഉണ്ടാവാനിടയുണ്ട്. ദയവായി താങ്കളുടെ ബ്രൗസർ ബുക്ക്മാർക്കുകൾ പുതുക്കുക, ബ്രൗസറിൽ സ്വതേയുള്ള അച്ചടി സൗകര്യം ഉപയോഗിക്കുക.


ഒരു ഭാഷയിലെ മുഴ്വൻ പദങ്ങളുടെയും യന്ത്രശേഖരമാണ് ഭാഷാകോ‍ർപ്പസ് എന്നു പറയുന്നത്.കമ്പ്യൂട്ടറധിഷ്ഠിത ഭാഷോപകരണങ്ങളുടെ നിർമ്മാണം, കമ്പ്യൂട്ടറധിഷ്ഠിത ഭാഷാപഗ്രഥനം തുടങ്ങിയ നിരവധി മേഖലകളിൽ കോ‍ർപ്പസുകൾ പ്രയോജനകരമാണ്. പദങ്ങൾ ലേഖന(Text), ശബ്ദ (Sound), ആഗ്യ (Sing) രൂപത്തിൽ ശേഖരിക്കാം. കോർപ്പസുകളുടെ പ്രയോഗങ്ങളെ അടിസ്ഥാനമാക്കിയാണ് ശേഖരണരീതി തൂരുമാനിക്കുന്നത്. ഇത്തരത്തിൽ ശേഖരിക്കുന്ന ഭാഷാംശങ്ങളിലെ ഓരോ പദങ്ങൾക്കും അവയുടെ വ്യാകരണ-അർഥ-പ്രകരണ വിവരങ്ങൾ നൽകാവുന്നതാണ്. ഈ പ്രക്രിയയെ ടീക്ക (Annotation) എന്നു പറയുന്നു. കോർപ്പസുകളുടെ ഉപയോഗത്തിനനുസരിച്ച് ടീക്ക നൽകാതെയും നൽകിയും കോർപ്പസുകൾ ശേഖരിക്കാവുന്നതാണ്.

"https://ml.wikipedia.org/w/index.php?title=ഭാഷാ_കോർപ്പസ്&oldid=3468739" എന്ന താളിൽനിന്ന് ശേഖരിച്ചത്