پیکره متنی (corpus)

۱۵ آذر ۱۴۰۰ طراحی وب سایت

پیکره متنی (corpus)

مجموعه ای از اسناد متنی می باشد که با دسته ها بر چسب گذاری شده است. مجموعه ای بزرگ و بدون ساختار از متون می باشد (که امروزه معمولا به صورت الکترونیکی ذخیره و پردازش می شوند) که برای انجام تجزیه و تحلیل آماری و آزمایش فرضیه، بررسی وقایع با اعتبارسنجی قوانین زبانی در یک قلمرو زبانی خاص مورد استفاده قرار می­گیرد.