Имя: Пароль:
| Русский (ru)

Корпусные методы в лингвистических исследованиях


Завтра (17/10/2012) обсуждаем:

1) подходы к структуре и объему "общего" корпуса;

2) что значит "репрезентативный" корпус, хорошо ли это для "корпуса общего назначения", например, для "Национального"

3) какие стили а жанры должны быть отражены в корпусе (например, стоит ли в общий корпус включать тексты рекламы)

4) может быть, мониторный лучше (корпус в миллиарды словоупотреблений), куда попадают все тексты

5) что "экзотического", на ваш взгляд, вошло в НКРЯ с точки зрения жанров, тематик и т.п.

6) хорошо ли, когда "экзотических жанров и стилей" какого-то типа совсем мало, а остального много (попробуйте сравнить частоту словоупотребления какой-нибудь не самой частотной лексемы в части "Художественная литература" и в части "реклама"в НКРЯ)

7) структура и состав Брауновского корпуса. Чем она обусловлена?

8) корпус в 1 миллион словоупотреблений - это много или мало?

9) в чем плюсы брауновского корпуса

10) корпуса Mark Davies - состав, структура COCA

11) Международный корпус английского языка - аналогично (ICE)

12) BNC - состав, структура

Статьи для чтения выложены или смотрите ссылки

Для докладчиков группы 1.: надо смотреть статью Biber: Biber930

Для докладчиков группы 2.: состав ICE

Еще смотрим:состав BNC - разделение на подкорпуса, структура подкорпусов, процедуры отбора ...

Состав Brown Corpus

Состав корпуса COCA

Состав и структура НКРЯ (процентное соотношение тоже)

 

Документы:

tgaw02.pdf
biber93.pdf
nti03draft.pdf
url.htm
wynne.pdf
biber930.pdf
Pertsov2.pdf
plungyan-08.htm
shmelev.doc