ПИЛОТНЫЙ ПОДКОРПУС

На втором этапе реализации проекта (2015) для отработки методики исследования и проведения пилотного анализа был сформирован пилотный подкорпус (объемом в 16000 токенов, 10259 словоупотреблений, 41850 аллофонов, 12 коммуникативных эпизодов, 1 час 46 мин. звучания). На материале этого подкорпуса было выполнено лингвистическое аннотирование и анализ речевого материала, полученного от разных социальных групп. Материал был подобран таким образом, чтобы представлять образцы речи всех анализируемых групп говорящих. Отобраны преимущественно фрагменты бытовых (непрофессиональных) бесед информантов с родными, друзьями, коллегами или знакомыми.

Подкорпус содержит образцы речи сбалансированной выборки информантов: в равном количестве представлены 2 гендерные группы (6 мужчин и 6 женщин), 3 возрастные группы (по 4 представителя от "молодежи", среднего и старшего возраста), а также по одному представителю от анализируемых 10 "профессиональных" групп и хотя бы по одному представителю от каждой из 4-х анализируемых групп по соц. статусу: (а) руководящие работники разного уровня, бизнесмены и частные предприниматели, б) служащие, специалисты, наемные работники, в) студенты и учащиеся, г) неработающие):

    1) S15, 20 лет, военнослужащий (курсант), М
    2) S103, 26 лет, частный предприниматель, мастер по утеплению окон, М
    3) S110, 31 год, инженер, М
    4) S117, 62 года, IT-специалист, М
    5) S123, 54 года, преподаватель, М
    6) S124, 47 лет, сантехник, М
    7) S01, 33 года, искусствовед, Ж
    8) S19, 41 год, маркетолог, Ж
    9) S27, 20 лет, студентка юридического факультета, Ж
    10) S72, 24 года, руководитель в гос. учреждении, Ж
    11) S114, 70 лет, пианистка, Ж
    12) S130, 74 года, физик, в наст. время – неработающий пенсионер, Ж

В результате обработки пилотного речевого материала получены развернутые статистические данные для отдельных социолектов на фонетическом, лексическом, морфологическом и синтаксическом уровнях. Подсчет проводился как в целом для подкорпуса, так и для отдельных социальных групп.

На фонетическом уровне:
Получены статистические данные о распределении в речи гласных и согласных фонем и аллофонов. В речи всех социальных групп наиболее частотными являются фонемы /a/ (18%), /i/ (9%), /t/ (6%), /o/ (5%), /u/ (4%). Как минимум, до 10-го ранга существенного различия между группами не наблюдается. В ранговом распределении аллофонов на первом месте ожидаемо находится ударный [a0] (7%), на втором – [t] (6%), далее идут 2 безударных аллофона фонемы /а/ – [a1] (5,3%) и [a4] (4,9%), ударный [o0] занимает пятую позицию (4,9%). На пилотном материале существенного различия между анализируемыми группами по этому параметру выявить не удалось.

Выявлены все редуцированные формы и проведен их слуховой анализ. Общее количество редуцированных форм составило 350 единиц (3,4% от всего подкорпуса), представляющих 111 разных вариантов. Наиболее частотными редуцированными формами являются "щас" ("сейчас"; 10,6% от всех ред. форм), "чё" ("что"; 10,3%), "буит" ("будет"; 4,3%), "чё- то" ("что-то"; 4,0%), "ничё" ("ничего"), "гарю" ("говорю") и "тя" ("тебя") (по 3,1%) и др. Мужские "приоритеты" оказались таковы: "чё" (14,5%), "щас" (7,2%), "буит" (6,5%), "ничё" (4,3%) и "тя" (3,6%). Женские "приоритеты": "щас" (12,9%), "чё" (7,1%), "чё то" (5,7%), "гарю" (4,3%), "тось" (3,3%), "буит" (2,9%), "гыт" (говорит; 2,9%).

Только младшее поколение активно употребляет форму "ваще", в то время как "вежливые" этикетные "пажалста" и "пасиб(а)" обнаружились по преимуществу в речи информантов второй (средней) возрастной группы.

На лексическом уровне:
Построены частотные списки (словари) для всего объема выборки и для отдельных социальных групп на уровне слов и лексем. В целом по выборке ранговое распределение верхней зоны частотного словаря таково: Я (3,1%), НУ (2,9%), НЕ (2,6%), ДА (2,4%), И (2,2%), ВОТ (2.1%), ЭТО (1,95%), В (1,9%), ЧТО (1,83%), А (1,58%). С небольшими вариациями этот набор повторяется в частотных списках мужчин и женщин, а также всех трех возрастных групп.

Распределение неологизмов коррелирует прежде с возрастом говорящего: их количество максимально в речи молодежи (0,42), несколько меньше в речи информантов среднего возраста (0,32) и крайне низко в речи информантов старшего возраста (0,02). Младшие информанты употребляют стилистически сниженную лексику как минимум в 2 раза чаще других возрастных групп (0,59).

Элементы молодежного жаргона полностью оправдывают исследовательские ожидания. Такие элементы чаще всего встречаются в речи младшей возрастной группы (но имеют только 5-й ранг, 0,31).

Наибольшей показательностью обладает помета BRAN (бранное), встречающаяся чаще всего в речи информантов молодежной группы.

Употребление диминутивов показательно при распределении информантов по категориям согласно полу, возрасту и социально-профессиональной принадлежности.

Профессиональная лексика может стать достаточно надежным критерием распределения информантов по социально-профессиональным группам.

Исследование прагматем (элементов звуковой цепи, которые не удается безоговорочно отнести к классу лексических или лексико-грамматических единиц, однако наделенных определенным прагматическим значением) выявило на исследовательском подкорпусе 17 таких единиц. Единичными оказались употребления аппроксиматоров "и так далее" и "то-сё", весьма нечастотными, против ожидания, – маркеры неуверенности "типа" (6,3%) и "вроде" (3,4%), при этом они распределяются практически поровну между мужчинами и женщинами. Лидируют в общем списке метакоммуникативные маркеры (контактные глаголы) "знаешь/знаете", "понимаешь", "видишь", "слушай" и под. – на их долю приходится 19,4 % всех употреблений прагматем. Несколько реже употреблялись "короче" (15,5%) и "в общем" (10,7%). Женщины в целом в два раза чаще употребляют подобные единицы, чем мужчины (67,5 и 32,5% соответственно). Особенно хорошо эта разница видна на метакоммуникативных маркерах, с помощью которых говорящий привлекает или удерживает внимание собеседника: 80% соответствующих единиц обнаружено в речи женщин. Излюбленная мужская прагматема – "короче": 56,3% таких употреблений выявлено в речи мужчин. Более того, можно предположить, что "короче" – это примета современной молодежной речи, независимо от гендерной принадлежности говорящего.

На морфологическом уровне:
Наблюдения над словоизменительными характеристиками словоформ по подкорпусу не дали значимой информации по встречаемости в привязке к различным социально-профессиональным группам.

Аграмматичных форм в составе рабочего подкорпуса нет. Встречаемость в речи информантов "редких" грамматических форм (второго родительского падежа и второго предложного падежа) ниже, чем ожидалось. Что касается "сложных" форм, то причастий во всей выборке оказалось всего 26 (0,25%), а деепричастий не встретилось вовсе. Можно предположить, что наличие в речи информанта полных причастий является ярким свидетельством высокого уровня его языковой компетенции, при этом их встречаемость напрямую связана с возрастом и социальным статусом информантов.

"Прагматически маркированная" звательная форма представлена в составе подкорпуса всего 20-ю употреблениями, причем употребляют ее преимущественно женщины, обращаясь к женщинам.

На синтаксическом уровне:
На материале исследовательского подкорпуса было выявлено и атрибутировано 2039 синтаксических структур. Наиболее частотными в речи всех социальных групп являются простые предложения структуры SV (существительное-подлежащее + глагол-сказуемое, 2,75%), и одноэлементные структуры: V (глагол-сказуемое, 1,8%), S (существительное-подлежащее, 1,6%), Q? (вопросительное слово, 0,8%). Существенного различия между сравниваемыми социальными группами не обнаружено.

Наиболее частотны следующие структуры: S (подлежащее), xS (предложная группа), AS (атрибутивное сочетание с препозицией атрибута), xAS (предложная группа с препозицией атрибута).

В составе рабочего подкорпуса выявлено 16 непроективных конструкций. Распределение их в речи информантов с разными социальными характеристиками в силу небольшого количества непоказательно. Заметим, однако, что наибольшее количество непроективных конструкций характеризуют речь информантов младшего возраста с низким уровнем образования.

Анализ глагольных групп показал, что левое ветвление в устной повседневной речи существенно превышает правое ветвление, в отличие от письменной речи, где доминируют симметричные структуры. Это синтаксическое свойство устной речи характеризует все социальные группы.

Предлоги и союзы по подкорпусу в целом имеют соответственно шестой и седьмой ранг; такая же картина сохраняется в речи женщин, в то время как мужчины в среднем реже употребляют союзные средства. Различий между возрастными группами не наблюдается.

Анализ специфических особенностей устной речи – обрыва фразы (CUT), эллипсиса (EL), парцелляции (PARC) и самокоррекции (COR) – показал, что чаще всего встречаются обрывы (6,9%), далее – эллипсис (4,2%), парцелляция (1,8%) и самокоррекция (1,2%).