Что такое «национальный корпус русского языка» и чем он полезен?
Содержание:
- Численность
- Таксономия (тематический класс):
- Идеология корпуса
- Руководство отдельными проектами; разработка принципов разметки текстов
- Андрей Билецкий
- Последующие события
- Так закрывают или нет?
- Состав корпуса
- НКРЯ в студенческих исследованиях
- Международное сотрудничество
- II. Распределение текстов основного корпуса по видам и другим метапризнакам
- Информация о нестандартности и особенностях записи
- Состав корпуса
Численность
Первоначальное ядро чинов Корпуса составили проживавшие в Югославии. На 12 сентября 1944 года[источник не указан 2783 дня] из 11 197 человек личного состава 3198 было из Сербии, 272 — Хорватии; из Румынии прибыло 5067, Болгарии — 1961, Венгрии — 288, Греции — 58, Польши — 19, Латвии — 8, Германии — 7, Италии — 3, Франции — 2; бывших советских военнопленных — 314. За всё время из состава корпуса выбыло 11 506 человек: убито и умерло — 1132, пропало без вести — 2297, ранено — 3280, эвакуировано по болезни и уволено — 3740, убыло самовольно — 1057. Общее число прошедших через Корпус определяется в 17 090 чел. К концу войны общие потери Корпуса составили 11 506 человек.
Таксономия (тематический класс):
t:moveбеготня, вынос, качкаt:move:bodyпоклонt:putразмещение, расстановка, погрузка, намоткаt:impactудар, втирание, обмолотt:impact:creatлепка, отливка, плетение, сооружение, строительствоt:impact:destrслом, сожжениеt:changestукрепление, затвердение, осушение, конденсация, осложнениеt:bet:be:existжизнь, наличие, бытиеt:be:appearвозникновение, рождение, формирование, учреждение, творениеt:be:disappсмерть, казнь, ликвидацияt:locместоположениеt:loc:bodyлежаниеt:contactприкосновение, объятиеt:possобладание, приобретение, покупка, потеря, лишениеt:mentзнание, абстракция, воображение, воспоминание, догадкаt:percосязание, слух, видимость, взгляд, зрелищеt:psychапатия, безумие, вдохновение, спокойствиеt:psych:emotвосторг, раскаяние, печальt:psych:volitнамерение, решениеt:speechдискуссия, молва, ахинея, реплика, подковыркаt:physiolжажда, кровоизлияние, судорога, утомление, икотаt:weatherзарница, вьюга, знойt:soundшум, перезвон, хлопок, аплодисменты, диссонансt:colorокраска, колорит, желтизна, прозеленьt:lightлуч, полумрак, светлынь, иллюминацияt:tasteвкуснота, горчинка, кислятинаt:smellаромат, перегарt:temperпрохлада, стужа, нагревt:timeвесна, годовщина, минута, современностьt:time:periodмежсезонье, путина, сенокос, стажt:time:momentмиг, мгновениеt:time:weekпонедельникt:time:monthянварьt:time:ageдетство, молодость, двадцатилетиеt:humqпорядочность, безволие, остроумиеt:behavразгильдяйство, подхалимаж, неповиновение, ребячество, предательствоt:interвзаимопомощь, вражда, схватка, дракаt:actionаукцион, вернисаж, вечеринка, выборы, именины, заседание, культпоходt:diseaseангина, диабетt:gameжмурки, покер, домино, волейболt:sportспартакиада, акробатика, баскетболt:paramвысота, грузоподъемностьt:unitбалл, килограмм, метр, минута
Идеология корпуса
Солдатами и офицерами корпуса были белоэмигранты, придерживавшиеся монархических убеждений и осуждавшие коммунизм и советскую власть. Генерал-майор Скородумов расценивал Германию как временного союзника, ожидая, что немцы будут воевать против РККА, а не против гражданского населения. Однако после первых известий о военных преступлениях солдат вермахта и СС против гражданского населения СССР в корпусе начался рост антигерманских настроений. Скородумов обвинял немцев во лжи, поскольку те и не думали прекращать вести захватническую политику на востоке, но был убеждён, что эмиграция «должна быть способной защищать себя и свои семьи от коммунистов». При этом ему угрожали репрессиями, если тот сделает хотя бы одно антинемецкое высказывание. Помимо неприязненных отношений к немцам, чины Русского корпуса негативно относились к прогитлеровски настроенным усташам, которые были причастны к массовым убийствам и выселениям сербов, и не раз вступали с ними в бой. В отличие от усташей, которые не вступали в бой против превосходившего их по силе Русского корпуса без предварительной подготовки, Корпус сам организовывал походы против усташей в знак мести за убитых гражданских лиц сербского происхождения.
Руководство отдельными проектами; разработка принципов разметки текстов
Богуславский, Игорь Михайлович доктор филологических наук, профессор, заведующий Лабораторией компьютерной лингвистики Института проблем передачи информации РАН (Москва), профессор факультета информатики Политехнического университета (Мадрид)
Воейкова, Мария Дмитриевна доктор филологических наук, заведующий отделом грамматики Института лингвистических исследований РАН (С.-Петербург), доцент Санкт-Петербургского государственного университета
Гришина, Елена Александровна (1958—2016) кандидат филологических наук, старший научный сотрудник отдела корпусной лингвистики и лингвистической поэтики Института русского языка им. В. В. Виноградова РАН (Москва)
Добровольский, Дмитрий Олегович доктор филологических наук, профессор, главный научный сотрудник Института русского языка им. В. В. Виноградова РАН (Москва)
Добрушина, Нина Роландовна доктор филологических наук, профессор факультета филологии Высшей школы экономики (Москва)
Живов, Виктор Маркович (1945—2013) доктор филологических наук, профессор, заведующий сектором истории русского литературного языка Института русского языка им. В. В. Виноградова РАН (Москва)
Иомдин, Леонид Лейбович кандидат филологических наук, старший научный сотрудник, и. о. заведующего лаборатории компьютерной лингвистики Института проблем передачи информации РАН (Москва)
Казанский, Николай Николаевич академик РАН, научный руководитель Института лингвистических исследований РАН (С.-Петербург)
Качинская, Ирина Борисовна кандидат филологических наук, младший научный сотрудник филологического факультета Московского государственного университета им. М. В. Ломоносова
Кретов, Алексей Александрович доктор филологических наук, профессор, заведующий кафедрой теоретической и прикладной лингвистики Воронежского государственного университета
Летучий, Александр Борисович кандидат филологических наук, доцент факультета филологии Высшей школы экономики (Москва), старший научный сотрудник Института русского языка им. В. В. Виноградова РАН
Ляшевская, Ольга Николаевна доктор филологических наук, профессор факультета филологии Высшей школы экономики (Москва), старший научный сотрудник Института русского языка им. В. В. Виноградова РАН
Молдован, Александр Михайлович академик РАН, научный руководитель Института русского языка им. В. В. Виноградова РАН (Москва)
Падучева, Елена Викторовна (1935—2019) доктор филологических наук, профессор, главный научный сотрудник отдела лингвистических исследований ВИНИТИ РАН (Москва)
Плунгян, Владимир Александрович академик РАН, профессор, заведующий отделом корпусной лингвистики и лингвистической поэтики Института русского языка им. В. В. Виноградова РАН и отделом типологии и ареальной лингвистики Института языкознания РАН (Москва)
Рахилина, Екатерина Владимировна доктор филологических наук, ведущий научный сотрудник Института русского языка им. В. В. Виноградова РАН (Москва), руководитель направления «Фундаментальная и прикладная лингвистика» факультета филологии Высшей школы экономики (Москва)
Савчук, Светлана Олеговна кандидат филологических наук, старший научный сотрудник отдела корпусной лингвистики и лингвистической поэтики Института русского языка им. В. В. Виноградова РАН (Москва)
Сичинава, Дмитрий Владимирович кандидат филологических наук, старший научный сотрудник отдела корпусной лингвистики и лингвистической поэтики Института русского языка им. В. В. Виноградова РАН (Москва), доцент Школы лингвистики Высшей школы экономики (Москва)
Соловьёв, Валерий Дмитриевич доктор физико-математических наук, профессор, главный научный сотрудник, руководитель НОЦ по лингвистике им. И. А. Бодуэна де Куртенэ Казанского государственного университета (Казань)
Шаров, Сергей Александрович кандидат физико-математических наук, преподаватель Центра исследований перевода факультета гуманитарных наук Лидсского университета (Лидс, Великобритания)
Андрей Билецкий
лидер «азовского руха» и председатель партии «Национальный корпус», народный депутат
Этот политик родился и учился в Харькове, получил историческое образование.
Выступал против бомбардировки Югославии НАТО, был участником акций «Украина без Кучмы» и Оранжевой революции, основал националистическую организацию «Патриот Украины» и исповедовал «социал-националистические» взгляды.
Во время Евромайдана и Революции достоинства сидел в тюрьме.
Билецкий оказался за решеткой еще в 2011 году. Тогда в Украине состоялись аресты представителей националистических организаций, в том числе и «Патриота Украины».
В августе 2011 года в офисе «Патриота» в Харькове стреляли. В результате ранения получили несколько националистов и Сергей Колесник, который пришел к «правым» решить конфликт.
Впоследствии правоохранители возбудили дело именно по факту нападения на Колесника, в рамках которого арестовали и Андрея Билецкого.
На свободу он вышел 24 февраля 2014 года, когда Верховная Рада приняла постановление об освобождении политических заключенных времен Виктора Януковича.
В марте и апреле Андрей Билецкий был одним из лидеров движения против сепаратистов в Харькове. При его участии 14 марта 2014 года состоялось вооруженное противостояние с пророссийскими активистами возле офиса «Патриота Украины».
Впоследствии российский боевик «Моторола» признался, что его подразделение впервые участвовало в боевом столкновении именно 14 марта 2014 года в Харькове.
Весной 2014 года Андрей Билецкий стал одним из основателей батальона, а впоследствии и милицейского полка «Азов», который принимал участие в вытеснении боевиков из Мариуполя и ряде других операций на Донбассе.
Во время боевых действий на Востоке руководитель полка имел неплохие отношения с министром внутренних дел Арсеном Аваковым.
В одном из интервью он признал, что Арсен Аваков — «человек, который при всех минусах реально помогал в создании добровольческих батальонов, который не побоялась взять на себя ответственность за их вооружение. Он оказался наиболее адекватным из высоких руководителей страны именно в моментах войны».
При этом Билецкий настаивает, что Аваков не является его политическим соратником.
2014 года Андрей Билецкий избрался в Верховную Раду в киевском округе как самовыдвиженец. Хотя накануне участвовал в избирательном съезде «Народного фронта».
В последние годы в отношении Андрея Билецкого раздаются упреки, что его работу может координировать Арсен Аваков. Однако он это отрицает и говорит, что эту информацию распространяет администрация президента. Он утверждает, что их коммуникация фактически «сведена к нулю».
Некоторые бойцы «Азова», такие как Андрей Троян, получили руководящие должности в системе национальной полиции.
Весной 2015 года Андрей Билецкий основал Гражданский корпус «Азов», а затем и партию «Национальный корпус».
Андрей Билецкий еще с довоенных времен был известен своими крайними националистическими взглядами, которые критиковали правозащитники.
А до 2011 года господин Билецкий высказывался в поддержку определенной конфедерации с Россией.
«Мы, социал-националисты, имеем совсем другие в этом вопросе взгляды. Мы понимаем, что сепарация от России и разделения является идиотизмом. Потому что наша идея — мощная проукраинская с центром в Киеве конфедерация. Но ни в коем случае не единое государство», — рассказывал в 2010 году господин Билецкий.
Последующие события
Табличка на кладбище в Ново-Дивеево
После окончания Второй Мировой войны служившие в корпусе эмигрировали в США, Канаду, Бразилию, Аргентину и другие страны.
Отделы и отделения Союза чинов Русского корпуса начали действовать в ряде стран. Первым председателем СЧРК стал командующий Корпуса полковник А. И. Рогожин. СЧРК способствовал идейному единению бывших корпусников, оказывал материальную помощь нуждающимся соратникам, вёл большую антикоммунистическую и патриотическую работу в русской белой эмиграции. С 1952 года под эгидой СЧРК издавался военный, политический и литературный журнал «Наши Вести». Деятельность Союза чинов Русского корпуса практически прекратилась в 1999 году, когда скончался его последний председатель — поручик Владимир Владимирович Гранитов.
На Русском кладбище «Ново-Дивеево», штат Нью-Йорк, была построена часовня святого Александра Невского в память о корпусе. Многие ветераны корпуса похоронены рядом.
Так закрывают или нет?
В комментариях к посту Лоры Янды директор по распространению технологий Яндекса Григорий Бакунов (известный старожилам Рунета как bobuk) заявил, что компания не намерена закрывать проект. Разработчики опубликовали обращение к пользователям, где объяснили ошибки переходом корпуса на новую технологию поиска. В обращении упомянуты важные функции, которые перестали работать или работают ограниченно.
Бакунов: ответственность за НКРЯ не только на Яндексе
Штатных программистов на проекте вообще нет — корпус поддерживается силами волонтеров
Разгорелась дискуссия между Иваном Бегтиным и Григорием Бакуновым. По мнению Ивана, данные и исходный код проекта должны стать открытыми. В ответ на это представитель Яндекса заявил, что выложить код в open source сейчас невозможно, поскольку проект содержит большое количество внутренних инструментов, открывать которые Яндекс не готов. Бегтин задумался о необходимости публичной кампании:
Наконец, через две с половиной недели появился комментарий от самого НКРЯ:
Пользуясь случаем, напомним, что НКРЯ является партнерством, в которомучаствуют Яндекс, Институт русского языка РАН и Институт проблем передачи информации РАН. Все решения об изменениях в работе Корпуса принимаются участниками партнерства коллегиально и обсуждаются на заседаниях рабочей группы. Мы будем регулярно публиковать сообщения об обновлениях и держать вас в курсе.С уважением,представители Яндекса в НКРЯ Светлана Бочавер,Анна Булгакова
Состав корпуса
В корпус входят как письменные тексты (художественные, мемуары, публицистика, научная, религиозная литература, повседневная печатная продукция), так и записи устных текстов (публичной речи и частных бесед).
В корпус также входят подкорпусы поэтических и диалектных текстов, корпусы параллельных текстов (для следующих языков доступны параллельные корпусы с русским: английский, армянский, белорусский, болгарский, бурятский, испанский, итальянский, китайский, латышский, немецкий, польский, украинский, французский, шведский, эстонский и мультиязычный), отдельный газетный корпус (материалы СМИ начала XXI века), церковнославянский корпус (богослужебные тексты, современные (XIX—XX век) и более ранних периодов), исторический (в том числе древнерусский, старорусский, берестяных грамот), синтаксический, акцентологический, мультимедийный и обучающий подкорпусы.
НКРЯ в студенческих исследованиях
Студенты не только учат школьников использовать НКРЯ, но и применяют корпус для собственных исследований. Например, в курсовых и дипломных работах.
Мария Голубева, студентка РГГУ, «Фундаментальная и прикладная лингвистика»:
Участники научно-учебной группы (НУГ) «Материалы к частотному словарю русской поэзии» НИУ ВШЭ тоже рассказали, как используют НКРЯ. В НУГ студенты работают вместе с преподавателями.
Кристина Викторовна Литвинцева, доцент Школы лингвистики, и Алексей Старченко, студент направления «Фундаментальная и компьютерная лингвистика»:
В составе НКРЯ уже есть поэтический подкорпус, но наша группа поставила своей задачей разработать инструменты для большего количества вариантов его использования, чтобы лингвистам было удобнее. Ведь поэтические тексты устроены не так, как другие — в них гораздо больше того, что можно изучить: ритмы, рифмы, ударения. Наша группа решила посчитать и менее очевидные, но не менее интересные вещи, например, посмотрела распределение прилагательных цвета у разных поэтов в разное время (частоту использования той или иной лексемы можно посмотреть в Поэтическом корпусе НКРЯ, кликнув на странице выдачи на «Распределение по годам» ). Таким образом, у нас получился «атлас поэтической моды» — тренды в использовании прилагательных цвета поэтами Серебряного века. Как вы думаете, насколько системным поэтом тут оказывается Александр Блок?Ещё одно направление в рамках нашей группы связано с ударением: поэзия — один из немногих типов текстов, в которых его можно (пусть и с некоторыми особенностями) непосредственно наблюдать. Особенно нам интересна вариативность в ударении, которая встречается в стихах: можно ли в таких случаях понять, перед нами поэтическая вольность или языковая закономерность? А ещё на данных Поэтического корпуса удалось сделать инструмент , дающий возможность получить информацию о сочетаемости интересующего слова с другими и частоте такой сочетаемости (например, для слова «сильный» самая высокая частота сочетаемости со словом «сей», а для «бессильный» — со словом «такой»).
Поисковый интерфейс инструмента, разработанного НУГ
Международное сотрудничество
Барентсен, Адриан Dr. hab., профессор факультета гуманитарных наук Амстердамского университета (Амстердам, Нидерланды)
Бене, Венсан PhD, член административного совета и заведующий учебной частью Института восточных языков и культур (Париж, Франция)
Боровикова, Мария Витальевна PhD, научный сотрудник отделения славянской филологии Тартуского университета (Тарту, Эстония)
Бьяджини, Франческа PhD, преподаватель Школы переводчиков Болонского университета (Форли, Италия)
Глинник, Инна Викторовна младший научный сотрудник Центра исследований белорусской культуры, языка и литературы Национальной академии наук Беларуси (Минск, Беларусь, 2010—2013)
Гочев, Гочо Недев профессор, заведующий кафедрой русистики Великотырновского университета (Велико Тырново, Болгария)
Зубов, Александр Васильевич доктор филологических наук, заведующий кафедрой информатики и прикладной лингвистики Минского государственного лингвистического университета (Минск, Беларусь)
Копылов, Игорь Леонович кандидат филологических наук, директор Филиала «Институт языкознания им. Якуба Коласа» Центра исследований белорусской культуры, языка и литературы Национальной академии наук Беларуси (Минск, Беларусь)
Кощенко, Владимир Александрович научный сотрудник Центра исследований белорусской культуры, языка и литературы Национальной академии наук Беларуси (Минск, Беларусь)
Кривенко, Анна Леонидовна доцент кафедры лексикологии и стилистики английского языка Киевского национального лингвистического университета (Киев, Украина)
Лазиньский, Марек Dr. hab., профессор факультета полонистики Варшавского университета (Варшава, Польша)
Луазо, Сильвен PhD, доцент университета Париж XIII (Париж, Франция)
Мицкевич, Ольга Владимировна кандидат филологических наук, учёный секретарь Института языкознания им. Якуба Коласа Центра исследований белорусской культуры, языка и литературы Национальной академии наук Беларуси (Минск, Беларусь)
Мицкевич, Ольга Сергеевна преподаватель кафедры общего и славянского языкознания Гродненского государственного университета имени Янки Купалы (Гродно, Беларусь)
Мохань, Елена Николаевна старший преподаватель кафедры общего и славянского языкознания Гродненского государственного университета имени Янки Купалы (Гродно, Беларусь)
Нозеда, Валентина преподаватель Католического университета Сакро-Куоре (Милан, Италия)
Рычкова, Людмила Васильевна кандидат филологических наук, доцент, заведующий кафедрой общего и славянского языкознания Гродненского государственного университета имени Янки Купалы (Гродно, Беларусь)
Станкевич, Алеся Юрьевна старший преподаватель кафедры общего и славянского языкознания Гродненского государственного университета имени Янки Купалы (Гродно, Беларусь)
Стасевич (Коровко), Юлия Анатольевна выпускник Гродненского государственного университета имени Янки Купалы (Гродно, Беларусь)
Тищенко-Монастырская, Оксана Александровна кандидат филологических наук, научный сотрудник отдела языков Украины, Институт языкознания им. А. А. Потебни, Национальная академия наук Украины (Киев, Украина)
Треблер, Светлана Моисеевна кандидат филологических наук, доцент Казахстанского филиала МГУ им. М.В. Ломоносова (Астана, Казахстан)
Фомина, Елизавета Сергеевна Ph.D., выпускница отделения славянской филологии Тартуского университета (Тарту, Эстония)
Чепикова, Ирина Антоновна кандидат филологических наук, доцент кафедры общего и славянского языкознания Гродненского государственного университета имени Янки Купалы (Гродно, Беларусь)
Шведова, Мария Алексеевна кандидат филологических наук, докторант Киевского национального лингвистического университета (Киев, Украина)
Национальный корпус русского языка 2003–2020 | info@ruscorpora.ru |
II. Распределение текстов основного корпуса по видам и другим метапризнакам
Вид текста | Число текстов | Число предложений | Число словоупотреблений | % словоупотреблений |
Художественные письменные тексты | 6 308 | 9 164 402 | 92 058 363 | 44.0% |
Нехудожественные письменные тексты | 70 574 | 8 410 350 | 117 139 912 | 56.0% |
Всего: | 76 882 | 17 574 752 | 209 198 275 | 100% |
Художественные тексты
Жанр | Число текстов | Число предложений | Число словоупотреблений | % словоупотреблений |
детектив, боевик | 75 | 608 641 | 5 260 208 | 5.8% |
детская | 588 | 473 314 | 4 014 770 | 4.4% |
документальная проза | 216 | 596 687 | 6 946 874 | 7.7% |
драматургия | 138 | 361 839 | 1 678 845 | 1.9% |
историческая проза | 124 | 496 539 | 5 406 303 | 6.0% |
любовная история | 31 | 95 010 | 785 305 | 0.9% |
нежанровая проза | 3 318 | 5 224 077 | 55 132 401 | 61.0% |
приключения | 31 | 193 955 | 1 997 579 | 2.2% |
фантастика | 282 | 570 890 | 5 486 577 | 6.1% |
юмор и сатира | 1 284 | 389 396 | 3 689 461 | 4.1% |
Всего: | 6 087 | 9 010 348 | 90 398 323 | 100% |
Нехудожественные тексты
Сфера функционирования | Число текстов | Число предложений | Число словоупотреблений | % словоупотреблений |
бытовая | 1 405 | 341 374 | 4 442 891 | 3.7% |
официально-деловая | 2 417 | 257 728 | 3 854 477 | 3.2% |
производственно-техническая | 1 079 | 98 504 | 1 326 386 | 1.1% |
публицистика | 57 186 | 5 656 665 | 75 856 125 | 63.8% |
1 464 | 58 344 | 572 380 | 0.5% | |
учебно-научная | 5 954 | 1 663 684 | 27 374 061 | 23.0% |
церковно-богословская | 824 | 207 425 | 3 222 023 | 2.7% |
электронная коммуникация | 360 | 239 700 | 2 286 484 | 1.9% |
Всего: | 70 689 | 8 523 424 | 118 934 827 | 100% |
Тематика текста | Число текстов | Число предложений | Число словоупотреблений | % словоупотреблений |
История | 1 372 | 413 140 | 6 649 236 | 4.6% |
администрация и управление | 7 490 | 148 533 | 1 558 530 | 1.1% |
армия и вооруженные конфликты | 4 420 | 263 073 | 3 555 339 | 2.4% |
астрология, парапсихология и эзотерика | 12 | 262 | 2 717 | 0.0% |
астрология, парапсихология, эзотерика | 228 | 26 918 | 272 296 | 0.2% |
астрономия | 193 | 17 674 | 280 085 | 0.2% |
бизнес, коммерция, экономика, финансы | 7 072 | 349 332 | 4 911 895 | 3.4% |
биология | 696 | 144 566 | 2 179 637 | 1.5% |
география | 198 | 116 129 | 1 873 821 | 1.3% |
геология | 337 | 42 954 | 707 032 | 0.5% |
горнодобывающая промышленность | 391 | 26 838 | 418 005 | 0.3% |
дом и домашнее хозяйство | 1 120 | 75 106 | 911 443 | 0.6% |
досуг, зрелища и развлечения | 2 642 | 107 320 | 1 080 686 | 0.7% |
естественные науки | 228 | 4 229 | 40 898 | 0.0% |
естествознание | 30 | 13 782 | 210 917 | 0.1% |
здоровье и медицина | 3 458 | 280 064 | 3 744 357 | 2.6% |
здоровье и медицина | 3 458 | 280 064 | 3 744 357 | 2.6% |
информатика | 463 | 54 595 | 820 168 | 0.6% |
искусство и культура | 8 206 | 788 121 | 10 732 080 | 7.4% |
искусствоведение | 54 | 25 217 | 383 143 | 0.3% |
история | 1 372 | 413 140 | 6 649 236 | 4.6% |
криминал | 7 060 | 183 836 | 1 816 000 | 1.2% |
культурология | 92 | 46 786 | 786 281 | 0.5% |
легкая и пищевая промышленность | 247 | 18 806 | 286 502 | 0.2% |
лес и лесное хозяйство | 15 | 221 | 1 983 | 0.0% |
лесное хозяйство | 24 | 3 808 | 61 072 | 0.0% |
математика | 161 | 23 883 | 448 589 | 0.3% |
машиностроение | 11 | 766 | 11 794 | 0.0% |
металлургия | 17 | 1 553 | 24 707 | 0.0% |
наука и технологии | 8 073 | 1 539 253 | 24 469 594 | 16.8% |
образование | 1 714 | 111 382 | 1 489 504 | 1.0% |
организация и управление | 103 | 5 354 | 110 747 | 0.1% |
политика и общественная жизнь | 20 732 | 1 394 541 | 19 828 428 | 13.6% |
право | 2 025 | 180 295 | 2 747 073 | 1.9% |
природа | 2 061 | 93 671 | 1 205 601 | 0.8% |
производство | 3 090 | 189 070 | 2 510 729 | 1.7% |
психология | 270 | 102 825 | 1 709 131 | 1.2% |
путешествия | 1 078 | 244 101 | 3 605 895 | 2.5% |
религия | 3 504 | 373 299 | 5 826 984 | 4.0% |
сельское хозяйство | 1 074 | 65 590 | 941 553 | 0.6% |
социология | 102 | 28 563 | 493 390 | 0.3% |
спорт | 2 672 | 204 682 | 2 394 484 | 1.6% |
статистика | 113 | 2 915 | 32 173 | 0.0% |
строительство и архитектура | 1 236 | 71 432 | 893 487 | 0.6% |
техника | 4 756 | 275 941 | 3 644 918 | 2.5% |
транспорт | 2 591 | 61 934 | 661 645 | 0.5% |
физика | 997 | 82 364 | 1 229 234 | 0.8% |
филология | 412 | 152 520 | 2 506 637 | 1.7% |
философия | 339 | 242 683 | 4 450 451 | 3.1% |
химическая промышленность | 105 | 7 881 | 111 899 | 0.1% |
химия | 1 000 | 116 563 | 1 563 212 | 1.1% |
частная жизнь | 9 045 | 753 969 | 8 126 214 | 5.6% |
экономика | 18 | 1 830 | 28 036 | 0.0% |
электроника | 685 | 42 944 | 603 204 | 0.4% |
энергетика | 49 | 4 375 | 63 488 | 0.0% |
Всего: | 118 911 | 10 220 693 | 145 410 517 | 100% |
Информация о нестандартности и особенностях записи
В корпусе со снятой грамматической омонимией предусмотрен ряд помет, указывающих на нестандартность и/или особенности записи входящей в Корпус словоформы. Отстутствие таких особенностей обозначается пометой normal.anom («Аномальная форма») различного рода морфологические аномалии, возможные у устаревших или просторечных нелитературных форм (три дни при нормативном три дня, ляжь при нормативном ляг)distort («Искаженная форма») орфографическое и/или фонетическое искажение слова, часто передающее различные особенности произношения (дэвушка, това’ищи, про-хо-ди, низнаю).ciph («Цифровая запись») запись числительного, числительного-прилагательного или прилагательного (полностью или частично) при помощи цифр (73, LXXIII, 73-й, 22-летний). Для этих словоформ в поле «Лексема» также употребляется цифровая запись; число и падеж указываются только в тех случаях, когда выписано окончание (типа 14-му).INIT («Инициал») запись вида «заглавная буква с точкой» (М., Р.). В поле «Лексема» инициал не раскрывается; грамматические признаки не указываются.abbr («Сокращение») сокращенная запись (тов., гг., ч.). В поле «Лексема» сокращение (кроме инициалов) раскрывается, указывается грамматическая форма, соответствующая контексту. Специально отметим, что акронимы вроде ООН, вуз и усеченные слова вроде зав, зам, записываемые без точки и не раскрываемые при чтении, не получают пометы abbr и трактуются как обычные слова (склоняемые или несклоняемые).
Кроме того, в корпусе с неснятой грамматической омонимией используется особая помета (bastard) для несловарной формы (не входящей в словарь автоматического анализатора, а порожденной по аналогии, например, форма вроде Махабхарата получает несколько гипотетических разборов, в том числе от псевдолексем махабхаронок, махабхарать и т. п.); по мере пополнения словаря анализатора число таких форм будет уменьшаться. С целью снижения «шума» при поиске по корпусу с неснятой грамматической омонимией иногда бывает целесообразно исключить поиск по подобным формам; для ряда задач, напротив, можно ограничить поиск именно ими.
Состав корпуса
В Русский корпус записалось 90 корниловцев и взвод кутеповской роты. Полковник Кондратьев приехал в Корпус со знаменем 2-го Корниловского ударного полка. Первоначально военнослужащие носили переделанную на русский манер форму югославской армии. Погоны и прочие знаки различия нашивались по последнему чину в Русской армии. Впрочем, эти знаки различия не играли никакой практической роли. Действительные в Корпусе знаки различия носились в петлицах у офицеров или в виде шевронов у рядовых. К головным уборам крепились старые русские кокарды. Первоначально обучение личного состава Корпуса (охранной группы) производилось по уставам Русской императорской армии, однако вскоре в связи с изменением тактики боя пришлось перейти на уставы Красной армии.
Первоначально «Русская охранная группа» оперативно подчинялась германскому хозяйственному управлению в Сербии под командованием группенфюрера Нейхаузена<span title=»Статья «Нейхаузен, Франц» в русском разделе отсутствует»>ru</span>de, а с осени 1943 года — вновь сформированному немецкому Сербскому армейскому корпусу генерала Фельбера<span title=»Статья «Фельбер, Ганс Густав» в русском разделе отсутствует»>ru</span>de. 30 ноября 1942 года корпус был включён в состав Вермахта, были введены немецкие уставы, немецкая форма и знаки различия, личный состав должен был присягать на верность фюреру. Но даже после включения в состав вермахта корпус до конца войны оставался русским воинским соединением с русским командным составом. Германскому командованию подчинялся лишь командир Корпуса.
Командные кадры готовились в 1-м Русском Великого Князя Константина Константиновича кадетском корпусе, существовавшем в Югославии с 1920 по 1944 годы. Кроме того, в полках имелись юнкерские роты, в которые была сведена молодёжь, не завершившая военного обучения. В сентябре 1943 года корпус насчитывал 4,8 тысяч солдат и офицеров, а к сентябрю 1944 года — свыше 11 тысяч. К этому времени в него входили: штаб, пять полков, отдельный батальон «Белград» (роты: караульная, транспортная, запасная и снабжения), роты ветеринарная и связи. В подчинении штаба корпуса находились два лазарета с русскими врачами и санитарами. Каждый полк имел три батальона и взводы: артиллерийский (2 полевых орудия калибра 75 мм), противотанковый (2-3 противотанковые пушки 37 мм), сапёрный, конный, связи; батальон — 3 стрелковые роты (в каждой 170 человек, 16 ручных и 2 станковых пулемёта, 4 ротных миномёта) и взвод тяжёлого оружия (4 станковых пулемёта и 4 батальонных миномёта). Штатная численность 1-го (командующий В. Э. Зборовский) и 4-го полков составляла — 2211 человек, остальных — по 2183 человека. При штабе Корпуса находился немецкий штаб связи, в полках и батальонах находились немецкие офицеры связи, а в ротах — ротные инструкторы.