ЧАСТОТНЫЙ СЛОВАРЬ СОВРЕМЕННОГО КАЛМЫЦКОГО ЯЗЫКА: ПРАВИЛА АНАЛИЗА ТЕКСТОВОГО МАТЕРИАЛА
Digital object identifier
Аннотация
Статья посвящена описанию правил анализа текстового материала для создания частотного словаря калмыцкого языка на материале Национального корпуса калмыцкого языка (www.kalmcorpora.ru), который состоит из художественных текстов второй половины XX – начала XXI в., а также газетных статей и расшифровок устной речи. Объем художественных (прозаических и поэтических) текстов превышает 10 млн словоупотреблений. Тексты в корпусе, а также отдельные элементы текста (словоформы, знаки препинания, абзацы и т. п.) особым образом аннотированы. Создаваемый частотный словарь калмыцкого языка будет носить пилотный характер, поскольку это первый опыт разработки словаря подобного типа. На наш взгляд, объем созданного корпуса калмыцкого языка позволяет описать язык с точки зрения частотности употребления языковых единиц и значений: словоформ, слов, конструкций (2- и 3-граммных), грамматических значений, букв и др.
Полный текст:
128-141Литература
Баранова В. В. Сложные глаголы в калмыцком языке // Исследования по грамматике калмыцкого языка/ ред. С. С. Сай, В. В. Баранова, Н. В. Сердобольская. СПб.: Наука, 2009. Том V. Ч. 2). С. 255–310. (ACTA LINGUISTICA PETROPOLITANA. Труды Ин-та лингвист. исслед. РАН).
Бертагаев Т. А. Синтаксис современного монгольского языка в сравнительном освещении. Простое предложение. М.: Наука, 1964. 300 с.
Богданов C. И., Рыжова Ю. В. Русская служебная лексика. Сводные таблицы. СПб.: изд-во СПб. ун-та, 1997. 293 с.
Венцов А. В., Грудева Е. В., Касевич В. Б., Ягунова Е. В. Об идиомах в Национальном корпусе русского литературного языка // Компьютерная лингвистика-2004. Тезисы международной конференции. 12–14 октября 2004 г. СПб., 2004. С. 17–18.
Гак В. Г. Слово // Лингвистический энциклопедический словарь / под ред. В. Н. Ярцевой. М.: Советская энциклопедия, 1990 [электронный ресурс] // URL: http://tapemark.narod.ru/les/464c.html (дата обращения: 07.03.2012).
Грамматика калмыцкого языка: фонетика и морфология. Элиста: Калм. кн. изд-во, 1983. 336 с.
Дараган Ю. В. Функции слов-«паразитов» в русской спонтанной речи [электронный ресурс]// URL: http://www.dialog-21.ru/materials/archive.asp?id=6260&vol=6077&y=2000. 2000 (18.05.2008).
Долинский В. А. Квантитативная лингвистика в исследовании текста // Алфавит: Строение повествовательного текста. Синтагматика. Парадигматика. Смоленск: СГПУ, 2004. С. 283–324.
Зализняк А. А. Грамматический словарь русского языка: Словоизменение: Около 100 000 слов. 3-е изд., стереотип. М.: Рус. яз., 1987. 880 с.
Калмыцко-русский словарь / под ред. Б. Д. Муниева. М.: Рус. яз., 1977. 768 с.
Касевич В. Б. Элементы общей лингвистики. М.: Наука, ГРВЛ, 1977. 177 с.
Копотев М. Несмотря на, потому что, или многокомпонентные единицы в аннотированном корпусе русских текстов // Компьютерная лингвистика и интеллектуальные технологии. Труды международной конференции «Диалог’2004» («Верхневолжский», 2–7 июня 2004 г.). М., 2004. (URL: http://www.dialog-21.ru/Archive/2004/Kopotev.htm (17.07.2008)).
Крылов С. А. Измерение частотности синтаксических молекул (на материале генерального корпуса русского языка) // Компьютерная лингвистика и интеллектуальные технологии: по материалам ежегодной Международной конференции «Диалог» («Бекасово», 48 июня 2008 г.). Вып. 7 (14). М., 2008. С. 254–261.
Крылов С. А. Об инвентарных и конструктивных единицах языка // Язык и речевая деятельность. 2003. Вып. 6. СПб., 2006. С. 9–26.
Крылов А. С. Опыт изучения современного монгольского языка в количественном аспекте // Вопросы языкознания. 2013. № 5. С. 46–58.
Куканова В. В. О корпусе калмыцких текстов: краткий обзор проблем графематического анализа // Научное наследие проф. А. Ш. Кичикова и актуальные проблемы современной калмыцкой филологии и культуры (Кичиковские чтения). Материалы Региональной научной конференции, посвященной 90-летию со дня рождения профессора А. Ш. Кичикова (21 декабря 2011 г., Элиста). Элиста: Изд-во Калм. гос. ун-та, 2012в. С. 61–63.
Куканова В. В. Словоизменительные типы в калмыцком языке в свете автоматической обработки текстов (на примере имени существительного) // Вестник Калмыцкого института гуманитарных исследований РАН. 2012а. № 2. С. 168–177.
Куканова В. В. Словоизменительные типы в калмыцком языке в свете автоматической обработки текстов (на примере имени существительного) – II // Вестник Калмыцкого института гуманитарных исследований РАН. 2012б. № 3. С. 151–161.
Куканова В. В., Бембеев Е. В., Мулаева Н. М., Очирова Н. Ч. Метаразметка в Национальном корпусе калмыцкого языка // Вестник Калмыцкого государственного университета. 2012а. № 3. C. 67–72.
Куканова В. В., Бембеев Е. В., Мулаева Н. М., Очирова Н. Ч. Национальный корпус калмыцкого языка: архитектура и возможности использования // Вестник Калмыцкого института гуманитарных исследований РАН. 2012б. № 3. C. 138–150.
Лённгрен Л. (ред.). Частотный словарь современного русского языка [Lönngren, Lennart. The Frequency Dictionary of Modern Russian. Acta Univ. Ups., StudiaSlavicaUpsaliensia Uppsala 32]. Uppsala, 1993. 188 с.
Леонтьев А. А. Психолингвистические единицы и порождение речевого высказывания. М.: Наука, 1969. 307 с.
Ляшевская О. Н. , Шаров С. А. Частотный словарь современного русского языка (на материалах Национального корпуса русского языка). М.: Азбуковник, 2009. 1090 с.
Мустайоки А., Копотев М. К вопросу о статусе эквивалентов слова типа потому что, в зависисмости от, к сожаленью // Вопросы языкознания. М., 2004. № 3. С. 88–107.
Степанова Е.М. Частотный словарь общенаучной лексики. М.: Просвещение, 1976. 87 с.
Частотный словарь русского языка / под ред. Л. Н. Засориной. М.: Русский язык, 1977. 936 с.
Шведова — Русский семантический словарь. Толковый словарь, систематизированный по классам слов и значений / Ин-т рус. яз. им. В. В. Виноградова РАН; под общ. ред. Н. Ю. Шведовой. Т. 1. М.: Азбуковник, 1998. XXV+807 с. Т. 2. М.: Азбуковник, 2000. ХХХII+762 с. Т. 3. М.: Азбуковник, 2003. 720 с. Т. 4. М.: ИРЯ РАН, 2007. 952 с.
Ягунова Е. В. Неоднословные целостности в словаре и в корпусе // Корпусная лингвистика-2006. Труды международной конференции. 10–14 октября 2006. СПб., 2006. С. 395–412.
Бертагаев Т. А. Синтаксис современного монгольского языка в сравнительном освещении. Простое предложение. М.: Наука, 1964. 300 с.
Богданов C. И., Рыжова Ю. В. Русская служебная лексика. Сводные таблицы. СПб.: изд-во СПб. ун-та, 1997. 293 с.
Венцов А. В., Грудева Е. В., Касевич В. Б., Ягунова Е. В. Об идиомах в Национальном корпусе русского литературного языка // Компьютерная лингвистика-2004. Тезисы международной конференции. 12–14 октября 2004 г. СПб., 2004. С. 17–18.
Гак В. Г. Слово // Лингвистический энциклопедический словарь / под ред. В. Н. Ярцевой. М.: Советская энциклопедия, 1990 [электронный ресурс] // URL: http://tapemark.narod.ru/les/464c.html (дата обращения: 07.03.2012).
Грамматика калмыцкого языка: фонетика и морфология. Элиста: Калм. кн. изд-во, 1983. 336 с.
Дараган Ю. В. Функции слов-«паразитов» в русской спонтанной речи [электронный ресурс]// URL: http://www.dialog-21.ru/materials/archive.asp?id=6260&vol=6077&y=2000. 2000 (18.05.2008).
Долинский В. А. Квантитативная лингвистика в исследовании текста // Алфавит: Строение повествовательного текста. Синтагматика. Парадигматика. Смоленск: СГПУ, 2004. С. 283–324.
Зализняк А. А. Грамматический словарь русского языка: Словоизменение: Около 100 000 слов. 3-е изд., стереотип. М.: Рус. яз., 1987. 880 с.
Калмыцко-русский словарь / под ред. Б. Д. Муниева. М.: Рус. яз., 1977. 768 с.
Касевич В. Б. Элементы общей лингвистики. М.: Наука, ГРВЛ, 1977. 177 с.
Копотев М. Несмотря на, потому что, или многокомпонентные единицы в аннотированном корпусе русских текстов // Компьютерная лингвистика и интеллектуальные технологии. Труды международной конференции «Диалог’2004» («Верхневолжский», 2–7 июня 2004 г.). М., 2004. (URL: http://www.dialog-21.ru/Archive/2004/Kopotev.htm (17.07.2008)).
Крылов С. А. Измерение частотности синтаксических молекул (на материале генерального корпуса русского языка) // Компьютерная лингвистика и интеллектуальные технологии: по материалам ежегодной Международной конференции «Диалог» («Бекасово», 48 июня 2008 г.). Вып. 7 (14). М., 2008. С. 254–261.
Крылов С. А. Об инвентарных и конструктивных единицах языка // Язык и речевая деятельность. 2003. Вып. 6. СПб., 2006. С. 9–26.
Крылов А. С. Опыт изучения современного монгольского языка в количественном аспекте // Вопросы языкознания. 2013. № 5. С. 46–58.
Куканова В. В. О корпусе калмыцких текстов: краткий обзор проблем графематического анализа // Научное наследие проф. А. Ш. Кичикова и актуальные проблемы современной калмыцкой филологии и культуры (Кичиковские чтения). Материалы Региональной научной конференции, посвященной 90-летию со дня рождения профессора А. Ш. Кичикова (21 декабря 2011 г., Элиста). Элиста: Изд-во Калм. гос. ун-та, 2012в. С. 61–63.
Куканова В. В. Словоизменительные типы в калмыцком языке в свете автоматической обработки текстов (на примере имени существительного) // Вестник Калмыцкого института гуманитарных исследований РАН. 2012а. № 2. С. 168–177.
Куканова В. В. Словоизменительные типы в калмыцком языке в свете автоматической обработки текстов (на примере имени существительного) – II // Вестник Калмыцкого института гуманитарных исследований РАН. 2012б. № 3. С. 151–161.
Куканова В. В., Бембеев Е. В., Мулаева Н. М., Очирова Н. Ч. Метаразметка в Национальном корпусе калмыцкого языка // Вестник Калмыцкого государственного университета. 2012а. № 3. C. 67–72.
Куканова В. В., Бембеев Е. В., Мулаева Н. М., Очирова Н. Ч. Национальный корпус калмыцкого языка: архитектура и возможности использования // Вестник Калмыцкого института гуманитарных исследований РАН. 2012б. № 3. C. 138–150.
Лённгрен Л. (ред.). Частотный словарь современного русского языка [Lönngren, Lennart. The Frequency Dictionary of Modern Russian. Acta Univ. Ups., StudiaSlavicaUpsaliensia Uppsala 32]. Uppsala, 1993. 188 с.
Леонтьев А. А. Психолингвистические единицы и порождение речевого высказывания. М.: Наука, 1969. 307 с.
Ляшевская О. Н. , Шаров С. А. Частотный словарь современного русского языка (на материалах Национального корпуса русского языка). М.: Азбуковник, 2009. 1090 с.
Мустайоки А., Копотев М. К вопросу о статусе эквивалентов слова типа потому что, в зависисмости от, к сожаленью // Вопросы языкознания. М., 2004. № 3. С. 88–107.
Степанова Е.М. Частотный словарь общенаучной лексики. М.: Просвещение, 1976. 87 с.
Частотный словарь русского языка / под ред. Л. Н. Засориной. М.: Русский язык, 1977. 936 с.
Шведова — Русский семантический словарь. Толковый словарь, систематизированный по классам слов и значений / Ин-т рус. яз. им. В. В. Виноградова РАН; под общ. ред. Н. Ю. Шведовой. Т. 1. М.: Азбуковник, 1998. XXV+807 с. Т. 2. М.: Азбуковник, 2000. ХХХII+762 с. Т. 3. М.: Азбуковник, 2003. 720 с. Т. 4. М.: ИРЯ РАН, 2007. 952 с.
Ягунова Е. В. Неоднословные целостности в словаре и в корпусе // Корпусная лингвистика-2006. Труды международной конференции. 10–14 октября 2006. СПб., 2006. С. 395–412.
Ссылки
- На текущий момент ссылки отсутствуют.