Реферат Отчет 563 с., 2 тома., 45 рис., 34 табл., 35 источников, 9 прил




Скачать 62.08 Kb.
НазваниеРеферат Отчет 563 с., 2 тома., 45 рис., 34 табл., 35 источников, 9 прил
Дата конвертации23.05.2013
Размер62.08 Kb.
ТипРеферат

Реферат



Отчет 563 с., 2 тома., 45 рис., 34 табл., 35 источников, 9 прил.

КЛЮЧЕВЫЕ СЛОВА: звуковой корпус русского языка, грамматика речи, многоуровневая лингвистическая разметка, СПонтанная речь, ФОНЕТИКА, повседневная коммуникация, информационные и речевые технологии

Проект «Звуковое описание грамматических единиц русского языка: информационно-коммуникативный подход» направлен на решение актуальной задачи описания грамматических единиц русской звучащей речи (предложения, словоформы, морфемы) на основе звукового корпуса русского языка повседневного общения с привлечением современных информационных методик.


Объект исследования или разработки


Объектом исследования является живая спонтанная речь на русском языке, используемая в повседневном общении – ее грамматика и фонетика. Исследование предполагает анализ ряда социологических факторов (возраст, образование, профессия), психологического типа говорящего и других условий общения в реальных коммуникативных ситуациях.

Объектом разработки является речевой корпус русского языка повседневного общения, составленный из звукозаписей всей речевой деятельности информантов в течение суток («Один речевой день» или ОРД). Корпус интегрируется с информационно-исследовательской средой, состоящей из базы данных, средств лингвистического аннотирования и утилит автоматической обработки данных на фонетическом, лексическом и грамматическом уровнях.


Цели и задачи проекта


Основной целью проекта является описание реальной «грамматики речи» современного русского языка в естественных коммуникативных ситуациях. В частности, предполагается получить описание таких грамматических единиц, как предложение, словосочетание, словоформа, морфема. Осуществление этой цели стало возможно лишь в наши дни при условии привлечения последних достижений в области информационных и речевых технологий. .


Метод или методология проведения работы


- методы и подходы полевой лингвистики (интервьюирование, анкетирование и др.);
- методы речевых технологий (комплекс методов звукозаписи, обработки
и анализа речевых процессов; построение речевых баз данных);

- методы корпусной лингвистики;

- методы лингвистического аннотирования (орфографическая расшифровка, транскрибирование, паузация с дифференциацией длительности физических пауз, синтаксическое пунктирование (экспериментальная расстановка точек), частеречная и синтаксическая разметка и др.;

- статистические методы обработки данных;

- методы социологического анализа, направленные на получение сбалансированной выборки группы информантов;

- методы психологического тестирования;

- информационные методы построения мультимедийных баз данных;

- методика звукозаписи «одного речевого дня» (аудиомониторинг всей речевой деятельности информантов, принимающих участие в реализации проекта, и их коммуникантов в течение одного или нескольких дней).


Результаты работы


На первом этапе работы по проекту (1-2 кварталы 2009 г.) в соответствии с календарным планом были решены следующие задачи:

1. Разработана методика проведения звукозаписей повседневной речи (организационные, технологические, психологические, социологические, правовые аспекты). Подготовлены инструкции, социологические опросники, психологические анкеты для информантов, а также таблицы для ведения дневника речевого дня и социальных характеристик основных коммуникантов. Результаты анкетирования 30 информантов обработаны и представлены в базе данных.

2. К настоящему времени записано 280 часов звучания, полученные от 35 информантов (15 мужчин и 20 женщин). Звукозаписи переформатированы, убраны длительные (больше 5 минут) шумовые фрагменты, не содержащие речи. Звукозаписи разрезаны на эпизоды по принципу общих условий коммуникации и качества звукозаписи. В результате было получено 686 файлов-эпизодов общей продолжительностью 190 часов. Работа по сбору речевого материала продолжается.

3. Разработана структура речевого корпуса «Один речевой день» (ОРД), состоящая из разных модулей и типов данных: звуковых файлов разных форматов, файлов аннотаций, словарей (частотных, конкордансов), текстовых файлов и др.

4. Подготовлены методики многоуровневого аннотирования данных на лингвистическом и паралингвистическом уровнях. Определены основные типы данных лингвистической разметки, их структурно-системная иерархия. Определены правила членения материала на фонетическом, лексическом, грамматическом уровнях.

5. Осуществлена расшифровка 9 часов звукозаписей и их многоуровневое аннотирование в профессиональной программе ELAN.

6. Разработан действующий макет специализированной базы данных речевого корпуса в формате MS Access, объединяющей все типы релевантной информации от описания информантов до расшифровок записей. Из среды базы данных возможно прослушивание всех 190 часов звучания - отформатированных ord-файлов, а также отдельных фраз и слов для тех файлов, которые были соответствующим образом рассегментированы (381 фраза, 2509 слов).

7. Параллельно с созданием корпуса начато исследованию особенностей фонетики и грамматики повседневной речи в зависимости от таких факторов, как социально-психологические особенности говорящего. Продолжается многоуровневая разметка данных и создание комплекса утилит для обработки аннотированных данных.


Основные конструктивные, технологические и технико-эксплуатационные характеристики

Речевой материал: 190 часов звучания, 686 файлов, формат WAV, 22050 Гц, 16 бит, моно.

Файлы аннотации: 9 часов звучания, 37 файлов, формат EAF, 8 уровней сегментации, 50000 словоупотреблений.

Сегментация на слова: 40 минут звучания, 2 файла, формат EAF, 2500 слов.

База данных: формат MS Access 2003, 13 основных таблиц, возможность озвучивания как всех файлов речевого корпуса, так и изолированно отсегментированных единиц (фраз, слов, морфем).


Степень внедрения. Итоги внедрения результатов НИР

По мере обработки материал поступает в Национальный корпус русского языка, где представлен в подкорпусе "Устный корпус. Из материалов корпуса "Один речевой день", подготовленного группой А.С.Асиновского". В НКРЯ уже переданы тексты расшифровок объемом 40000 словоупотреблений.

Звуковой корпус используется как образец на занятиях по спецкурсу «Полевая лингвистика», читаемому на факультете филологии и искусств СПбГУ. На речевом материале корпуса проводятся практические занятия по фонетике и грамматике русского языка для студентов, осуществляются исследования в рамках курсовых, дипломных, кандидатских и докторских научных работ.

Область применения

Важность и актуальность реализации предлагаемого проекта определяется прежде всего высокой практической значимостью адекватного описания речевого поведения человека в реальном мире и все возрастающей востребованностью современных систем сбора, хранения и анализа речевого материала как для решения фундаментальных научных задач, так и для решения актуальных прикладных задач в области речевых технологий. Среди них:

1) собственно лингвистические исследования:

- описание звуковой формы выявляемых в речи грамматических единиц;

- создание лексикографического описания бытовой спонтанной звучащей речи;

- описание дистрибуции грамматических классов слов и их форм в устной речи разных социальных групп;

2) лингводидактика:

- обучение русскому языку нерусских;

- изучение грамматики речи в русской филологической аудитории;

3) прикладная лингвистика, речевые технологии:

- решение задач обработки естественного языка/речи;

- решение задач интегрального моделирования звуковой формы,

- синтез и распознавание речи.

Экономическая эффективность или значимость работы

. Экономическая значимость работы определяется уникальностью разрабатываемого продукта – речевого корпуса повседневной речи, использование которого может быть востребовано в самых разных областях от решения образовательных и фундаментальных научных задач до внедрения в практику (напр., для отладки телекоммуникационных систем, развития информационных и речевых технологий, решения задач судебной и криминальной фонетики и т. п.).

Прогнозные предположения о развитии объекта исследования

На втором этапе работы (3-4 кварталы 2009г.) по теме «Звуковое описание грамматических единиц русского языка: информационно-коммуникативный подход» планируется решение следующих задач:

- запись по методике ОРД как минимум 5 информантов,

- работа по расшифровке, многоуровневой разметке и аннотированию звукозаписей, получению реальной фонетической транскрипции, заполнению базы данных, созданию программ обработки аннотированного материала,

- продолжится исследование по выявлению в речи говорящих лексико-грамматических, синтаксических, прагматических особенностей в зависимости от их собственных психологических и социальных характеристик, а также от их социальной роли в коммуникации.

- будет создан и описан словарь языка повседневного общения, реализован звуковой морфемарий на 1000 морфо-употреблений.

Добавить в свой блог или на сайт

Похожие:

Реферат Отчет 563 с., 2 тома., 45 рис., 34 табл., 35 источников, 9 прил iconРеферат Дипломный проект 131 с., 6 рис., 13 табл., 29 источников, 3 прил
Объектом проектирования является аппаратный цех базового электровозоремонтного депо

Реферат Отчет 563 с., 2 тома., 45 рис., 34 табл., 35 источников, 9 прил iconРеферат Дипломный проект 140 с., 6 рис., 18 табл., 20 источников, 2 прил
Объектом разработки дипломного проекта является колесный цех электвозоремонтного депо

Реферат Отчет 563 с., 2 тома., 45 рис., 34 табл., 35 источников, 9 прил iconРеферат Дипломный проект с. 114, рис. 4, табл. 17, источников 15, прил. 4
Целью работы является проектирование основного электровозного депо пассажирских электровозов постоянного тока серии чс

Реферат Отчет 563 с., 2 тома., 45 рис., 34 табл., 35 источников, 9 прил iconРеферат Дипломная работа: 82 с., 6 рис., 10 табл., 37 источников, 8 прил
Маркетинговая деятельность, коммуникационная политика, реклама, стимулирование сбыта, прямой маркетинг, связи с общественностью,...

Реферат Отчет 563 с., 2 тома., 45 рис., 34 табл., 35 источников, 9 прил iconРеферат Дипломная работа: 108 с., 15 рис., 30 табл., 41 источников, 12 прил
Проводниково-кабельная продукция, ассортимент, качество, потребительская оценка, экспертная оценка, статистическое исследование

Реферат Отчет 563 с., 2 тома., 45 рис., 34 табл., 35 источников, 9 прил iconРеферат Работа 100 с., 4 ч., 9 рис., 22 табл., 41 источников, 4 прил
Производственные кооперативы, сельскохозяйственные производственные кооперативы, финансово-экономические показатели деятельности...

Реферат Отчет 563 с., 2 тома., 45 рис., 34 табл., 35 источников, 9 прил iconРеферат Отчет 176 с., 1 кн., 78 рис., 7 табл., 76 источников
Наноразмерные структуры, лазерно–индуцированные процессы, атомная литография, тонкие плёнки, оптоэлектроника, спинтроника, ионика...

Реферат Отчет 563 с., 2 тома., 45 рис., 34 табл., 35 источников, 9 прил iconРеферат в данном дипломном проекте всего: стр. 123, рис. 29, табл. 27, прил. 16, использованных источников 25 назв., чертежей и плакатов 8 листов
Тяговая подстанция, распределительное устройство, трансформатор, ток короткого замыкания, преобразовательный агрегат, стуктурная...

Реферат Отчет 563 с., 2 тома., 45 рис., 34 табл., 35 источников, 9 прил iconРеферат Отчет 17 с., 1 табл., 4 рис., 7 источников
Одним из основных процессов в первичной переработке нефти является ее промысловая подготовка, т е извлечение из нефти нежелательных...

Реферат Отчет 563 с., 2 тома., 45 рис., 34 табл., 35 источников, 9 прил iconДипломная работа 135 с., 7 рис., 37 табл., 11 источников, 2 прил., 5 л графического материала. Финансовый анализ, финансовая стабилизация, повышение эффективности,
Авторское выполнение научных работ на заказ. Контроль плагиата, скидки, гарантии, прямое общение с


Разместите кнопку на своём сайте:
lib.convdocs.org


База данных защищена авторским правом ©lib.convdocs.org 2012
обратиться к администрации
lib.convdocs.org
Главная страница