- На основе системного анализа процесса обработки библиографических текстовых документов предложен критерий, учитывающий требования к процедурам выявления информативных терминов, обучения и классификации по точности, быстродействию, ресурсозатратам; построена модель процесса, имеющая модульную структуру, что позволяет оценить влияние различных этапов обработки и анализа библиографических данных на значение целевого критерия.
- Проведена систематизация процедур выявления информативных терминов и методов классификации текстовых данных, сформулированы рекомендации по их использованию. Построена классификационная матрица, которая позволяет осуществлять обоснованный выбор процедур выявления информативных терминов и методов классификации, исходя из требований к точности, быстродействию и ресурсозатратам.
- Разработано три новых метода классификации библиографических текстовых документов (модифицированный метод ближайшего соседа, обобщенный метод
- ближайшего соседа и метод MI- профилей). Адаптированы метод % - профилей и метод Q - профилей для решения задач классификации библиографических текстовых документов. Даны рекомендации по выбору настраиваемых параметров в предложенных алгоритмах.
- Получены оценки вычислительной сложности для разработанных и адаптированных методов на стадиях обучения и классификации. Показано, что при классификации текстовых документов предложенные методы обеспечивают более высокое быстродействие по сравнению с известными процедурами.
- Сформулированы требования к простым классификаторам. Разработана и обоснована процедура синтеза высокоточных, быстродействующих и малозатратных КРП на основе простых классификаторов для обработки и анализа библиографических текстовых документов.
- На основе предложенной процедуры проведен синтез двух новых коллективов решающих правил, состоящих из простых классификаторов. Синтезированные КРП состоят как из известных процедур, так и из методов классификации, разработанных в ходе выполнения диссертации. Экспериментально показано, что сформированные КРП имеют меньшую ошибку по сравнению с известными индивидуальными классификаторами.
- Рассчитаны оценки вычислительной сложности синтезированных КРП. Показано, что их быстродействие существенно превышает быстродействие метода к-ближайших соседей.
- Разработана оригинальная процедура выявления тематических журналов по заданным пользователем предметным областям. Данная процедура позволяет организовать автоматизированный мониторинг информационных ресурсов и получение релевантных научных публикаций, соответствующих потребностям пользователя.
2.Толчеев В.О. Современные методы обработки и анализа текстовой информации. Учебное пособие. М.: Изд-во МЭИ, 2006 — 75с.
3.Толчеев В.О. Синтез коллективов решающих правил для проведения классифи¬кации текстовых документов. Информационные технологии, №10, 2007, с. -32¬38.
4.Толчеев В.О. Комплексный подход к классификации текстовых документов. Ав-томатизация и современные технологии, №8, 2005, с. 39-45.
5.Толчеев В.О. Анализ точностных характеристик модифицированного метода ближайшего соседа. Информационные технологии, №4, 2006, с. 52-58.
6.Толчеев В.О. Модели и методы классификации текстовой информации. Ин-формационные технологии, №5, 2004, с. 6-14.
7.Толчеев В.О. Методы выявления информативных признаков в задаче классифи¬кации текстовых документов. Информационные технологии, №8, 2005, с. 14-21.
8.Толчеев В.О. Взвешенные и редуцированные методы ближайшего соседа. Вест¬ник МЭИ, №5, 2005, с. 84-90.
9.Толчеев В.О. Обзор методов классификации текстовых документов. Автомати¬зация и современные технологии, №10, 2005, с. 28-33.
10.Некрасов И.В., Толчеев В.О. Модифицированный метод ближайшего соседа с использованием опорных точек для классификации текстовых документов. Вестник МЭИ, №1, 2004, стр. 76-81.
11.Мальцев П.П., Стяжкин В.Б., Толчеев В.О. Об опыте использования методики выявления тематических журналов. Информационные технологии, №7, 2007, с.
65-71.
12.Некрасов И.В., Толчеев В.О. Построение модели представления библиографиче¬ского документа. Информационные технологии, №11, 2005, с. 57-63.
13.Некрасов И.В., Толчеев В.О. Современные средства поиска, обработки и анализа текстовой информации. Вестник МЭИ, №1, 2002, стр. 52-55.
14.Толчеев В.О. Функциональные возможности и области применения интеллек-туальных агентов и многоагентных систем. Микросистемная техника, №4,
2002, с. 10-15.
15.Толчеев В.О. О новых подходах к разработке сложных интеллектуальных сис¬тем. Микросистемная техника, №2, 2002, с. 24-28.
16.Колосов О.С., Анисимов Д.Н., Толчеев В.О., Ягодкина Т.В., Гришин В.И., Спи¬ридонов Д.К. Итоги работ в области идентификации на кафедре управления и информатики МЭИ. Приборы и системы, №8, 2001, с. 22-29.
17.Толчеев В.О. Методика синтеза коллективов решающих правил на основе "про¬стых" классификаторов. Международная конференция Информационные средства и технологии. Том 2. МЭИ. Изд-во «Станкин», 2006, стр. 150-154.
18.Толчеев В.О. Формирование быстродействующих коллективов решающих правил. Международная конференция "Современные технологии в задачах управления, ав¬томатики и обработки информации". Алушта. Изд-во МИФИ, 2006, с. 338.
19.Толчеев В.О. Расчет верхней точностной границы для коллективов решающих пра¬вил, использующих простое голосование. Международная конференция "Современ¬ные технологии в задачах управления, автоматики и обработки информации". Алуш¬та. Изд-во Тульского государственного университета, 2007, с. 282-283.
20.Толчеев В.О. Исследование зависимости между точностью и разнородностью в коллективах решающих правил с помощью имитационного моделирования. Между¬народная конференция "Информационные средства и технологии" том 2. МЭИ. Изд-во «Станкин», 2007, с. 91 -93.
21.Толчеев В.О. Обобщенный метод ближайшего соседа. Международная конферен¬ция "Информационные средства и технологии" том 2. МЭИ. Изд-во «Станкин», 2005,
стр. 183-185.
22.Кокорев П.В., Толчеев В.О. Улучшенный критерий взаимной информации для клас-сификации текстовых документов. Международная конференция "Современные технологии в задачах управления, автоматики и обработки информации". Алушта. Изд-во СГАУ, 2005, с. 293.
23.Кокорев П.В., Толчеев В.О. Разработка метода х2-профилей для классификации текстовых документов. Международная конференция "Современные технологии в задачах управления, автоматики и обработки информации". Алушта. Изд-во МИФИ, 2006, с. 309.
24.Толчеев В.О. Профильные методы классификации библиографических документов. Международная конференция "Современные технологии в задачах управления, ав¬томатики и обработки информации". Алушта. Изд-во СПб. ГУАП, 2008, с.264-265.
25.Толчеев В.О. Методика выявления периодических изданий, наиболее значимых для специалистов. Международная конференция "Информационные средства и техноло¬гии" том 1. МЭИ. Изд-во «Станкин», 1999, с. 187-190.
26.Толчеев В.О. О проведении классификации текстовых документов по их заголовкам. Международная конференция "Современные технологии в задачах управления, ав¬томатики и обработки информации". Алушта. Изд-во МГАПИ, 2002, с. 88-89.
27.Бородкин А.А., Толчеев В.О. Исследование влияния структуры выборки и процедур предварительной обработки на точность классификации текстовой информации. Международная конференция "Информационные средства и технологии". Том 2. МЭИ. Изд-во Станкин, 2007, с. 33-34.
28.Бородкин А.А., Толчеев В.О. Об оценке точностных и временных характеристик методов классификации библиографических текстовых документов. Научная сессия МИФИ 2008. Том 11. М. МИФИ, 2008, стр. 152-153.
29.Некрасов И.В., Толчеев В.О. Разработка программного комплекса для классифика¬ции текстовых документов. Международная конференция "Информационные сред¬ства и технологии" том 2. МЭИ. Изд-во «Станкин», 2002, с. 160-163.
30.Бородкин А.А., Толчеев В.О. Структура и функциональные возможности учебно-исследовательского программного комплекса. Международная конференция "Ин-формационные средства и технологии" том 3. МЭИ. Изд-во «Станкин», 2008, с.85-87.
31.Кульга Д.В., Толчеев В.О., Филимонов Н.Б. Построение и анализ терминологического портрета журнала «Информационные технологии». Международная конференция "Информационные средства и технологии" том 3. МЭИ. Изд-во «Станкин», 2008, с. 104-105.
32.Некрасов И.В., Толчеев В.О. Экспериментальные исследования методов классификации текстовых документов. Научная сессия МИФИ 2005. М. МИФИ, 2005, стр. 152-153.
33.Зенкина Ю.И., Толчеев В.О. Разработка программного комплекса для отбора те-матических изданий и публикаций в области информатики. Алушта. Изд-во Туль¬ского государственного университета, 2007, с. 256-257.
34.Некрасов И.В., Толчеев В.О. Информационно-поисковая система для обработки на-учно-технической информации. Международная конференция "Информационные средства и технологии" том 1. МЭИ. Изд-во «Станкин», 2001, с. 114-117.