Добыча знаний и управление ими
Набор инструментальных средств MineSet состоит из 3 основных модулей:
- управляющего модуля. Он включает в себя графический интерфейс пользователя, который называется Tool Manager, и базирующийся на сервере процесс - DataMover;
- модуля аналитического Data Mining, находящегося на сервере и имеющего четыре интеллектуальных инструмента;
- модуля визуального Data Mining, находящегося н
а клиентской машине и состоящего из пяти инструментов.
Менеджер инструментов (Tool Manager) предоставляет интерактивный графический интерфейс, с помощью которого пользователь получает доступ ко всем возможностям и инструментам MineSet в единой интегрированной среде. С его помощью пользователь получает доступ к данным.
Процесс DataMover осуществляет доступ к данным, производит их выборку и преобразования, инициализирует работу запускаемых на сервере инструментов аналитического data mining и возвращает данные на клиентскую станцию для распределения их по визуальным инструментам.
К инструментам аналитического Data Mining относят четыре взаимодополняющих инструмента аналитической добычи данных, основанных на методах искусственного интеллекта с использованием машинного обучения. Это Генератор ассоциативных связей (Association Rule Generator), Генератор Дерева решений (Decision Tree Inducer), Генератор свидетельств (Evidence Inducer) и утилита определения Значимости признаков (Column Importance).
MineSet содержит пять инструментов для визуального Data Mining, позволяющих выполнять интерактивное визуальное представление и исследование данных. Это Ландшафтный визуализатор (Map Visual-izer), Визуализатор дисперсии (Scatter Visualizer), Визуализатор деревьев (Tree Visualizer), Визуализатор правил (Rule Visualizer) и Визуализатор свидетельств (Evidence Visualizer).
6. DataMining в Бизнесе
С помощью Data Mining предприятия розничной торговли могут выполнять анализ покупательской корзины, знание которой необходимо для улучшения рекламы, выработки стратегии создания запасов товаров и способов их раскладки в торговых залах. Исследование временных шаблонов помогает торговым предприятиям принимать решения о создании товарных запасов, а создание прогнозирующих моделей дает возможность торговым предприятиям узнавать характер потребностей различных категорий клиентов с определенным поведением.
Достижения технологии Data Mining в банковском деле позволят выявлять мошенничество с кредитными карточками, сегментировать клиентов по категориям, а также прогнозировать изменения клиентуры.
В области телекоммуникаций методы Data Mining помогают компаниям более энергично продвигать свои программы маркетинга и ценообразования (анализ записей о подробных характеристиках вызовов и выявление лояльности клиентов).
Data Mining может применяться во множестве других областей. Например, в автомобильной промышленности при сборке автомобилей производители должны учитывать требования каждого отдельного клиента, поэтому нужна возможность прогнозирования популярности определенных характеристик и знание того, какие характеристики обычно заказываются вместе. Авиакомпании могут выявлять клиентов, которых поощрительными мерами можно побудить летать больше.
7. Крупнейшая онлайновая сеть научной и технической информации
Общепризнанным источником научной и технической информации является международная сеть научной и технической информации STN International (Scientific & Technical Information Network). Она находится в совместном управлении германского Специализированного информационного центра ФИЦ Карлсруэ (Fachinformationszentrum (FIZ) Karlsruhe), Реферативной службы по химии Американского химического общества (Chemical Abstracts Service (CAS), American Chemical Society) и Информационного центра по науке и технике Японской научно-технической корпорации (Information Center for Science and Technology (JICST), Japan Science and Technology Corporation). В настоящее время сеть STN International обеспечивает онлайновый доступ к более чем 200 базам данных во всех областях науки и техники (см. табл. 1).
После нахождения нужных публикаций или документов можно заказать их полные тексты, используя систему автоматизированной доставки через Интернет - FIZ AutoDoc/ChemPort. Многие известные международные библиотеки и издательства уже сегодня связаны с системой FIZ AutoDoc/ChemPort, и их численность постоянно увеличивается.
Чтобы иметь доступ к FIZ AutoDoc, необходимо зарегистрироваться, получить идентификатор для подключения и пароль (www.fiz-karlsruhe.de/autodoc).
Таблица 1.Наиболее крупные базы данных STN
Базы данных |
Количество документов, млн. |
BEILSTEIN |
7,7 |
BIOSIS |
12,0 |
CA/CAPLUS |
16,1 |
COMPENDEX |
4,4 |
EMBASE |
8,0 |
INPADOC |
30,0 |
INSPEC |
6,5 |
INVESTEXT |
9,4 |
JAPIO |
6,3 |
MEDLINE |
11,0 |
PROMT |
7,9 |
REGISTRY |
23,3 |
SCISEARCH |
17,7 |
WORLDCAT |
41,0 |
WPINDEX |
9,5 |
8. Управление знаниями
8.1 Технологические основы
Современные сферы применения компьютеров и информационных технологий можно разделить на три уровня:
- Computation - выполнение вычислений;
- Communication - это, прежде всего, Интернет и все, что с ней связано;
- Cognition - еще только зарождающийся уровень, ориентированный на поддержку интеллектуальной деятельности и знаний.
Сегодня достаточно хорошо освоены и проработаны два первых уровня. Именно для них разработаны основные технологии, поддерживающие управление знаниями:
- добыча данных и текстов (Data mining, Text Mining) - распознавание образов, выделение значимых закономерностей из данных, находящихся в хранилищах или входных или выходных потоках;
- системы управления документооборотом (Document management) - хранение, архивирование, индексирование, разметка и публикация документов;
- средства для организации совместной работы (Collaboration) - сети intranet, технологии групповой работы, синхронные и асинхронные конференции;
Другие рефераты на тему «Программирование, компьютеры и кибернетика»:
Поиск рефератов
Последние рефераты раздела
- Основные этапы объектно-ориентированного проектирования
- Основные структуры языка Java
- Основные принципы разработки графического пользовательского интерфейса
- Основы дискретной математики
- Программное обеспечение системы принятия решений адаптивного робота
- Программное обеспечение
- Проблемы сохранности информации в процессе предпринимательской деятельности