Добыча знаний и управление ими

Набор инструментальных средств MineSet состоит из 3 основных модулей:

- управляющего модуля. Он включает в себя графический интерфейс пользователя, который называется Tool Manager, и базирующийся на сервере процесс - DataMover;

- модуля аналитического Data Mining, находящегося на сервере и имеющего четыре интеллектуальных инструмента;

- модуля визуального Data Mining, находящегося н

а клиентской машине и состоящего из пяти инструментов.

Менеджер инструментов (Tool Manager) предоставляет интерактивный графический интерфейс, с помощью которого пользователь получает доступ ко всем возможностям и инструментам MineSet в единой интегрированной среде. С его помощью пользователь получает доступ к данным.

Процесс DataMover осуществляет доступ к данным, производит их выборку и преобразования, инициализирует работу запускаемых на сервере инструментов аналитического data mining и возвращает данные на клиентскую станцию для распределения их по визуальным инструментам.

К инструментам аналитического Data Mining относят четыре взаимодополняющих инструмента аналитической добычи данных, основанных на методах искусственного интеллекта с использованием машинного обучения. Это Генератор ассоциативных связей (Association Rule Generator), Генератор Дерева решений (Decision Tree Inducer), Генератор свидетельств (Evidence Inducer) и утилита определения Значимости признаков (Column Importance).

MineSet содержит пять инструментов для визуального Data Mining, позволяющих выполнять интерактивное визуальное представление и исследование данных. Это Ландшафтный визуализатор (Map Visual-izer), Визуализатор дисперсии (Scatter Visualizer), Визуализатор деревьев (Tree Visualizer), Визуализатор правил (Rule Visualizer) и Визуализатор свидетельств (Evidence Visualizer).

6. DataMining в Бизнесе

С помощью Data Mining предприятия розничной торговли могут выполнять анализ покупательской корзины, знание которой необходимо для улучшения рекламы, выработки стратегии создания запасов товаров и способов их раскладки в торговых залах. Исследование временных шаблонов помогает торговым предприятиям принимать решения о создании товарных запасов, а создание прогнозирующих моделей дает возможность торговым предприятиям узнавать характер потребностей различных категорий клиентов с определенным поведением.

Достижения технологии Data Mining в банковском деле позволят выявлять мошенничество с кредитными карточками, сегментировать клиентов по категориям, а также прогнозировать изменения клиентуры.

В области телекоммуникаций методы Data Mining помогают компаниям более энергично продвигать свои программы маркетинга и ценообразования (анализ записей о подробных характеристиках вызовов и выявление лояльности клиентов).

Data Mining может применяться во множестве других областей. Например, в автомобильной промышленности при сборке автомобилей производители должны учитывать требования каждого отдельного клиента, поэтому нужна возможность прогнозирования популярности определенных характеристик и знание того, какие характеристики обычно заказываются вместе. Авиакомпании могут выявлять клиентов, которых поощрительными мерами можно побудить летать больше.

7. Крупнейшая онлайновая сеть научной и технической информации

Общепризнанным источником научной и технической информации является международная сеть научной и технической информации STN International (Scientific & Technical Information Network). Она находится в совместном управлении германского Специализированного информационного центра ФИЦ Карлсруэ (Fachinformationszentrum (FIZ) Karlsruhe), Реферативной службы по химии Американского химического общества (Chemical Abstracts Service (CAS), American Chemical Society) и Информационного центра по науке и технике Японской научно-технической корпорации (Information Center for Science and Technology (JICST), Japan Science and Technology Corporation). В настоящее время сеть STN International обеспечивает онлайновый доступ к более чем 200 базам данных во всех областях науки и техники (см. табл. 1).

После нахождения нужных публикаций или документов можно заказать их полные тексты, используя систему автоматизированной доставки через Интернет - FIZ AutoDoc/ChemPort. Многие известные международные библиотеки и издательства уже сегодня связаны с системой FIZ AutoDoc/ChemPort, и их численность постоянно увеличивается.

Чтобы иметь доступ к FIZ AutoDoc, необходимо зарегистрироваться, получить идентификатор для подключения и пароль (www.fiz-karlsruhe.de/autodoc).

Таблица 1.Наиболее крупные базы данных STN

Базы данных

Количество документов, млн.

BEILSTEIN

7,7

BIOSIS

12,0

CA/CAPLUS

16,1

COMPENDEX

4,4

EMBASE

8,0

INPADOC

30,0

INSPEC

6,5

INVESTEXT

9,4

JAPIO

6,3

MEDLINE

11,0

PROMT

7,9

REGISTRY

23,3

SCISEARCH

17,7

WORLDCAT

41,0

WPINDEX

9,5

8. Управление знаниями

8.1 Технологические основы

Современные сферы применения компьютеров и информационных технологий можно разделить на три уровня:

- Computation - выполнение вычислений;

- Communication - это, прежде всего, Интернет и все, что с ней связано;

- Cognition - еще только зарождающийся уровень, ориентированный на поддержку интеллектуальной деятельности и знаний.

Сегодня достаточно хорошо освоены и проработаны два первых уровня. Именно для них разработаны основные технологии, поддерживающие управление знаниями:

- добыча данных и текстов (Data mining, Text Mining) - распознавание образов, выделение значимых закономерностей из данных, находящихся в хранилищах или входных или выходных потоках;

- системы управления документооборотом (Document management) - хранение, архивирование, индексирование, разметка и публикация документов;

- средства для организации совместной работы (Collaboration) - сети intranet, технологии групповой работы, синхронные и асинхронные конференции;

Страница:  1  2  3  4  5 


Другие рефераты на тему «Программирование, компьютеры и кибернетика»:

Поиск рефератов

Последние рефераты раздела

Copyright © 2010-2024 - www.refsru.com - рефераты, курсовые и дипломные работы