Технологии интеллектуального анализа данных

Реферат

В ходе исследования были рассмотрены технологии интеллектуального анализа данных и их роль в формировании аналитических данных. Студент 423 группы, Шапкин Александр Евгеньевич, провел анализ с привлечением различных методов и алгоритмов, предоставляя важную информацию о преимуществах и возможностях интеллектуального анализа данных в организациях.

Работа включала в себя оценку применения технологий интеллектуального анализа данных, таких как оперативный анализ данных с использованием OLAP-систем, поиск и интеллектуальный выбор данных, деловые интеллектуальные технологии БИС, и интеллектуальный анализ текстовой информации.

Аналитические системы OLAP (On-Line Analytical Processing) были выделены как важный инструмент для анализа больших объемов информации. Эти системы позволяют руководителям принимать обоснованные решения, предоставляя функциональности, такие как агрегирование и детализация данных, анализ деловой информации по различным параметрам и многопроходный анализ информации.

Важными аспектами оказались произвольные срезы данных, выполнение аналитических операций с использованием статистических и других методов, а также согласование данных во времени для использования в прогнозах и трендах.

Исследование подчеркнуло основные требования к приложениям для многомерного анализа, включая необходимость точности, надежности и гибкости в обработке различных видов данных.

Многомерный анализ в области анализа данных

Многомерный анализ — это процесс анализа данных, основанный на работе с многомерными базами данных, которые позволяют представить информацию в многомерном пространстве.

  • Предоставление пользователю результатов анализа за приемлемое время (не более 5 сек.);
  • Осуществление логического и статистического анализа, его сохранение и отображение в доступном для пользователя виде;
  • Многопользовательский доступ к данным;
  • Многомерное представление данных;
  • Возможность обращаться к любой информации независимо от места ее хранения и объема.

Многомерный анализ может быть реализован средствами анализа данных офисных приложений и распределенными системами OLAP-.

20 стр., 9505 слов

Создание хранилища данных

... аналитической обработки данных OLAP, использующая концепцию многомерного представления данных; подсистемы интеллектуального анализа, реализующие методы и алгоритмы Data Mining. 1.1.2 Понятие хранилища данных Технология хранилищ данных предназначена для хранения и анализа больших объемов данных с целью ...

Исходные и аналитические данные могут храниться по разному. Наибольший эффект достигается при использовании многомерных кубов. Рассмотрим на примерах понятие многомерного куба.

Если учесть, что в каждой стране может существовать несколько клиентов, то добавляется четвертое измерение.

Вообще под измерением понимается один из ключей данных, в разрезе которого можно получать, фильтровать, группировать и отражать информацию о фактах. Примеры измерений: страна, клиент, товар, поставщик. Факт — это число, значение. Факты можно суммировать вдоль определенного измерения. Их можно группировать, выполнять над ними другие статистические операции. Агрегатное данное — суммарное, среднее, минимальное, максимальное и другое значение, полученное посредством статистических операций.

В настоящее время применяются три способа хранения многомерных баз данных:

* Системы оперативной аналитической обработки многомерных баз данных MOLAP (многомерные OLAP) — исходные и агрегатные данные хранятся в многомерной базе данных. Многомерные базы данных представляют собой гиперкубы или поликубы. В гиперкубах все измерения имеют одинаковую размерность, В поликубе каждое измерение имеет свою размерность. Многомерная база данных оказывается избыточной, так как она полностью содержит исходные данные реляционных баз.

* Системы оперативной аналитической обработки реляционных баз данных ROLAP (реляционных OLAP) — исходные данные остаются в реляционной базе, агрегатные данные размещаются в кэш той же базы.

Виды хранилищ данных в гибридных системах HOLAP

Сформированный подход HOLAP реализует сбалансированное решение хранения данных. Исходные данные по-прежнему сохраняются в реляционной базе, в то время как агрегатные данные, используемые для многомерного анализа, хранятся непосредственно в многомерной базе данных (MDD).
Это сочетание предоставляет гибкость и производительность, позволяя выполнять современные высокоэффективные аналитические задачи.

Роль клиентских приложений в HOLAP

OLAP функциональность в клиентские приложения предоставляет возможность вычислять агрегатные данные, держа эти данныйие в Кэш-памяти приложения. При таком подходе минимальное количество данных переносится по сети, что повышает быстродействие системы. Примеры такого рода приложений: приложения для обработки статистических данных SEWSS компании StatSoft, или приложение Microsoft Excel обновленных версий.

Серверные OLAP-системы в HOLAP

Серверные OLAP-системы, такие как Oracle Express Server или MS SQL Server 2000 Analysis Services развивают идею дальше сохраняя кэш агрегатных данных на сервере. Это приводит к еще большей оптимизации трафика и времени обслуживания запросов, так как большая часть вычислений производится на сервере.

Хранение данных в HOLAP

Серверные OLAP системы на основе информационных хранилищ предоставляют гибкость в методах хранения данных, поддерживаю все известные способы. Это указывает на их универсальное применение для различных видов аналитических задач.

Выводы

Таким образом, гибридные системы HOLAP представляют собой гибкое и высокопроизводительное решение для оперативной аналитической обработки данных. Использование как клиентских, так и серверных OLAP-систем позволяет оптимизировать процесс анализа данных, повышая при этом производительность и эффективность работы.

6 стр., 2668 слов

Хранилища данных

... обработку больших объемов данных способствовала развитию аналитических систем прогнозирования, идентификации объектов и состояний, оценки и выбора альтернативных решений, встроенных в разные системы, напримерсистемы поддержки принятия решений. Подход построения хранилища данных ... средства оперативного анализа данных [2]. 2. Системы хранения На хранение корпоративных данных компании тратят ...

Интеллектуальные запросы в аналитических системах играют ключевую роль, обеспечивая выдачу агрегатных данных по запросам клиентов. Однако сложность таких систем обусловлена реализацией сложных интеллектуальных запросов, которые осуществляют поиск по условию или алгоритму вычисления ответа. Например, выбор изделий для выпуска с максимальной прибылью требует сложных алгоритмов, особенно при учете различных внутренних и внешних баз данных. Для таких запросов используются непроцедурные языки обращения к многомерным базам данных, такие как MDX, позволяющий формировать запросы и описывать алгоритмы вычислений.

Аналитические данные, полученные из информационных хранилищ, широко применяются в системах поддержки принятия решений. Современные аналитические системы, основанные на информационных хранилищах, обеспечивают полный спектр аналитической обработки, предоставляя доступ к данным посредством транзакций и обеспечивая выдачу аналитических данных по интеллектуальным запросам с помощью OLAP-систем. В отличие от OLTP-систем, которые предназначены для обработки транзакций, OLAP-системы способны обрабатывать данные и предоставлять аналитические ответы и отчеты.

Примером OLAP-системы может служить Brio Query Enterprise корпорации Brio Technology, а также OLAP-средства включенные в системы фирмы 1С, Парус и др. Технологии интеллектуального анализа данных разработаны для поиска скрытых связей в данных с использованием статистических методов корреляции и оптимизации, что обеспечивает выявление взаимозависимостей в данных и предоставление дедуктивной информации для процесса принятия решений.

Раздел 1: Введение

Анализ данных стал неотъемлемой частью современного бизнеса, которая позволяет получать ценные знания и информацию из накопленных данных организации. От того, как эффективно проводится анализ данных, зависит успешность и развитие компании. В связи с этим важным инструментом становится использование технологий интеллектуального анализа данных, которые позволяют автоматизировать и оптимизировать процесс анализа.

Раздел 2: Основные задачи интеллектуального анализа данных

Интеллектуальный анализ данных предоставляет ряд задач и возможностей, позволяющих более глубоко и полно проводить анализ и интерпретацию данных. Вот некоторые из основных задач, которые можно решить с помощью технологий интеллектуального анализа данных:

  • Поиск зависимых данных (реализацию интеллектуальных запросов);
  • Выявление устойчивых бизнес-групп (выявление групп объектов, близких по заданным критериям);
  • Ранжирование важности измерений при классификации объектов для проведения анализа;
  • Прогнозирование бизнес-показателей (например, ожидаемые продажи, спрос);
  • Оценка влияния принимаемых решений на достижение успеха предприятия;
  • Поиск аномалий и т.д.

Технологии интеллектуального анализа данных позволяют наблюдать за текущей информацией с целью поиска отклонений и тенденций без внимания к самим данным. Их применяют для оценки поведения покупателей, корректировки выпуска продукции, изменения ценовой политики и других задач, важных для успеха бизнеса.

Раздел 3: Интеллектуальные деловые технологии БИС

Интеллектуальные деловые технологии БИС (Business Intelligence Services) преобразуют информацию из внутренних и внешних баз данных в интеллектуальный капитал, представленный в виде аналитических данных. Они позволяют искать функциональные и логические закономерности в накопленных данных для принятия обоснованных управленческих решений. Для этого используются технологии информационного хранилища и алгоритмы автоматизации деловых процессов.

5 стр., 2200 слов

Базы данных. Информационные технологии

... годов и ориентировались, прежде всего, на персональные компьютеры, породив новый тип информационной технологии, называемой мультимедиа. Рост популярности технологии гипертекст и компакт-дисков позволяет рассчитывать, что базы данных мультимедиа (интегрирующих аудио-, видео ...

Аналитические данные, полученные с использованием интеллектуальных деловых технологий, предоставляются руководству всех уровней и аналитическим службам организации по запросам в удобной форме.

Раздел 4: Интеллектуальный анализ текстовой информации

Для анализа текстовой информации разработаны структурные аналитические технологии (КПП), которые позволяют глубже обработать неструктурированную информацию. КПП основаны на гипертекстовой технологии, лингвистических процессорах и семантических сетях. Они позволяют интерпретировать содержание текста и устанавливать связи между его фрагментами.

Структурные аналитические технологии предназначены для решения аналитических задач на основе структуризации предварительно отобранной текстовой информации. Они являются важным инструментом создания аналитических докладов, отчетов, статей и заметок, используемых в информационно-аналитических службах организаций, отраслей, государственного управления, СМИ и других сферах деятельности.

Раздел 5: Заключение

Использование технологий интеллектуального анализа данных является необходимостью для современных организаций, которые стремятся улучшить свою эффективность и принимать обоснованные управленческие решения. Такие технологии позволяют проводить более глубокий и полный анализ данных, выявлять тенденции и закономерности, прогнозировать будущие показатели и оценивать влияние принимаемых решений на успех предприятия.

В заключении следует отметить, что развитие технологий интеллектуального анализа данных является важным направлением в сфере информационных технологий, которое будет продолжать развиваться и усовершенствоваться в будущем.

1. http://cyberleninka.ru/article/n/primenenie-tehnologiy-intellektualnogo-analiza-dannyh-v-estestvennonauchnyh-tehnicheskih-i-gumanitarnyh-oblastyah

2.

3. http://studopedia.net/1_47907_tehnologii-intellektualnogo-analiza-dannih.html

4. https://ru.wikipedia.org/wiki/Data_mining

5. http://studme.org/1942100925070/menedzhment/ponyatie_intellektualnom_analize_dannyh