Опубликован: 11.12.2006 | Доступ: свободный | Студентов: 5363 / 282 | Оценка: 4.42 / 3.86 | Длительность: 57:15:00
Лекция 29:

Использование Microsoft SQL Server Аnalysis Services

Аннотация: Для управления данными, используемыми в оперативной аналитической обработке используется Аnalysis Services. Основной формой представления данных в Аnalysis Services является куб OLAP, что позволяет описывать данные как многомерные системы. Рассматриваются схемы типа "звезда" и "снежинка". Описывается подробное использование Аnalysis Services. Множество полезной информации: скриншоты, описания, пояснения. Различные графики для представления быстродействия.

Microsoft SQL Server 2000 Аnalysis Services (прежнее название OLAP Services) – это компонент SQL Server 2000, предназначенный для оперативной аналитической обработки (OLAP); с помощью этого компонента вы можете получать доступ и извлекать данные вашего склада данных (data warehouse) и рынка данных (data mart). В этой лекции вы узнаете, из каких компонентов состоит Аnalysis Services, как их инсталлировать и как их использовать. Кроме того, вы узнаете об улучшениях Аnalysis Services, включенных в SQL Server 2000. Поскольку эта книга предназначена для администраторов SQL Server, а не разработчиков приложений, здесь рассматриваются только темы инсталляции, конфигурирования и администрирования Аnalysis Services. Темы разработки приложений здесь не рассматриваются.

Примечание. На протяжении всей этой лекции используются термины "склад данных" и "рынок данных". Термин "склад данных" определяется различными способами. Склад данных можно представить себе как хранилище деловых данных, содержащее как накопленные данные, так и текущие данные, получаемые из систем оперативной обработки транзакций какой-либо компании (OLTP). Рынок данных похож на склад данных, но содержит данные, относящиеся только к одному аспекту работы компании. Например, компания может иметь склад данных, содержащий счета кредиторов, счета дебиторов, а также информацию по людским ресурсам, и рынок данных, содержащий только данные по счетам кредиторов. И склады данных, и рынки данных обычно состоят из данных, сконфигурированных в виде схемы, имеющей форму звезды или форму снежинки; обе схемы описываются ниже в этой лекции. Концепции, рассматриваемые в этой лекции, относятся как складам, так и к рынкам данных. Если не указано иначе, для обоих типов баз данных используется термин "склад данных".

Обзор Аnalysis Services

Аnalysis Services – это набор средств (инструментов), помогающий вам в разработке и управлении данными, которые используются в оперативной аналитической обработке. Аnalysis Services состоит из сервера Аnalysis Service, English Query и других поддерживающих компонентов. Сервер Аnalysis Service формирует кубы данных, используемые в многомерном анализе. Термин "куб" используется для описания агрегированных данных. Эти агрегированные (итоговые) данные используются для комплексных аналитических запросов, таких как ежемесячные объемы продаж и прогнозы продаж. (Кубы описаны более подробно в подразделе "Кубы OLAP" далее.)

В многомерном анализе для исследования базы данных с различных точек зрения (размерностей) используется несколько запросов. Рассмотрим один пример. Представим себе базу данных магазина велосипедов, где хранятся данные по продажам за последний год. Один запрос в операции многомерного анализа может использоваться для исследования покупательского спроса. Другой запрос – для получения результатов ежемесячных продаж. Еще один запрос – для исследования продаж определенного велосипеда или компонента. Хотя все запросы используют одни и те же данные, каждый запрос применяется для получения своего аспекта (размерности) по этим данным.

Компоненты Аnalysis Services

Аnalysis Services содержит ряд инструментов и мастеров, которые вы можете использовать для доступа к многомерным данным. Аnalysis Services состоит из следующих компонентов:

  • Аnalysis Manager. Содержит графический пользовательский интерфейс для доступа к таким службам анализа, как создание кубов, управление безопасностью и обзор источников данных.
  • Data Warehousing Framework. Содержит набор компонентов и интерфейсов API, с помощью которых реализуются возможности склада данных SQL Server.
  • Data Transformation Services (DTS). Используется для загрузки и преобразования данных в рынок данных или склад данных. В DTS входят мастер импорта Import Wizard и мастер экспорта Export Wizard, которые позволяют выполнять как перемещение, так и преобразование данных. (Об использовании DTS см. "Загрузка базы данных" )
  • Repository.Содержит ряд интерфейсов, моделей схем баз данных и заранее определенных преобразований данных для включения в Data Warehousing Framework. Поскольку преобразования данных выполняются регулярно, их определения можно сохранять для будущего использования.
  • Data Mining.Содержит алгоритмы для определения и реализации многомерных кубов.
  • English Query. Преобразует вопросы на английском языке в операторы SQL, которые можно применять к базе данных.
  • Extensible Markup Language (XML).Стандартный язык форматирования и представления данных. XML – это ключевой компонент для передачи данных между приложениями, используемый для публикации данных в Internet.

Как вы увидите в данной лекции, эти компоненты совмещаются друг с другом, как элементы головоломки, образуя единый инструмент.

Кубы OLAP

Основной формой представления данных в Аnalysis Services является куб OLAP. Куб является многомерным представлением как подробных, так и итоговых данных. Подробные данные – это конкретные данные строки, в то время как итоговые данные – это агрегированные данные. Кубы разрабатываются на основе аналитических требований, устанавливаемых самими данными. Каждый куб представляет свой бизнес-объект, такой как продажи или материально-производственные запасы. Каждая сторона куба является соответствующим размерностным представлением данных. Иными словами, куб состоит из различных "плоскостей" данных (отсюда название "куб данных").

Кубы Аnalysis Services формируются с использованием одного из двух типов схем баз данных: "звезда" и "снежинка". (Хотя тема формирования схем относится к вопросам разработки, в этой лекции дается краткое описание этих двух типов схем, чтобы вы могли лучше понимать работу Аnalysis Services.) Схемы обоих типов состоят из таблиц фактов и таблиц размерности. Аnalysis Services агрегирует данные в этих таблицах для создания кубов. Рассмотрим этот процесс более подробно.

Таблицы фактов

Таблица фактов (fact table) – это таблица для склада данных (data warehouse), в которой хранятся накопленные данные. Эти накопленные данные являются базовой информацией склада данных. В нашем примере магазина велосипедов эта информация состоит из записи транзакций (транзакций базы данных и транзакций [операций] продаж), которые произошли в магазине велосипедов. В эту запись включаются такие данные, как дата транзакции, тип транзакции, наименование проданного товара, стоимостное выражение транзакции (в долларах), имя покупателя и имя продавца. Эту запись можно использовать как основу для многомерного анализа.

Итак, данные таблицы фактов основываются на бизнес-транзакции (деловой операции). Этой транзакцией может быть продажа какого-либо товара, транзакция с использованием кредитной карты, прибыль и т.д. По сути, в таблицу фактов записывается некоторый тип бизнес-события.

Таблица фактов в складе данных является самой большой таблицей базы данных с наибольшей интенсивностью операций. Как вы понимаете, таблица фактов может содержать миллионы записей и занимать более одного терабайта (1024 гигабайт).

Таблицы размерности

Таблица размерности (dimension table) используется для определения полей в таблице фактов, например, имени продавца, типа транзакции или наименования товара. Этот процесс похож на нормализацию, т.е. разбиение данных на группы для более эффективной обработки. В то время как таблица фактов содержит накапливаемую информацию о транзакциях, таблица размерности содержит информацию, которая используется для извлечения полезного материала из таблицы фактов. Иными словами, таблицы размерности используются для определения "смысла" данных, содержащихся в таблице фактов.

Например, таблица фактов, содержащая записи продаж, может иметь таблицу размерности с информацией о торговых представителях, которая используется для создания таких итоговых данных, как объемы продаж за месяц на одного продавца. Может также использоваться таблица размерности, содержащая региональные данные, которые используются для создания итоговых данных, такие как объем продаж по регионам.

В отличие от таблицы фактов таблицы размерности обычно занимают немного места и содержат лишь несколько строк. Склад данных обычно содержит только одну или две таблицы фактов, но несколько таблиц размерности.

Анатолий Федоров
Анатолий Федоров
Россия, Москва, Московский государственный университет им. М. В. Ломоносова, 1989
Игорь Соловьев
Игорь Соловьев
Россия, Братск