Сложность моделирования схемы Star

Прежде всего, я прошу прощения за заголовок... Как только кто-то ответит на него, и я пойму, в чем была моя настоящая проблема, я поставлю лучший вариант.

Я создаю таблицу фактов, которая будет измерять количество ресурсов, связанных со школами:

Количество школ
Количество учащихся
Количество сотрудников
Количество компьютеров (для административного использования и для использования учащимися)


FACT_SCHOOL_RESOURCES

Школа (FK)
Местоположение (FK)
Тип образования (FK)
Всего_школ *
Total_Students
Total_Employees
Total_Students_Computers
Total_Administration_Computers< /i>

* в количестве школ каждая строка будет иметь одинаковое значение (1).

Моя проблема в том, что есть некоторые проблемы «инфраструктуры», связанные со школами, которые я не могу указать в качестве одного из ее атрибутов (атрибут под названием «инфраструктура»), потому что существует более одного типа (источник энергии, источник воды). , Утилизация отходов...), и я не могу использовать каждый тип в качестве атрибута, потому что для каждого типа у меня есть отношение «многие ко многим» с моим школьным измерением, например:

Источник питания
Солнечная панель
Генератор
Городское энергоснабжение
...

Утилизация отходов
Захоронение отходов
Сжигание
Переработка
Компостирование
Из отходов в энергию
...

Используя эти примеры, школа может иметь как свалку, так и переработку, поскольку это утилизация отходов или использование городского энергоснабжения и в то же время генератор или солнечные панели.

Все это необходимо, поскольку исследования показывают, что некоторые из этих вопросов (и многие другие, о которых я не упомянул) связаны с «качеством преподавания» и должен быть способ все это проанализировать.

Как лучше всего решить эту проблему в звездообразной схеме? Является ли это возможным?


person LeonardoSibela    schedule 03.07.2015    source источник


Ответы (1)


Я думаю, вы ищете что-то, что выходит за рамки звездной схемы. Если вы хотите провести многовариантный анализ того, какие факторы наиболее сильно коррелируют с какой-либо метрикой (например, качеством преподавания), вам может понадобиться рассмотреть куб.

Считать наличие каждого из типов источника питания и утилизации отходов атрибутом. Возможно, вы можете начать с чего-то такого простого, как бинарные флаги для каждого фактора. Затем вы можете проверить корреляцию между вашей метрикой и вашими факторами с различными срезами в кубе.

person Joel Brown    schedule 04.07.2015
comment
Спасибо за ответ. Кажется, я понимаю, что вы говорите о флагах. Но это будет означать огромную таблицу фактов (потому что, поверьте мне, есть много переменных инфраструктуры) с множеством атрибутов (fk), таких как солнечная панель или переработка, и каждое из этих измерений будет иметь только свой идентификатор и двоичный флаг. чтобы определить, есть ли у них солнечные панели, перерабатывать ли мусор, есть ли генератор...? - person LeonardoSibela; 06.07.2015
comment
Единственное, чего я не понял, это то, что если я создам свою звездную схему, в конце концов, после создания моего семантического слоя, не получится ли у меня куб? Или куб это совсем другое? - person LeonardoSibela; 06.07.2015
comment
Схема @LeonardoSibela Star — это конструкция реляционной базы данных для поддержки доступа к данным в стиле BI/хранилища данных. Вы также можете аппроксимировать куб в реляционной базе данных, однако существуют инструменты, отличные от СУРБД, которые упрощают манипулирование данными в кубах. Все основные поставщики РСУБД поддерживают специализированные базы данных кубов и запросы. В зависимости от вашей платформы вы можете посмотреть, что вам доступно. - person Joel Brown; 06.07.2015