Проектирование UML для анализа данных агрегированных данных опроса

Проектирование UML для анализа данных агрегированных данных опроса
Проектирование UML для анализа данных агрегированных данных опроса

Я могу представить себе два способа использования UML в аналитике:

  • Моделирование исследуемой области (дома, больницы, граждане, ...), чтобы лучше понять взаимосвязи между различными понятиями.

    Это может быть полезно при разработке опроса, чтобы найти вопросы, которые лучше всего помогут отразить ситуацию. Это также может помочь в анализе для интерпретации косвенных корреляций (например, статистика по домам, которая может дать некоторые подсказки о владельцах, которые затем могут быть объединены с другими элементами о владельце).

  • Моделирование области результатов опроса (т.е. таблиц, которые у вас есть), чтобы лучше понять таблицы и их взаимосвязи.

    Это может помочь вам в разработке системы, которая манипулирует имеющимися данными и вычисляет дальнейшие результаты и извлекает новую информацию.

Учитывая ваше задание, вас должен заинтересовать второй подход. В этом случае "Удовлетворенность", "Автомобиль", "Поездка" и "Безопасность" могут быть кандидатами в класс, но только если эти элементы так или иначе идентифицированы в исходных данных.

Вы можете попробовать следующий структурированный подход:

  1. Начните с инвентаризации таблиц и их полей
  2. Определите общие черты между таблицами (общие поля или общие понятия) - Например, "Наличие автомобиля" и "Наличие автомобиля по удовлетворенности жизнью", возможно, имеют общее понятие владения автомобилем.
  3. Проверьте, не объединяет ли какая-либо таблица независимые данные и должна ли она рассматриваться как объединение двух таблиц (например, если у вас есть анонимизированный идентификатор владельца и анонимизированный идентификатор автомобиля, вам, возможно, придется разделить данные, относящиеся к автомобилю, и данные, относящиеся к владельцу).
  4. Это должно позволить выделить "классы" (в смысле "классификатора", а не обязательно объектно-ориентированные классы) со свойствами (полями) и их ассоциации (т.е. набор общих полей, позволяющих сделать вывод, что речь идет о связанных ключевых фигурах).

Это позволит получить первую модель. Затем вы можете сопоставить таблицы и поля с классами и свойствами и начать разработку аналитического программного обеспечения со способом однозначного заполнения классов.

Рекомендую посмотреть эти видео для лучшего погружения в вопрос:

Прикрепленное видео 1 - Анна Вичугова - Практическое использование DFD: как описать движение данных в бизнес-процессах?

Прикрепленное видео 2 - Что такое data warehouse со стороны аналитика?


LetsCodeIt, 18 января 2023 г., 06:48