Wpis z mikrobloga

Nie uczestniczyłem nigdy w całym procesie projektowania hurtownii danych i zastanawiam się jak w praktyce wygląda wybór architektury? Z reguły chyba rzadko ma się do czynienia z podręcznikowymi przykładami jak płatek śniegu gdzie wymiar czasu rozbija się na miesiąc, kwartał, rok? Wg mnie moich obserwacji najczęściej tabele wymiarów pełnią rolę słowników, a tabele faktów są uzupełniane wartości numerycznymi, ilościowymi itp.
Może polecić materiały, które na praktycznych przykładach pokazują problemy związane z projektowanie hurtowni?

#bi #etl #businessintelligence #bazydanych
  • 10
@seelk tyle hurtowni już widziałem (pod BI), a chyba żadna nie miała książkowo porozbijanych wymiarów. Zwykle była gwiazda lub mix. Wybór często zależy od samych danych oraz od bazy danych w której będzie to składowane.
Przypomnij się po weekendzie to prześle Ci trochę materiałów
@futu: dzięki!

Trochę poczytałem w tzw. międzyczasie o projektowaniu hurtowni i pytanie czy faktycznie w tabelach faktowych nie ma żadnych dat (np. created_date) tylko wszystkie odnosza się do tabeli z wymiarem daty i są tylko same miary (np. kwota, ilość, wartość) czy to jest taki wyidealizowany przykład, a w rzeczywistości wrzuca się tam też pojedyńcze wymiary?

wołam też @beefislife, @tony_rogalik bo może będą znać odp
@seelk: podobnie u mnie, jeśli jest taka potrzeba to są (np. jako 20180813), a później masz tabelę z wymiarem daty która pomaga ją zinterpretować (do zwykłego znaczenia dodaje biznesowe jak np. kwartał fiskalny itd)
Wg "klasycznego BI" w modelu multidimensional nie powinieneś mieć wymiarów w tabelach faktów. Od 2016 popularniejszy i bardziej dev friendly staje sie tabular model i tam są kolumny wymiarów w tabelach faktów, a wymiary takie sensu stricto pomagają w strukturze i interpretacji. (PowerBI ma nawet domyślny wymiar "time Intelligence")