Nie uczestniczyłem nigdy w całym procesie projektowania hurtownii danych i zastanawiam się jak w praktyce wygląda wybór architektury? Z reguły chyba rzadko ma się do czynienia z podręcznikowymi przykładami jak płatek śniegu gdzie wymiar czasu rozbija się na miesiąc, kwartał, rok? Wg mnie moich obserwacji najczęściej tabele wymiarów pełnią rolę słowników, a tabele faktów są uzupełniane wartości numerycznymi, ilościowymi itp. Może polecić materiały, które na praktycznych przykładach pokazują problemy związane z projektowanie hurtowni?
@seelk tyle hurtowni już widziałem (pod BI), a chyba żadna nie miała książkowo porozbijanych wymiarów. Zwykle była gwiazda lub mix. Wybór często zależy od samych danych oraz od bazy danych w której będzie to składowane. Przypomnij się po weekendzie to prześle Ci trochę materiałów
@seelk: Ralph Kimball, Margy Ross - The Data Warehouse Toolkit Chyba najlepsza z możliwych (faktyczne przykłady, a nie jakieś wynurzenia teoretyków) i widzę, że już została podana przez @futu
Trochę poczytałem w tzw. międzyczasie o projektowaniu hurtowni i pytanie czy faktycznie w tabelach faktowych nie ma żadnych dat (np. created_date) tylko wszystkie odnosza się do tabeli z wymiarem daty i są tylko same miary (np. kwota, ilość, wartość) czy to jest taki wyidealizowany przykład, a w rzeczywistości wrzuca się tam też pojedyńcze wymiary?
@seelk: podobnie u mnie, jeśli jest taka potrzeba to są (np. jako 20180813), a później masz tabelę z wymiarem daty która pomaga ją zinterpretować (do zwykłego znaczenia dodaje biznesowe jak np. kwartał fiskalny itd)
Wg "klasycznego BI" w modelu multidimensional nie powinieneś mieć wymiarów w tabelach faktów. Od 2016 popularniejszy i bardziej dev friendly staje sie tabular model i tam są kolumny wymiarów w tabelach faktów, a wymiary takie sensu stricto pomagają w strukturze i interpretacji. (PowerBI ma nawet domyślny wymiar "time Intelligence")
Może polecić materiały, które na praktycznych przykładach pokazują problemy związane z projektowanie hurtowni?
#bi #etl #businessintelligence #bazydanych
Przypomnij się po weekendzie to prześle Ci trochę materiałów
Chyba najlepsza z możliwych (faktyczne przykłady, a nie jakieś wynurzenia teoretyków) i widzę, że już została podana przez @futu
Trochę poczytałem w tzw. międzyczasie o projektowaniu hurtowni i pytanie czy faktycznie w tabelach faktowych nie ma żadnych dat (np. created_date) tylko wszystkie odnosza się do tabeli z wymiarem daty i są tylko same miary (np. kwota, ilość, wartość) czy to jest taki wyidealizowany przykład, a w rzeczywistości wrzuca się tam też pojedyńcze wymiary?
wołam też @beefislife, @tony_rogalik bo może będą znać odp