Back to Blog

Statystyki dziesiątego tygodnia DSP

08 May 2016

Jutro kończy się dziesiąty tydzień konkursu, a więc teoretycznie ostatni potrzebny do spełnienia warunków regulaminu, przy założeniu, że ktoś nie wziął sobie w międzyczasie “dziekanki”. A ja, tak jak obiecałem, znów powracam ze statystykami projektów i blogów Daj Się Poznać. Tym razem w nowej, ulepszonej odsłonie, którą opublikowałem tutaj.

Statistcs

Na stronie podzielonej na dwie części zebrałem informacje o blog postach oraz o tym, co działo się na GitHubie. Zasadniczo wykresy zdają się potwierdzać to, co było już trochę widać miesiąc temu, czyli trend spadkowy oraz niedzielne maratony. Na górnym wykresie można zawęzić przedział czasu, jaki nas interesuje, co spowoduje odświeżenie wszystkich liczników z uwzględnieniem tego zaznaczonego zakresu. Dzięki temu można prześledzić to, jak zmieniały się te wskaźniki tydzień po tygodniu.

Jeśli chodzi o statystyki blogów, to dotyczą one, jak poprzednio, wszystkich publikowanych postów, a nie tylko tych związanych z konkursem. Dane zostały zebrane w sobotę, 7 maja. Zaktualizuję je jeszcze raz po zakończeniu konkursu.

Jest to na razie pierwsza wersja strony statystyk DSP. W przyszłości chciałbym ją wzbogacić o analogiczne agregaty, jakie otrzymałem po pierwszym tygodniu oraz listy najbardziej aktywnych projektów/blogów, podobnej do tej z kwietniowego posta.

D3 i Crossfilter

Skrypt grafu przelicza jednocześnie cztery agregacje dla ponad 8 tysięcy elementów przy każdej zmianie zakresu dat. Gdy dodam jeszcze inne wykresy, czy tabelę z rankingiem oraz odświeżę dane na koniec konkursu, ilość liczb do skalkulowania jeszcze się zwiększy. Dobrą wydajność zapewnia tutaj map-reduce, na którym bazuje biblioteka crossfilter. Ta mała biblioteczka, w której macał palce również autor D3, Mike Bostock, stworzona jest z myślą o przetwarzaniu (stosunkowo) dużej ilości danych w przeglądarce. I jest w stanie “łyknąć” nawet więcej niż te 8k wierszy. Crossfilter i D3 pasują do siebie jak barbie i ken, to połączenie świetnie nadaje się przede wszystkim do tworzenia webowych dashboardów BI dla wielowymiarowych danych.

Skrypt wykresów można podejrzeć tu.