Regresja liniowa

Regresja liniowa

Przykładowe okno modułu regresji liniowej dla gry Multi Multi

Funkcje modułu:

1 Wybór gry, której wyniki będą wyświetlone.
2 Button wywołujący obliczenia.
3 Generowanie wykresu obliczeń.
4 Eksport danych do MS Excel.
5 Eksport danych do pliku tekstowego.
6 Wybór zakresu losowań dla którego będą wyświetlone wyniki.
7 Wybór dni tygodnia dla których będą wyświetlone wyniki.
UWAGA: w przypadku Lotto na przestrzeni lat losowania odbywały się w różne dni tygodnia, dlatego możemy zauważyć na przykład możliwość wyboru niedzieli.
8 Wybór godzin dla których będą wyświetlone wyniki.
Tylko dla Multi Multi.
9 Zakres sumowania losowań.
Jeżeli w zakresie naszych zainteresowań są tylko i wyłącznie modele wskazujące na najbliższy numer losowania w którym liczba powinna wystąpić, opcję należy pozostawić niezaznaczoną.
10 Liczba budowanych modeli.
Program umożliwia budowę od 1 do 10 000 funkcji regresji, z których następnie są obliczane wskaźniki oceniające dokładność stworzonych modeli.
UWAGA: im większa liczba modeli, tym bardziej wydłuża się czas wykonywania obliczeń.
11 Wielkość zbioru treningowego.
12 Określenie, czy zbiór treningowy ma być losowany.
13 Wybór liczb podstawowych lub dodatkowych.
Tylko dla gier: Ekstra Pensja, Ekstra Premia, Eurojackpot.

Moduł regresji liniowej zastosowany w programie tworzy model statystyczny i oblicza szacowane wartości numerów losowań w których powinno nastąpić oczekiwane wylosowanie liczby.

W programie umożliwiono obliczanie regresji dla zdarzeń prostych (najbliższy numer losowania w którym przewidywane jest wystąpienie liczby) lub osiągnięcia w zadanym zakresie losowań poziomu wystąpień większego od sumy wartości średniej i jednego odchylenia standardowego.

Kluczowym elementem obliczeń jest dobranie parametrów dotyczących zakresu losowań (6), wielkości zbioru treningowego (11) oraz zakresu sumowania losowań (9).
Zbyt małe wartości tych elementów mogą powodować brak możliwości zbudowania modelu, co może spowodować wyświetlenie stosownej informacji lub zawieszenie programu.

W celu dokonania obliczeń należy określić zakres dotychczasowych losowań branych pod uwagę przy budowie modeli, uwzględniając dni tygodnia i ewentualne godziny (MULTI MULTI);

W przypadku, gdy chcemy obliczyć kiedy liczba osiągnie poziom wystąpień większy od sumy wartości średniej i jednego odchylenia standardowego powinniśmy zaznaczyć opcję "Zakres sumowania losowań" (9) i podać wartość w zakresie 2-1000. Należy zaznaczyć, że sumowanie losowań w małych zakresach (oczekiwany poziom wystąpień jest < 5) daje bardzo słabe wyniki budowanych modeli, ale proponujemy sprawdzić ten element i dobrać samodzielnie parametry.

Wybrany zakres losowań dzielony jest na zbiór "uczący" i zbiór "treningowy".
Na podstawie zbioru uczącego program tworzy model matematyczny, który następnie jest testowany na zbiorze treningowym. KAŻDY MODEL obliczany jest na innym zbiorze uczącym i treningowym (ale z tego samego zakresu losowań). Podziału zakresu losowań na zbiory określamy wybierając procentową "Wielkość zbioru treningowego". Możemy również określić, czy zbiór treningowy powinien zostać wylosowany z całego zakresu losowań, czy stanowić zakres części tylko ostatnich wyników. Przy źle dobranych parametrach może wystąpić wylosowanie zbioru treningowego (pustego), na którym nie będzie można dokonać weryfikacji modelu.

Przykładowe wyniki obliczeń regresji liniowej dla liczb dodatkowych Ekstra Premii.
W tabeli obliczeń regresji liniowej w kolumnach przedstawione zostaną:

Współczynnik R-kwadrat (R2) jest miarą jakości dopasowania modelu. Najlepszy jego możliwy wynik to 1, najniższy to 0.
Dla pojedynczych próbek R2 zwróci wartość nieokreślone lub ujemne, jeśli parametry będą błędnie dobrane!!

Wyniki obliczeń możemy wyeksportować do pliku MS Excel lub pliku tekstowego.
Możemy wygenerować również wykres zawierający wykresy pudełkowe wyników stworzonych modeli.

Przykładowy wykres pudełkowy modeli wskazujących obliczone numery losowań liczb dodatkowych Ekstra Premii.