Metoda Najmniej kwadratów jest to jedna z najważniejszych aplikacji w przybliżaniu funkcji. Chodzi o to, aby znaleźć taką krzywą, że biorąc pod uwagę zestaw uporządkowanych par, funkcja ta najlepiej aproksymuje dane. Funkcja może być linią, krzywą kwadratową, sześcienną itp..
Idea metody polega na zminimalizowaniu sumy kwadratów różnic rzędnych (składowa Y) między punktami generowanymi przez wybraną funkcję a punktami należącymi do zbioru danych.
Indeks artykułów
Przed podaniem metody musimy najpierw wyjaśnić, co oznacza „lepsze podejście”. Załóżmy, że szukamy linii y = b + mx, czyli tej, która najlepiej reprezentuje zbiór n punktów, a mianowicie (x1, y1), (x2, y2)…, (xn, yn).
Jak pokazano na poprzednim rysunku, gdyby zmienne xiy były powiązane linią y = b + mx, to dla x = x1 odpowiadająca jej wartość y wyniosłaby b + mx1. Jednak ta wartość różni się od prawdziwej wartości y, która wynosi y = y1.
Pamiętaj, że w płaszczyźnie odległość między dwoma punktami jest określona wzorem:
Mając to na uwadze, aby określić sposób wyboru linii y = b + mx, która najlepiej przybliża podane dane, logiczne wydaje się użycie jako kryterium wyboru linii, która minimalizuje sumę kwadratów odległości między punkty i prosta.
Ponieważ odległość między punktami (x1, y1) i (x1, b + mx1) wynosi y1- (b + mx1), nasz problem sprowadza się do znalezienia liczb m i b takich, że następująca suma jest minimalna:
Linia spełniająca ten warunek jest nazywana „przybliżeniem linii najmniejszych kwadratów do punktów (x1, y1), (x2, y2), ..., (xn, yn)”.
Po rozwiązaniu problemu pozostaje tylko wybrać metodę znalezienia przybliżenia metodą najmniejszych kwadratów. Gdyby wszystkie punkty (x1, y1), (x2, y2),…, (xn, yn) znajdowały się na linii y = mx + b, to mielibyśmy współliniowe y:
W tym wyrażeniu:
Wreszcie, jeśli punkty nie są współliniowe, to y-Au = 0 i problem można przełożyć na znalezienie wektora u takiego, że norma euklidesowa jest minimalna.
Znalezienie minimalizującego wektora u nie jest tak trudne, jak mogłoby się wydawać. Ponieważ A jest macierzą nx2, a u jest macierzą 2 × 1, mamy, że wektor Au jest wektorem w Rn y należy do obrazu A, który jest podprzestrzenią R.n o wymiarze nie większym niż dwa.
Przyjmiemy, że n = 3, aby pokazać, jaką procedurę należy zastosować. Jeśli n = 3, obrazem A będzie płaszczyzna lub linia przechodząca przez początek.
Niech v będzie wektorem minimalizującym. Na rysunku widzimy, że y-Au jest zminimalizowane, gdy jest prostopadłe do obrazu A. To znaczy, jeśli v jest wektorem minimalizującym, to zdarza się, że:
Następnie możemy to wyrazić w następujący sposób:
Może się to zdarzyć tylko wtedy, gdy:
Wreszcie, rozwiązując v, mamy:
Jest to możliwe, ponieważ AtA jest odwracalne, o ile n punktów podanych jako dane nie jest współliniowych.
Teraz, gdybyśmy zamiast szukać linii, chcielibyśmy znaleźć parabolę (której wyrażenie miałoby postać y = a + bx + cxdwa), które byłoby lepszym przybliżeniem n punktów danych, procedura byłaby taka, jak opisano poniżej.
Gdyby n punktów danych znajdowało się we wspomnianej paraboli, mielibyśmy:
Później:
Podobnie możemy napisać y = Au. Jeśli wszystkie punkty nie znajdują się w paraboli, mamy, że y-Au jest różne od zera dla dowolnego wektora u i nasz problem jest taki: znajdź wektor u w R3 taki, że jego norma || y-Au || być tak mały, jak to tylko możliwe.
Powtarzając poprzednią procedurę, możemy dojść do wniosku, że poszukiwany wektor to:
Znajdź linię, która najlepiej pasuje do punktów (1,4), (-2,5), (3, -1) i (4,1).
Musimy:
Później:
Dlatego dochodzimy do wniosku, że linia, która najlepiej pasuje do punktów, jest określona wzorem:
Załóżmy, że upuszczono obiekt z wysokości 200 m. W miarę jak spada, podejmowane są następujące kroki:
Wiemy, że wysokość wspomnianego obiektu, po upływie czasu t, jest wyrażona wzorem:
Gdybyśmy chcieli otrzymać wartość g, możemy poszukać paraboli, która jest lepszym przybliżeniem pięciu punktów podanych w tabeli, a tym samym mielibyśmy współczynnik, który towarzyszy tdwa będzie rozsądnym przybliżeniem do (-1/2) g, jeśli pomiary są dokładne.
Musimy:
I później:
Zatem punkty danych są dopasowane przez następujące wyrażenie kwadratowe:
Musisz więc:
Jest to wartość dość bliska poprawnej, która wynosi g = 9,81 m / sdwa. Aby uzyskać dokładniejsze przybliżenie g, należałoby zacząć od dokładniejszych obserwacji.
W problemach, które pojawiają się w naukach przyrodniczych lub społecznych, wygodnie jest zapisać relacje, które istnieją między różnymi zmiennymi za pomocą jakiegoś wyrażenia matematycznego.
Na przykład w ekonomii możemy powiązać koszt (C), dochód (I) i zyski (U) za pomocą prostego wzoru:
W fizyce możemy powiązać przyspieszenie wywołane grawitacją, czas upadku obiektu i wysokość obiektu zgodnie z prawem:
W poprzednim wyrażeniu slub jest początkową wysokością wspomnianego obiektu i vlub jest jego prędkością początkową.
Jednak znalezienie takich formuł nie jest łatwym zadaniem; zwykle do dyżurnego profesjonalisty należy praca z dużą ilością danych i wielokrotne wykonywanie kilku eksperymentów (w celu sprawdzenia, czy uzyskane wyniki są stałe) w celu znalezienia zależności między różnymi danymi.
Powszechnym sposobem osiągnięcia tego jest przedstawienie danych uzyskanych na płaszczyźnie jako punktów i poszukiwanie funkcji ciągłej, która optymalnie przybliża te punkty..
Jednym ze sposobów znalezienia funkcji, która „najlepiej przybliża” dane dane, jest metoda najmniejszych kwadratów..
Ponadto, jak widzieliśmy również w ćwiczeniu, dzięki tej metodzie możemy uzyskać dość bliskie przybliżenia do stałych fizycznych.
Jeszcze bez komentarzy