Hoe de som van vierkanten voor fout (sse) te berekenen

De som van vierkante fouten of SSE, is een voorlopige statistische berekening die leidt tot andere gegevenswaarden. Wanneer u een set gegevenswaarden hebt, is het nuttig om te kunnen vinden hoe nauw verwant zijn waarden. U moet uw gegevens in een tabel georganiseerd krijgen en vervolgens een aantal vrij eenvoudige berekeningen uitvoeren. Zodra u de SSE voor een dataset hebt gevonden, kunt u vervolgens doorgaan om de variantie en standaarddeviatie te vinden.

Stappen

Methode 1 van 3:
SSE berekenen met de hand
  1. Titel afbeelding Bereken de som van vierkanten voor fout (SSE) Stap 1
1. Maak een drie kolomtafel. De duidelijkste manier om de som van vierkante fouten te berekenen, begint met een drie kolomtafel. Label de drie kolommen als Waarde{ displaystyle { tekst {waarde}}}{ tekst {waarde}}, Afwijking{ DisplayStyle { Text {Deviation}}}{ tekst {afwijking}}, en Afwijking2{ DisplayStyle { Text {Deviation}} ^ {2}}{ tekst {afwijking}} ^ {2}.
  • Titel afbeelding Bereken de som van vierkanten voor fout (SSE) Stap 2
    2. Vul de gegevens in. De eerste kolom houdt de waarden van uw metingen vast. Vul de Waarde{ displaystyle { tekst {waarde}}}{ tekst {waarde}} kolom met de waarden van uw metingen. Dit kunnen de resultaten zijn van een experiment, een statistische studie of alleen data voor een wiskundig probleem.
  • Stel in dit geval, stel dat u met sommige medische gegevens werkt en u een lijst hebt van de lichaamstemperaturen van tien patiënten. De verwachte verwachte lichaamstemperatuur is 98.6 graden. De temperaturen van tien patiënten worden gemeten en geven de waarden 99.0, 98.6, 98.5, 101.1, 98.3, 98.6, 97.9, 98.4, 99.2 en 99.1. Schrijf deze waarden in de eerste kolom.
  • Titel afbeelding Bereken de som van vierkanten voor fout (SSE) Stap 3
    3. Bereken het gemiddelde. Voordat u de fout voor elke meting kunt berekenen, moet u het gemiddelde van de volledige dataset berekenen.
  • Herinner eraan dat het gemiddelde van een gegevensset de som is van de waarden, gedeeld door het aantal waarden in de set. Dit kan symbolisch worden vertegenwoordigd, met de variabele μ{ displaystyle mu} mu mu het gemiddelde vertegenwoordigen, als:
  • μ=ΣXn{ displaystyle mu = { frac { sigma x} {n}}} mu = { frac { sigma x} {n}}
  • Voor deze gegevens wordt het gemiddelde berekend als:
  • μ=99.0+98.6+98.5+101.1+98.3+98.6+97.9+98.4+99.2+99.110{ displaystyle mu = { frac {99.0 + 98.6 + 98.5 + 101.1 + 98.3 + 98.6 + 97.9 + 98.4 + 99.2 + 99.1} {10}}} mu = { frac {99.0 + 98.6 + 98.5 + 101.1 + 98.3 + 98.6 + 97.9 + 98.4 + 99.2 + 99.1} {10}}
  • μ=988.710{ displaystyle mu = { frac {988.7} {10}}} mu = { frac {988.7} {10}}
  • μ=98.87{ displaystyle mu = 98.87} mu = 98.87
  • Titel afbeelding Bereken de som van vierkanten voor fout (SSE) Stap 4
    4. Bereken de individuele foutmetingen. In de tweede kolom van uw tabel moet u de foutmetingen voor elke gegevenswaarde invullen. De fout is het verschil tussen de meting en het gemiddelde.
  • Voor de gegeven gegevensset, trek het gemiddelde, 98 af.87, van elke gemeten waarde en vul de tweede kolom in met de resultaten. Deze tien berekeningen zijn als volgt:
  • 99.0-98.87=0.13{ displaystyle 99.0-98.87 = 0.13}99.0-98.87 = 0,13
  • 98.6-98.87=-0.27{ displaystyle 98.6-98.87 = -0.27}98.6-98.87 = -0.27
  • 98.5-98.87=-0.37{ displaystyle 98.5-98.87 = -0.37}98.5-98.87 = -0.37
  • 101.1-98.87=2.23{ displaystyle 101.1-98.87 = 2.23}101.1-98.87 = 2.23
  • 98.3-98.87=-0.57{ displaystyle 98.3-98.87 = -0.57}98.3-98.87 = -0.57
  • 98.6-98.87=-0.27{ displaystyle 98.6-98.87 = -0.27}98.6-98.87 = -0.27
  • 97.9-98.87=-0.97{ displaystyle 97.9-98.87 = -0.97}97.9-98.87 = -0.97
  • 98.4-98.87=-0.47{ displaystyle 98.4-98.87 = -0.47}98.4-98.87 = -0.47
  • 99.2-98.87=0.33{ displaystyle 99.2-98.87 = 0.33}99.2-98.87 = 0,33
  • 99.1-98.87=0.23{ displaystyle 99.1-98.87 = 0.23}99.1-98.87 = 0.23
  • Titel afbeelding Bereken de som van vierkanten voor fout (SSE) Stap 5
    5. Bereken de vierkanten van de fouten. Zoek in de derde kolom van de tabel het vierkant van elk van de resulterende waarden in de middelste kolom. Deze vertegenwoordigen de vierkanten van de afwijking van het gemiddelde voor elke gemeten waarde van gegevens.
  • Gebruik voor elke waarde in de middelste kolom uw rekenmachine en vind het vierkant. Registreer de resultaten in de derde kolom als volgt:
  • 0.132=0.0169{ displaystyle 0.13 ^ {2} = 0.0169}0,13 ^ {2} = 0.0169
  • (-0.27)2=0.0729{ displaystyle (-0.27) ^ {2} = 0.0729}(-0.27) ^ {2} = 0.0729
  • (-0.37)2=0.1369{ displaystyle (-0.37) ^ ^ ^ 2} = 0.1369}(-0.37) ^ {2} = 0.1369
  • 2.232=4.9729{ displaystyle 2.23 ^ {2} = 4.9729}2.23 ^ {2} = 4.9729
  • (-0.57)2=0.3249{ displaystyle (-0.57) ^ ^ ^ ^ ^ ^} = 0.3249}(-0.57) ^ {2} = 0.3249
  • (-0.27)2=0.0729{ displaystyle (-0.27) ^ {2} = 0.0729}(-0.27) ^ {2} = 0.0729
  • (-0.97)2=0.9409{ displaystyle (-0.97) ^ ^ ^ 2} = 0.9409}(-0.97) ^ {2} = 0.9409
  • (-0.47)2=0.2209{ displaystyle (-0.47) ^ ^} = 0.2209}(-0.47) ^ {2} = 0.2209
  • 0.332=0.1089{ displaystyle 0.33 ^ {2} = 0.1089}0.33 ^ {2} = 0.1089
  • 0.232=0.0529{ displaystyle 0.23 ^ {2} = 0.0529}0.23 ^ {2} = 0.0529
  • Titel afbeelding Bereken de som van vierkanten voor fout (SSE) Stap 6
    6. Voeg de vierkanten van fouten samen. De laatste stap is om de som van de waarden in de derde kolom te vinden. Het gewenste resultaat is de SSE, of de som van vierkante fouten.
  • Voor deze dataset wordt de SSE berekend door de tien waarden in de derde kolom samen te voegen:
  • SSE=6.921{ displaystyle sse = 6.921}SSE = 6.921
  • Methode 2 van 3:
    Een Excel-spreadsheet maken om SSE te berekenen
    1. Titel afbeelding Bereken de som van vierkanten voor fout (SSE) Stap 7
    1. Label de kolommen van de spreadsheet. U maakt een drie kolomtafel in Excel, met dezelfde drie rubrieken zoals hierboven.
    • In cel A1, typ de kop "waarde in."
    • Voer in Cel B1 de titel "Deviatie in."
    • Voer in Cel C1 de kop "Deviation Squared."
  • Titel afbeelding Bereken de som van vierkanten voor fout (SSE) Stap 8
    2. Voer uw gegevens in. In de eerste kolom moet u de waarden van uw metingen typen. Als de set klein is, kunt u ze eenvoudig met de hand in typen. Als u een grote dataset hebt, moet u mogelijk de gegevens in de kolom kopiëren en plakken.
  • Titel afbeelding Bereken de som van vierkanten voor fout (SSE) Stap 9
    3. Vind het gemiddelde van de gegevenspunten. Excel heeft een functie die het gemiddelde voor u zal berekenen. In een vacante cel onder uw gegevenstabel (het maakt niet uit welke cel u kiest), voer het volgende in:
  • = Gemiddeld (A2: ___)
  • Typ niet echt een lege ruimte. Vul die blanco in met de celnaam van uw laatste gegevenspunt. Als u bijvoorbeeld 100 punten hebt, gebruikt u de functie:
  • = Gemiddeld (A2: A101)
  • Deze functie bevat gegevens van A2 via A101 omdat de bovenste rij de kopjes van de kolommen bevat.
  • Wanneer u op ENTER drukt of wanneer u wegklikt op een andere cel op de tabel, vult het gemiddelde van uw gegevenswaarden automatisch de cel die u net hebt geprogrammeerd.
  • Titel afbeelding Bereken de som van vierkanten voor fout (SSE) Stap 10
    4. Voer de functie in voor de foutmetingen. In de eerste lege cel in de kolom "Deviatie", moet u een functie invoeren om het verschil tussen elk gegevenspunt en het gemiddelde te berekenen. Om dit te doen, moet u de celnaam gebruiken waar het gemiddelde verblijft. Laten we aannemen dat je cel A104 hebt gebruikt.
  • De functie voor de foutberekening, die u in cel B2 inkomt, zal zijn:
  • = A2- $ A $ 104.De dollartekens zijn nodig om ervoor te zorgen dat u voor elke berekening in de cel A104 vergrendelt.
  • Toonde afbeelding Bereken de som van vierkanten voor fout (SSE) Stap 11
    5. Voer de functie in voor de foutvierkanten. In de derde kolom kunt u Excel sturen om het plein te berekenen dat u nodig hebt.
  • Voer in Cell C2 de functie in
  • = B2 ^ 2
  • Titel afbeelding Bereken de som van vierkanten voor fout (SSE) Stap 12
    6. Kopieer de functies om de gehele tabel te vullen. Nadat u de functies in de TOP-cel van elke kolom, respectievelijk B2 en C2 hebt ingevoerd, moet u de volledige tabel invullen. Je zou de functie in elke regel van de tabel opnieuw kunnen gebruiken, maar dit zou veel te lang duren. Gebruik uw muis, markeer cellen B2 en C2 samen, en zonder de muisknop los te laten, sleept u naar de onderste cel van elke kolom.
  • Als we ervan uitgaan dat u 100 gegevenspunten in uw tabel hebt, sleept u uw muis naar beneden naar cellen B101 en C101.
  • Wanneer u de muisknop vervolgens vrijgeeft, worden de formules gekopieerd in alle cellen van de tabel. De tabel moet automatisch worden ingevuld met de berekende waarden.
  • Titel afbeelding Bereken de som van vierkanten voor fout (SSE) Stap 13
    7. Zoek de SSE. Kolom C van uw tabel bevat alle vierkant-foutwaarden. De laatste stap is om Excel de som van deze waarden te laten berekenen.
  • In een cel onder de tabel, waarschijnlijk C102 voor dit voorbeeld, voert u de functie in:
  • = SUM (C2: C101)
  • Wanneer u klikt op Enter of klik in een andere cel van de tabel, moet u de SSE-waarde voor uw gegevens hebben.
  • Methode 3 van 3:
    Met SSE aan andere statistische gegevens
    1. Titel afbeelding Bereken de som van vierkanten voor fout (SSE) Stap 14
    1. Bereken de variantie van SSE. Het vinden van de SSE voor een dataset is over het algemeen een bouwsteen om andere, nuttiger, waarden te vinden. De eerste hiervan is variantie. De variantie is een meting die aangeeft hoeveel de gemeten gegevens variëren van het gemiddelde. Het is eigenlijk het gemiddelde van de vierkante verschillen uit het gemiddelde.
    • Omdat de SSE de som is van de vierkante fouten, kunt u het gemiddelde vinden (dat is de variantie), alleen door te delen door het aantal waarden. Als u echter de variantie van een voorbeeldset berekend, in plaats van een volledige bevolking, zult u deelnemen aan (N-1) in plaats van N. Dus:
    • Variantie = SSE / N, als u de variantie van een volledige bevolking berekend.
    • Variance = SSE / (N-1), als u de variantie van een voorbeeldset van gegevens berekent.
  • Voor het monsterprobleem van de temperaturen van de patiënten kunnen we aannemen dat 10 patiënten slechts een voorbeeldset vertegenwoordigen. Daarom zou de variantie worden berekend als:
  • Variatie=SSE(n-1){ DisplayStyle { Text {variance}} = { frac { Text {SSE}} {(n-1)}}}{ tekst {variantie}} = { frac {{ tekst {sse}}} {(n-1)}}
  • Variatie=6.9219{ DisplayStyle { Text {variance}} = { frac {6.921} {9}}}{ tekst {variantie}} = { frac {6.921} {9}}
  • Variatie=0.769{ DisplayStyle { Text {Variance}} = 0.769}{ tekst {variantie}} = 0.769
  • Titel afbeelding Bereken de som van vierkanten voor fout (SSE) Stap 15
    2. Bereken standaardafwijking van SSE. De standaarddeviatie is een veelgebruikte waarde die aangeeft hoeveel de waarden van een gegevensset afwijken van het gemiddelde. De standaarddeviatie is de vierkantswortel van de variantie. Herinner eraan dat de variantie het gemiddelde is van de vierkante foutmetingen.
  • Daarom, nadat u de SSE hebt berekend, kunt u de standaarddeviatie als volgt vinden:
  • Standaardafwijking=SSEn-1{ DisplayStyle { Text {Standard Deviation}} = { sqrt { frac { tekst {SSE}} {n-1}}}}{ Text {Standard Deviation}} = { frac {{ Text {sse}}} {n-1}}}}
  • Voor het gegevensmonster van de temperatuurmetingen kunt u de standaarddeviatie als volgt vinden:
  • Standaardafwijking=SSEn-1{ DisplayStyle { Text {Standard Deviation}} = { sqrt { frac { tekst {SSE}} {n-1}}}}{ Text {Standard Deviation}} = { frac {{ Text {sse}}} {n-1}}}}
  • Standaardafwijking=6.9219{ DisplayStyle { Text {Standard Deviation}} = { sqrt { frac { Text {6.921}} {9}}}}{ tekst {standaarddeviation}} = { frac {{ tekst {6.921}}} {9}}}}
  • Standaardafwijking=.769{ DisplayStyle { Text {Standard Deviation}} = { sqrt {.769}}}{ tekst {standaarddeviation}} = { sqrt {769}}
  • Standaardafwijking=0.877{ DisplayStyle { Text {Standard Deviation}} = 0.877}{ tekst {standaarddeviation}} = 0.877
  • Titel afbeelding Bereken de som van vierkanten voor fout (SSE) Stap 16
    3. Gebruik SSE om covariantie te meten. Dit artikel is gericht op gegevenssets die slechts een enkele waarde per keer meten. In veel studies kunt u echter twee afzonderlijke waarden vergelijken. U zou willen weten hoe die twee waarden betrekking hebben op elkaar, niet alleen naar het gemiddelde van de dataset. Deze waarde is de covariantie.
  • De berekeningen voor covariantie zijn hier te betrokken bij het detail hier, behalve om op te merken dat u de SSE voor elk gegevenstype gebruikt en deze vervolgens kunt vergelijken. Zie voor een meer gedetailleerde beschrijving van Covariance en de betrokken berekeningen Bereken covariantie.
  • Als een voorbeeld van het gebruik van covariantie, wilt u misschien de leeftijden van de patiënten vergelijken met een medisch onderzoek naar de effectiviteit van een medicijn bij het verlagen van koortstemperaturen. Dan zou u een gegevensset van leeftijden en een tweede gegevensset van temperaturen hebben. U vindt de SSE voor elke gegevensset en vervolgens vindt u de variantie, standaarddeviaties en covariantie.
  • Tips

    Deel in het sociale netwerk:
    Vergelijkbaar