Basicmeaning
Instatistics,linearregression(LinearRegression)istheuseoftheleastsquarefunctioncalledlinearregressionequationtodeterminetherelationshipbetweenoneormoreindependentvariablesanddependentvariablesAregressionanalysisformodeling.Thisfunctionisalinearcombinationofoneormoremodelparameterscalledregressioncoefficients.Thesituationwithonlyoneindependentvariableiscalledsimpleregression,andthesituationwithmorethanoneindependentvariableiscalledmultipleregression.(Thisinturnshouldbedistinguishedbymultiplelinearregressionpredictedbymultiplerelateddependentvariables,ratherthanasinglescalarvariable.)
Inlinearregression,thedataismodeledusingalinearpredictivefunction.Andunknownmodelparametersarealsoestimatedthroughdata.Thesemodelsarecalledlinearmodels.ThemostcommonlyusedlinearregressionmodelingisthattheconditionalmeanofyforagivenvalueofXisanaffinefunctionofX.Inalessgeneralcase,thelinearregressionmodelcanbeamedianorsomeotherquantileoftheconditionaldistributionofygivenXasalinearfunctionofX.Likeallformsofregressionanalysis,linearregressionalsofocusesontheconditionalprobabilitydistributionofyforagivenvalueofX,ratherthanthejointprobabilitydistributionofXandy(inthefieldofmultivariateanalysis).
Linearregressionisthefirsttypeofregressionanalysisthathasundergonerigorousresearchandiswidelyusedinpracticalapplications.Thisisbecauseamodelthatlinearlydependsonitsunknownparametersiseasiertofitthanamodelthatnon-linearlydependsonitsunknownparameters,andthestatisticalpropertiesoftheresultingestimatesareeasiertodetermine.
Linearregressionmodelsareoftenfittedwithleastsquaresapproximation,buttheymayalsobefittedwithothermethods,suchasminimizing"fittingdefects"insomeotherspecifications(suchasleastabsoluteErrorregression),orminimizethepenaltyoftheleastsquareslossfunctioninbridgeregression.Onthecontrary,theleastsquaresapproximationcanbeusedtofitthosenonlinearmodels.Therefore,althoughthe"leastsquaresmethod"andthe"linearmodel"areCloselyconnected,buttheycannotbeequated.
Sovitusyhtälö
Pienin neliö -menetelmä
Yleensä lineaarinen regressio voidaan saada pienimmän neliön menetelmällä yhtälön löytämiseksi, joka voidaan laskea fory=Suora bx+a.
Yleensä pehmentää enemmän kuin yhtä tekijään vaikuttavaa tekijää. Oletetaan, että on1,x2,...,xk,kfactors, yleensä seuraavaa lineaarista suhdetta voidaan harkita:
Foryandx1,x2,...,xktekevät itsenäisiä havaintoja samalla kertaa saadakseen joukon havaintoja(xt 1,xt2,...,xtk),t=1 ,2,...,n(n>k+1), ne täyttävät suhteen:
Niistä,ei liity kuhunkin eikä liity
Jotenratkaisun saamiseksi on,jakäytä pienimmän neliön menetelmää.Niistä kutsutaan näennäiskäänteisiksi.
Regressioncoefficient
Generally,thisvalueisrequiredtobegreaterthan5%.Formostbehaviorresearchers,themostimportantthingistheregressioncoefficient.Whentheageincreasesby1unit,thequalityofthedocumentwilldecrease-1020986units,indicatingthatolderpeoplewillhavealowerevaluationofthequalityofthedocument.Thecorrespondingtvalueofthisvariableis-2.10,theabsolutevalueisgreaterthan2,andthepvalueisalso<0.05,soitissignificant.Theconclusionisthatolderpeoplewillhavealowerevaluationofdocumentquality,andthiseffectissignificant.Onthecontrary,peoplewithricherdomainknowledgewillhaveahigherevaluationofthequalityofthedocument,butthiseffectisnotsignificant.Thisunderstandingofregressioncoefficientsistheprocessofhypothesistestingusingregressionanalysis.
Virheregressioyhtälö
Neliöpoikkeamien summa
,,
whererepresentsthesumofsquaresofy;risthecorrelationcoefficient,representingtheproportionofvariationexplainedbytheregressionline;meansthatitcannotbeexplainedbytheregressionlineThevariationofSSE.
Accordingtotherelationshipbetweentheregressioncoefficientandtheslopeofthestraightline,theequivalentformcanbeobtained:,wherebistheslopeofthestraightline
Ennustetun arvon käyttäminen
,jossatodellinen mitattu arvo jasuoran yhtälön mukaan laskettu ennustettu arvo.
Epävarmuus
Slopeb
Tapa 1: Käyttö
Menetelmä 2: Tuo kaltevuus
Intercepta
Sovellus
Matematiikka
Lineaarisessa regressiossa on monia käytäntöjä. Jaettu kahteen luokkaan:
Ifthegoalispredictionormapping,linearregressioncanbeusedtofitapredictionmodeltothevalueofXandtheobserveddataset.Whensuchamodeliscompleted,foranewlyaddedXvalue,withoutaypairedwithit,thefittedmodelcanbeusedtopredictayvalue.
Annetaanmuuttujajajoitakin muuttujiaX1,...,Xp, nämä muuttujat ovat mahdollisiaLiitetty lelu, lineaarista regressioanalyysiä voidaan käyttää arvon ja X:n välisen korrelaation vahvuuden kvantifiointiin, jjoka ei liity asiaan,ja tunnista, mitkäXj:n alajoukko sisältää tarpeettomia tietoja.
Trendiviiva
Atrendline edustaa aikasarjatietojen pitkän aikavälin trendiä. Se kertoo siitä, ovatko tietyt tietojoukot (kuten BKT, öljynhinnat ja osakkeiden hinnat) nousseet tai laskeneet. söi trendilinjan sijainnin ja kaltevuuden.
Epidemiology
Earlyevidenceontheeffectofsmokingonmortalityandmorbiditycomesfromobservationalstudiesusingregressionanalysis.Inordertoreducespuriouscorrelationswhenanalyzingobserveddata,inadditiontothevariablesofmostinterest,researchersusuallyincludesomeadditionalvariablesintheirregressionmodels.Forexample,supposewehavearegressionmodelinwhichsmokingbehavioristheindependentvariablewearemostinterestedin,andtherelevantvariableisthesmoker'slifespanobservedoverseveralyears.Researchersmaytreatsocioeconomicstatusasanadditionalindependentvariable,ensuringthatanyobservedeffectsofsmokingonlifespanarenotcausedbyeducationorincomedifferences.However,itisimpossibleforustoaddallvariablesthatmayconfusetheresultsintotheempiricalanalysis.Forexample,anon-existentgenemayincreasethechanceofdeathandincreasetheamountofsmoking.Therefore,randomizedcontrolledtrialsoftenproducemoreconvincingevidenceofcausalitythantheconclusionsdrawnfromregressionanalysisusingobservationaldata.Whencontrollableexperimentsarenotfeasible,derivativesofregressionanalysis,suchasinstrumentalvariableregression,canbeusedtotrytoestimatethecausalityoftheobserveddata.
Finance
ThecapitalassetpricingmodeluseslinearregressionandtheconceptofBetacoefficienttoanalyzeandcalculatethesystemicriskofinvestment.ThisisdirectlyderivedfromtheBetacoefficientofthemodelthatlinksthereturnoninvestmentandthereturnonallriskyassets.
Taloustiede
Lineaarinen regressio on tärkein empiirinen taloustieteen työkalu.Esimerkiksi sitä käytetään ennakoimaan kulutusmenoja,kiinteitä investointimenoja, varastoinvestointeja,maanvientituotteiden hankintaa,tuontimenoja,velvoitetta,tarjonnan ja lainatarpeen