Basicmeaning
Instatistics,linearregression(LinearRegression)istheuseoftheleastsquarefunctioncalledlinearregressionequationtodeterminetherelationshipbetweenoneormoreindependentvariablesanddependentvariablesAregressionanalysisformodeling.Thisfunctionisalinearcombinationofoneormoremodelparameterscalledregressioncoefficients.Thesituationwithonlyoneindependentvariableiscalledsimpleregression,andthesituationwithmorethanoneindependentvariableiscalledmultipleregression.(Thisinturnshouldbedistinguishedbymultiplelinearregressionpredictedbymultiplerelateddependentvariables,ratherthanasinglescalarvariable.)
Inlinearregression,thedataismodeledusingalinearpredictivefunction.Andunknownmodelparametersarealsoestimatedthroughdata.Thesemodelsarecalledlinearmodels.ThemostcommonlyusedlinearregressionmodelingisthattheconditionalmeanofyforagivenvalueofXisanaffinefunctionofX.Inalessgeneralcase,thelinearregressionmodelcanbeamedianorsomeotherquantileoftheconditionaldistributionofygivenXasalinearfunctionofX.Likeallformsofregressionanalysis,linearregressionalsofocusesontheconditionalprobabilitydistributionofyforagivenvalueofX,ratherthanthejointprobabilitydistributionofXandy(inthefieldofmultivariateanalysis).
Linearregressionisthefirsttypeofregressionanalysisthathasundergonerigorousresearchandiswidelyusedinpracticalapplications.Thisisbecauseamodelthatlinearlydependsonitsunknownparametersiseasiertofitthanamodelthatnon-linearlydependsonitsunknownparameters,andthestatisticalpropertiesoftheresultingestimatesareeasiertodetermine.
Linearregressionmodelsareoftenfittedwithleastsquaresapproximation,buttheymayalsobefittedwithothermethods,suchasminimizing"fittingdefects"insomeotherspecifications(suchasleastabsoluteErrorregression),orminimizethepenaltyoftheleastsquareslossfunctioninbridgeregression.Onthecontrary,theleastsquaresapproximationcanbeusedtofitthosenonlinearmodels.Therefore,althoughthe"leastsquaresmethod"andthe"linearmodel"areCloselyconnected,buttheycannotbeequated.
Fittingrovnice
Metoda nejmenších čtverců
Obecně řečeno, lineární regresi lze získat metodou nejmenších čtverců pro nalezení rovnice, kterou lze vypočítat pro y=přímkabx+a.
Obecně platí, že je více než jeden faktor, který má vliv. Předpokládejme, že je možné vzít v úvahu následující přímkový vztah:
Foryandx1,x2,...,xkvykonat nezávislá pozorování ve stejný čas, abyste získali sady pozorování (xt 1,xt2,...,xtk),t=1 ,2,...,n(n>k+1),vyhovujívztahu:
Mezi nimi nesouvisí navzájem a souvisí s
Sothereis a pro získání řešení použijte metodu východního čtverce. Mezi nimi se nazývá pseudoinverzní.
Regressioncoefficient
Generally,thisvalueisrequiredtobegreaterthan5%.Formostbehaviorresearchers,themostimportantthingistheregressioncoefficient.Whentheageincreasesby1unit,thequalityofthedocumentwilldecrease-1020986units,indicatingthatolderpeoplewillhavealowerevaluationofthequalityofthedocument.Thecorrespondingtvalueofthisvariableis-2.10,theabsolutevalueisgreaterthan2,andthepvalueisalso<0.05,soitissignificant.Theconclusionisthatolderpeoplewillhavealowerevaluationofdocumentquality,andthiseffectissignificant.Onthecontrary,peoplewithricherdomainknowledgewillhaveahigherevaluationofthequalityofthedocument,butthiseffectisnotsignificant.Thisunderstandingofregressioncoefficientsistheprocessofhypothesistestingusingregressionanalysis.
Errorofregressionequation
Součet čtvercových odchylek
,,
whererepresentsthesumofsquaresofy;risthecorrelationcoefficient,representingtheproportionofvariationexplainedbytheregressionline;meansthatitcannotbeexplainedbytheregressionlineThevariationofSSE.
Accordingtotherelationshipbetweentheregressioncoefficientandtheslopeofthestraightline,theequivalentformcanbeobtained:,wherebistheslopeofthestraightline
Pomocí předpokládané hodnoty
, kde je skutečná naměřená hodnota a je předpokládaná hodnota vypočítaná podle přímkové rovnice.
Nejistota
Slopeb
Metoda 1: Použijte
Metoda 2: Přiveďte sklon
Zachycení
Aplikace
Matematika
Lineární regrese má mnoho praktických využití. Dělí se do následujících dvou kategorií:
Ifthegoalispredictionormapping,linearregressioncanbeusedtofitapredictionmodeltothevalueofXandtheobserveddataset.Whensuchamodeliscompleted,foranewlyaddedXvalue,withoutaypairedwithit,thefittedmodelcanbeusedtopredictayvalue.
UveďteproměnnouyaněkteréproměnnéX1,...,Xp,tytoproměnnéjsoumožnéSouvisejícítoy,analýzu lineární regrese lze použít ke kvantifikaci síly korelace mezi Xj, vyhodnotitX jkteré s y nesouvisí, a určete, kteréPodmnožinaXjobsahuje redundantníinformaceoy.
Trendline
Trendline představuje dlouhodobý trend dat časových řad. Vypovídá o tom, zda se konkrétní sada dat (např. HDP, ceny ropy a skladové ceny) v průběhu časového období zvýšila nebo snížila. trendová čára.
Epidemiology
Earlyevidenceontheeffectofsmokingonmortalityandmorbiditycomesfromobservationalstudiesusingregressionanalysis.Inordertoreducespuriouscorrelationswhenanalyzingobserveddata,inadditiontothevariablesofmostinterest,researchersusuallyincludesomeadditionalvariablesintheirregressionmodels.Forexample,supposewehavearegressionmodelinwhichsmokingbehavioristheindependentvariablewearemostinterestedin,andtherelevantvariableisthesmoker'slifespanobservedoverseveralyears.Researchersmaytreatsocioeconomicstatusasanadditionalindependentvariable,ensuringthatanyobservedeffectsofsmokingonlifespanarenotcausedbyeducationorincomedifferences.However,itisimpossibleforustoaddallvariablesthatmayconfusetheresultsintotheempiricalanalysis.Forexample,anon-existentgenemayincreasethechanceofdeathandincreasetheamountofsmoking.Therefore,randomizedcontrolledtrialsoftenproducemoreconvincingevidenceofcausalitythantheconclusionsdrawnfromregressionanalysisusingobservationaldata.Whencontrollableexperimentsarenotfeasible,derivativesofregressionanalysis,suchasinstrumentalvariableregression,canbeusedtotrytoestimatethecausalityoftheobserveddata.
Finance
ThecapitalassetpricingmodeluseslinearregressionandtheconceptofBetacoefficienttoanalyzeandcalculatethesystemicriskofinvestment.ThisisdirectlyderivedfromtheBetacoefficientofthemodelthatlinksthereturnoninvestmentandthereturnonallriskyassets.
Ekonomika
Lineární regrese je hlavním empirickým nástrojem ekonomie. Například se používá k předpovídání výdajů na spotřebu, fixních investičních výdajů, investic do zásob, nákupu exportních produktů země, výdajů na dovoz, požadavků na držení likvidních a spotřebních sad.