Lineární regrese

Basicmeaning

Instatistics,linearregression(LinearRegression)istheuseoftheleastsquarefunctioncalledlinearregressionequationtodeterminetherelationshipbetweenoneormoreindependentvariablesanddependentvariablesAregressionanalysisformodeling.Thisfunctionisalinearcombinationofoneormoremodelparameterscalledregressioncoefficients.Thesituationwithonlyoneindependentvariableiscalledsimpleregression,andthesituationwithmorethanoneindependentvariableiscalledmultipleregression.(Thisinturnshouldbedistinguishedbymultiplelinearregressionpredictedbymultiplerelateddependentvariables,ratherthanasinglescalarvariable.)

Inlinearregression,thedataismodeledusingalinearpredictivefunction.Andunknownmodelparametersarealsoestimatedthroughdata.Thesemodelsarecalledlinearmodels.ThemostcommonlyusedlinearregressionmodelingisthattheconditionalmeanofyforagivenvalueofXisanaffinefunctionofX.Inalessgeneralcase,thelinearregressionmodelcanbeamedianorsomeotherquantileoftheconditionaldistributionofygivenXasalinearfunctionofX.Likeallformsofregressionanalysis,linearregressionalsofocusesontheconditionalprobabilitydistributionofyforagivenvalueofX,ratherthanthejointprobabilitydistributionofXandy(inthefieldofmultivariateanalysis).

Linearregressionisthefirsttypeofregressionanalysisthathasundergonerigorousresearchandiswidelyusedinpracticalapplications.Thisisbecauseamodelthatlinearlydependsonitsunknownparametersiseasiertofitthanamodelthatnon-linearlydependsonitsunknownparameters,andthestatisticalpropertiesoftheresultingestimatesareeasiertodetermine.

Linearregressionmodelsareoftenfittedwithleastsquaresapproximation,buttheymayalsobefittedwithothermethods,suchasminimizing"fittingdefects"insomeotherspecifications(suchasleastabsoluteErrorregression),orminimizethepenaltyoftheleastsquareslossfunctioninbridgeregression.Onthecontrary,theleastsquaresapproximationcanbeusedtofitthosenonlinearmodels.Therefore,althoughthe"leastsquaresmethod"andthe"linearmodel"areCloselyconnected,buttheycannotbeequated.

Fittingrovnice

Metoda nejmenších čtverců

Obecně řečeno, lineární regresi lze získat metodou nejmenších čtverců pro nalezení rovnice, kterou lze vypočítat pro y=přímkabx+a.

Obecně platí, že je více než jeden faktor, který má vliv. Předpokládejme, že je možné vzít v úvahu následující přímkový vztah:

Foryandx1,x2,...,xkvykonat nezávislá pozorování ve stejný čas, abyste získali sady pozorování (xt 1,xt2,...,xtk),t=1 ,2,...,n(n>k+1),vyhovujívztahu:

Mezi nimi nesouvisí navzájem a souvisí sNáhodné proměnné se stejným rozdělením.Aby bylo možné vyjádřit výše uvedený vzorec pomocí matice:

Sothereis a pro získání řešení použijte metodu východního čtverce. Mezi nimi se nazývá pseudoinverzní.

Regressioncoefficient

Generally,thisvalueisrequiredtobegreaterthan5%.Formostbehaviorresearchers,themostimportantthingistheregressioncoefficient.Whentheageincreasesby1unit,thequalityofthedocumentwilldecrease-1020986units,indicatingthatolderpeoplewillhavealowerevaluationofthequalityofthedocument.Thecorrespondingtvalueofthisvariableis-2.10,theabsolutevalueisgreaterthan2,andthepvalueisalso<0.05,soitissignificant.Theconclusionisthatolderpeoplewillhavealowerevaluationofdocumentquality,andthiseffectissignificant.Onthecontrary,peoplewithricherdomainknowledgewillhaveahigherevaluationofthequalityofthedocument,butthiseffectisnotsignificant.Thisunderstandingofregressioncoefficientsistheprocessofhypothesistestingusingregressionanalysis.

Errorofregressionequation

Součet čtvercových odchylek

,,

whererepresentsthesumofsquaresofy;risthecorrelationcoefficient,representingtheproportionofvariationexplainedbytheregressionline;meansthatitcannotbeexplainedbytheregressionlineThevariationofSSE.

Accordingtotherelationshipbetweentheregressioncoefficientandtheslopeofthestraightline,theequivalentformcanbeobtained:,wherebistheslopeofthestraightline

Pomocí předpokládané hodnoty

, kde je skutečná naměřená hodnota a je předpokládaná hodnota vypočítaná podle přímkové rovnice.

Nejistota

Slopeb

Metoda 1: Použijte

Metoda 2: Přiveďte sklon

Zachycení

Aplikace

Matematika

Lineární regrese má mnoho praktických využití. Dělí se do následujících dvou kategorií:

  1. Ifthegoalispredictionormapping,linearregressioncanbeusedtofitapredictionmodeltothevalueofXandtheobserveddataset.Whensuchamodeliscompleted,foranewlyaddedXvalue,withoutaypairedwithit,thefittedmodelcanbeusedtopredictayvalue.

  2. UveďteproměnnouyaněkteréproměnnéX1,...,Xp,tytoproměnnéjsoumožnéSouvisejícítoy,analýzu lineární regrese lze použít ke kvantifikaci síly korelace mezi Xj, vyhodnotitX jkteré s y nesouvisí, a určete, kteréPodmnožinaXjobsahuje redundantníinformaceoy.

Trendline

Trendline představuje dlouhodobý trend dat časových řad. Vypovídá o tom, zda se konkrétní sada dat (např. HDP, ceny ropy a skladové ceny) v průběhu časového období zvýšila nebo snížila. trendová čára.

Epidemiology

Earlyevidenceontheeffectofsmokingonmortalityandmorbiditycomesfromobservationalstudiesusingregressionanalysis.Inordertoreducespuriouscorrelationswhenanalyzingobserveddata,inadditiontothevariablesofmostinterest,researchersusuallyincludesomeadditionalvariablesintheirregressionmodels.Forexample,supposewehavearegressionmodelinwhichsmokingbehavioristheindependentvariablewearemostinterestedin,andtherelevantvariableisthesmoker'slifespanobservedoverseveralyears.Researchersmaytreatsocioeconomicstatusasanadditionalindependentvariable,ensuringthatanyobservedeffectsofsmokingonlifespanarenotcausedbyeducationorincomedifferences.However,itisimpossibleforustoaddallvariablesthatmayconfusetheresultsintotheempiricalanalysis.Forexample,anon-existentgenemayincreasethechanceofdeathandincreasetheamountofsmoking.Therefore,randomizedcontrolledtrialsoftenproducemoreconvincingevidenceofcausalitythantheconclusionsdrawnfromregressionanalysisusingobservationaldata.Whencontrollableexperimentsarenotfeasible,derivativesofregressionanalysis,suchasinstrumentalvariableregression,canbeusedtotrytoestimatethecausalityoftheobserveddata.

Finance

ThecapitalassetpricingmodeluseslinearregressionandtheconceptofBetacoefficienttoanalyzeandcalculatethesystemicriskofinvestment.ThisisdirectlyderivedfromtheBetacoefficientofthemodelthatlinksthereturnoninvestmentandthereturnonallriskyassets.

Ekonomika

Lineární regrese je hlavním empirickým nástrojem ekonomie. Například se používá k předpovídání výdajů na spotřebu, fixních investičních výdajů, investic do zásob, nákupu exportních produktů země, výdajů na dovoz, požadavků na držení likvidních a spotřebních sad.

Související články
HORNÍ