Линейна регресия

Basicmeaning

Instatistics,linearregression(LinearRegression)istheuseoftheleastsquarefunctioncalledlinearregressionequationtodeterminetherelationshipbetweenoneormoreindependentvariablesanddependentvariablesAregressionanalysisformodeling.Thisfunctionisalinearcombinationofoneormoremodelparameterscalledregressioncoefficients.Thesituationwithonlyoneindependentvariableiscalledsimpleregression,andthesituationwithmorethanoneindependentvariableiscalledmultipleregression.(Thisinturnshouldbedistinguishedbymultiplelinearregressionpredictedbymultiplerelateddependentvariables,ratherthanasinglescalarvariable.)

Inlinearregression,thedataismodeledusingalinearpredictivefunction.Andunknownmodelparametersarealsoestimatedthroughdata.Thesemodelsarecalledlinearmodels.ThemostcommonlyusedlinearregressionmodelingisthattheconditionalmeanofyforagivenvalueofXisanaffinefunctionofX.Inalessgeneralcase,thelinearregressionmodelcanbeamedianorsomeotherquantileoftheconditionaldistributionofygivenXasalinearfunctionofX.Likeallformsofregressionanalysis,linearregressionalsofocusesontheconditionalprobabilitydistributionofyforagivenvalueofX,ratherthanthejointprobabilitydistributionofXandy(inthefieldofmultivariateanalysis).

Linearregressionisthefirsttypeofregressionanalysisthathasundergonerigorousresearchandiswidelyusedinpracticalapplications.Thisisbecauseamodelthatlinearlydependsonitsunknownparametersiseasiertofitthanamodelthatnon-linearlydependsonitsunknownparameters,andthestatisticalpropertiesoftheresultingestimatesareeasiertodetermine.

Linearregressionmodelsareoftenfittedwithleastsquaresapproximation,buttheymayalsobefittedwithothermethods,suchasminimizing"fittingdefects"insomeotherspecifications(suchasleastabsoluteErrorregression),orminimizethepenaltyoftheleastsquareslossfunctioninbridgeregression.Onthecontrary,theleastsquaresapproximationcanbeusedtofitthosenonlinearmodels.Therefore,althoughthe"leastsquaresmethod"andthe"linearmodel"areCloselyconnected,buttheycannotbeequated.

Напасване на уравнението

Метод на най-малките квадрати

Общо казано, линейна регресия може да бъде получена чрез метода на най-малките квадрати за намиране на уравнението, което може да бъде изчислено за=Правата линия на bx+a.

Общо взето има повече от един фактор, който влияе. Да предположим, че има x1,x2,...,xk,k фактори, обикновено може да се разглежда следната линейна връзка:

За и x1,x2,...,xkизвършват независими наблюдения по едно и също време за получаване на набори от наблюдения(xt 1,xt2,...,xtk),t=1 ,2,...,n(n>k+1),те удовлетворяват връзката:

Измежду тях, не се третира един с друг и не е свързан с

Случайни променливи с едно и също разпределение. За да изразим горната формула с матрица, нека:

Sothereis и използвайте метода на най-малкия квадрат, за да получите решението на. Сред тях се нарича псевдообратен.

Regressioncoefficient

Generally,thisvalueisrequiredtobegreaterthan5%.Formostbehaviorresearchers,themostimportantthingistheregressioncoefficient.Whentheageincreasesby1unit,thequalityofthedocumentwilldecrease-1020986units,indicatingthatolderpeoplewillhavealowerevaluationofthequalityofthedocument.Thecorrespondingtvalueofthisvariableis-2.10,theabsolutevalueisgreaterthan2,andthepvalueisalso<0.05,soitissignificant.Theconclusionisthatolderpeoplewillhavealowerevaluationofdocumentquality,andthiseffectissignificant.Onthecontrary,peoplewithricherdomainknowledgewillhaveahigherevaluationofthequalityofthedocument,butthiseffectisnotsignificant.Thisunderstandingofregressioncoefficientsistheprocessofhypothesistestingusingregressionanalysis.

Уравнение на грешката на регресията

Сума на квадратни отклонения

,,

whererepresentsthesumofsquaresofy;risthecorrelationcoefficient,representingtheproportionofvariationexplainedbytheregressionline;meansthatitcannotbeexplainedbytheregressionlineThevariationofSSE.

Accordingtotherelationshipbetweentheregressioncoefficientandtheslopeofthestraightline,theequivalentformcanbeobtained:,wherebistheslopeofthestraightline

Използване на прогнозираната стойност

, където е действителната измерена стойност и е прогнозираната стойност, изчислена според уравнението на правата линия.

Несигурност

Наклон

Метод1: Използвайте

Метод2: Доведете наклона

Прехващане

Приложение

Математика

Линейната регресия има много практически приложения. Разделена на следните две категории:

  1. Ifthegoalispredictionormapping,linearregressioncanbeusedtofitapredictionmodeltothevalueofXandtheobserveddataset.Whensuchamodeliscompleted,foranewlyaddedXvalue,withoutaypairedwithit,thefittedmodelcanbeusedtopredictayvalue.

  2. Дадена променливаинякои променливиX1,...,Xp,тези променливи са възможниСвързани, линеен регресионен анализ може да се използва за количествено определяне на силата на корелацията между иXj,оценетеX jкоято не е свързана с играчка, и идентифицирайте кои Подмножеството на Xj съдържа излишна информация за.

Линия на тренда

Линията на тренда представлява дългосрочната тенденция на данни от времеви серии. Показва ни дали конкретен набор от данни (като БВП, цени на петрола и цени на акциите) се е увеличил или е намалял за определен период от време. Въпреки че можем грубо да начертаем линия на тренд, като наблюдаваме позицията на точката от данни в координатната линия на стойност, използваме повече регресия с метода за изчисляване на позицията и наклона на линията на тренда.

Epidemiology

Earlyevidenceontheeffectofsmokingonmortalityandmorbiditycomesfromobservationalstudiesusingregressionanalysis.Inordertoreducespuriouscorrelationswhenanalyzingobserveddata,inadditiontothevariablesofmostinterest,researchersusuallyincludesomeadditionalvariablesintheirregressionmodels.Forexample,supposewehavearegressionmodelinwhichsmokingbehavioristheindependentvariablewearemostinterestedin,andtherelevantvariableisthesmoker'slifespanobservedoverseveralyears.Researchersmaytreatsocioeconomicstatusasanadditionalindependentvariable,ensuringthatanyobservedeffectsofsmokingonlifespanarenotcausedbyeducationorincomedifferences.However,itisimpossibleforustoaddallvariablesthatmayconfusetheresultsintotheempiricalanalysis.Forexample,anon-existentgenemayincreasethechanceofdeathandincreasetheamountofsmoking.Therefore,randomizedcontrolledtrialsoftenproducemoreconvincingevidenceofcausalitythantheconclusionsdrawnfromregressionanalysisusingobservationaldata.Whencontrollableexperimentsarenotfeasible,derivativesofregressionanalysis,suchasinstrumentalvariableregression,canbeusedtotrytoestimatethecausalityoftheobserveddata.

Finance

ThecapitalassetpricingmodeluseslinearregressionandtheconceptofBetacoefficienttoanalyzeandcalculatethesystemicriskofinvestment.ThisisdirectlyderivedfromtheBetacoefficientofthemodelthatlinksthereturnoninvestmentandthereturnonallriskyassets.

Икономика

Линейната регресия е основният емпиричен инструмент на икономиката. Например, използва се за прогнозиране на разходите за потребление, разходите за фиксирани инвестиции, инвестициите в инвентара, покупката на експортни продукти на страната, разходите за внос, изискванията за задържане на ликвидни активи, търсенето и предлагането на работна ръка.

Related Articles
TOP