Module 10 Régression linéaire simple et corrélation

Dans le texte de la leçon prédécédente, nous avons vu illustré de nombreux éléments importants à considérer lors de l’élaboration de plans d’échantillonnage. Certains problèmes liés à l’échantillonnage ont été présentés, notamment la pseudoréplication et des sources de confusion. Ces conseils s’appliquent aussi à d’autres types d’analyses. Dans la présente leçon, nous introduirons la régression linéaire simple et la corrélation. Les conditions d’utilisation et les tests d’hypothèses qui y sont associés seront présentés.

Dans les dernières leçons, la variable réponse était numérique et l’objectif était de déterminer comment cette variable changeait selon les niveaux d’un ou de plusieurs facteurs (p. ex., test \(t\), ANOVA). Les facteurs définissaient des groupes et les moyennes des groupes étaient comparées entre elles. Nous allons maintenant voir des applications où on veut déterminer la relation entre une variable réponse et une variable explicative numérique (au lieu d’un facteur). Ici, la variable explicative est mesurée sur une échelle numérique (p. ex., âge) au lieu d’être exprimée en niveaux (p. ex., classes d’âge).

Vous utiliserez les fonctions suivantes :

read.table( ), head( ), summary( )
lm( )
fitted( )
plot( ), par( ), abline( ), text( ), segments( ), lines( )
qqnorm( ), qqline( )
residuals( )
ifelse( )
rownames( )
rstudent( )
coef( )
data.frame( )
predict( )
qt( )
cor( )
cor.test( )
function( )

Vous utiliserez les données suivantes :

Dans la partie Lecon, les fichiers suivantes sont utilisés :

Le fichier influencers.csv sur le pouvoir des campagnes publicitaires lorsqu’elles utilisent principalement des “influenceurs” ou “influenceuses” du web.
Le fichier chocolats.txt sur le prix de tablettes de chocolat.

Dans la partie Autoévaluation, le fichier Pression_sanguine.txt est utilisé. Il présente les données relatives à la pression sanguine en mm de Hg chez des patients de différents âges.

Les données peuvent être téléchargées ici.