Modèle linéaire généralisé sous r
Essayons d`abord un modèle d`additif simple où l`utilisation de la contraception dépend de l`âge, l`éducation et les wantsMore: à l`intérieur des parenthèses, nous donnons R des informations importantes sur le modèle. À gauche de la ~ est la variable dépendante: succès. Il doit être codé 0 & 1 pour GLM pour le lire comme binaire. Maintenant, nous connaissons le modèle, nous pouvons générer des données idéalisées. Espérons que cela vous donnera alors une impression de la façon dont nous pouvons adapter un modèle aux données. Ouvrez R et nous allons créer ces paramètres: un bloc de données facultatif, une liste ou un environnement (ou un objet contraint par As. Data. Frame à un bloc de données) contenant les variables dans le modèle. Si elles ne sont pas trouvées dans les données, les variables sont prises à partir de l`environnement (formule), généralement l`environnement à partir duquel GLM est appelé.
La méthode d`argument sert à deux fins. L`une est de permettre la recréée du cadre de modèle sans raccord. L`autre est de permettre la fonction de raccord par défaut GLM. fit à remplacer par une fonction qui prend les mêmes arguments et utilise un algorithme de raccord différent. Si GLM. fit est fourni sous forme de chaîne de caractères, il est utilisé pour rechercher une fonction de ce nom, en commençant dans l`espace de noms stats. Nous voyons qu`aucune des interactions à deux facteurs manquantes n`est significative par elle-même au niveau conventionnel de cinq pour cent. (Cependant, ils se trouvent être ensemble significatif.) Notez que le modèle avec l`âge par l`interaction de l`éducation a un AIC plus faible que notre modèle de départ. Les objets de la classe « GLM » sont normalement de classe c (« GLM », « LM »), qui hérite de la classe « LM », et des méthodes bien conçues pour la classe « LM » seront appliquées au modèle linéaire pondéré à l`itération finale de IWLS. Cependant, les soins sont nécessaires, car les fonctions d`extracteur pour la classe «GLM» telles que les résidus et les poids ne sont pas seulement choisir le composant de l`ajustement avec le même nom. Certains analystes préfèrent une pénalité plus élevée par paramètre. En particulier, l`utilisation du log (n) au lieu de 2 en tant que multiplicateur donne le BIC, le critère d`information bayésien.
Dans notre exemple log (1607) = 7,38, nous aurions donc besoin d`une réduction de déviance de 7,38 par paramètre supplémentaire. La fonction Step accepte k comme argument, avec 2 par défaut. Vous pouvez vérifier que la spécification de k = log (1607) conduit à un modèle beaucoup plus simple; non seulement aucune nouvelle interaction n`est introduite, mais l`effet principal de l`éducation est abandonné (même s`il est significatif). GLM est utilisé pour s`adapter à des modèles linéaires généralisés, spécifiés en donnant une description symbolique du prédicteur linéaire et une description de la distribution d`erreur. Pour s`adapter à un modèle linéaire de base dans R, nous pouvons utiliser la fonction LM (): dans R tout ce travail se fait en appelant quelques fonctions, Add-on et Drop1, qui envisagent d`ajouter ou de supprimer un terme d`un modèle.