Modèle probit multivarié

Les statistiques multivariées sont une subdivision de statistiques englobant l`observation simultanée et l`analyse de plus d`une variable de résultat. L`application de statistiques multivariées est une analyse multivariée. Le manuel de 1958 d`Anderson, une introduction à l`analyse multivariée [4], éduque une génération de théoriciens et de statisticiennes appliquées; Le livre d`Anderson met l`accent sur les tests d`hypothèses par test de ratio de vraisemblance et les propriétés des fonctions de puissance: recevabilité, préassignée et monotonicité. 5 [6] les statistiques multivariées concernent la compréhension des différents objectifs et du contexte de chacune des différentes formes d`analyse multivariée, et comment elles se rapportent les unes aux autres. L`application pratique de statistiques multivariées à un problème particulier peut impliquer plusieurs types d`analyses univariées et multivariées afin de comprendre les relations entre les variables et leur pertinence pour le problème étudié. Les données multivariées peuvent être classées grossièrement en trois types. Les vecteurs de réponse des données multivariées homogènes consistent en des observations du même attribut. Ces données sont courantes dans les expériences de mesures répétées et les études longitudinales, où le même attribut est mesuré à plusieurs reprises au fil du temps. Des données multivariées homogènes apparaissent également dans les statistiques spatiales où un ensemble de données géostatistiques est l`observation incomplète d`une réalisation unique d`une expérience aléatoire qui génère une surface bidimensionnelle. 100 les mesures de conductivité électrique du sol recueillies dans un peuplement forestier composent une seule observation d`un vecteur multivarié homogène de dimension 100. Des observations multivariées hétérogènes surviennent lorsque les réponses modélisées se réfèrent à des attributs différents, comme dans l`exemple précédent de poids et de hauteurs des enfants. Il existe deux sous-types importants de données multivariées hétérogènes. Dans les données multivariées homocatanomiques, les observations proviennent de la même famille distributionnelle.

Par exemple, les pondérations et hauteurs peuvent être supposées être normalement distribuées. Avec des données multivariées hétéroocatanomiques, les observations peuvent provenir de différentes familles distributionnelles. Voici des exemples de données multivariées hétéroocatanomiques: il existe un nombre énorme de progiciels et d`autres outils pour l`analyse multivariée, y compris: pour chaque patient, vous observez la pression artérielle (un résultat continu), le nombre de épisodes d`une maladie (une variable de comptage), et si le patient a des antécédents de diabète dans la famille (un résultat binaire). Un modèle multivarié qui modélise les trois attributs conjointement pourrait supposer une distribution lognormale pour les mesures de la pression artérielle, une distribution de poisson pour la variable de comptage et une distribution de Bernoulli pour l`histoire familiale. Rappelez-vous que linéaire implique ce qui suit: disposés ou s`étendant le long d`une ligne droite ou presque droite. Linéaire suggère que la relation entre la variable dépendante et indépendante peut être exprimée en ligne droite. Rappelons la discussion sur la définition du t-Stat, de la valeur de p et du coefficient de détermination. Ces concepts s`appliquent également dans les modèles de régression multivariée. L`évaluation du modèle est la suivante: les modèles de régression linéaire offrent une approche simple pour l`apprentissage supervisé.