Sondages à probabilités inégales STA Enquêtes et sondages Octobre Philippe Périé 1 Sondages à probabilités inégales Les sondages aléatoires simples ne sont utilisés qu en l absence de toute autre. Introduction à la théorie des sondages – Cours 4 Antoine Rebecq antoine. Développement limité Soient f une fonction définie au voisinage de a R éventuellement non définie en a et n N. Les objectifs sont les suivants: Comment enseigner les méthodes quantitatives en économie?

Nom: macro calmar
Format: Fichier D’archive
Système d’exploitation: Windows, Mac, Android, iOS
Licence: Usage Personnel Seulement
Taille: 63.64 MBytes

Population générale Plus en détail. Chapitre 9 Corrélation – Régression Exercices commentés. Elle fait correspondre à une valeur. Ensuite, une fois mon redressement effectué comment puis-je faire pour avoir estimer la proportion d’une caractéristique pour chacune de mes variables à l’aide de SAS par exemple j’ai 99 variables et je fais mon redressement à la fois sur le sexe, l’âge et le niveau d’études? En effet, contrairement à la méthode linéaire tronquée, la méthode logit n atteint pas strictement les bornes.

Aujourd hui, le développement des enquêtes par sondage et leur extension à des domaines d application diversifiés ont entraîné une mise à contribution de plus en plus fréquente de la population.

Dans un objectif de minimisation de l effet de lassitude des individus d une part, et des coûts de réalisation des enquêtes d autre part, on est souvent conduit à travailler sur des échantillons de taille restreinte. Dans ce contexte, les soucis de pertinence de l échantillon traduite par sa représentativité et de précision des estimations conduisent le plus souvent mxcro utiliser des informations auxiliaires, lorsqu elles sont disponibles.

Capmar peuvent être introduites à deux niveaux: Ces deux approches reposent toutes deux sur la disponibilité d informations auxiliaires, les utilisent différemment, mais visent un même objectif: Cette technique a pour objectif de réduire la variance des estimateurs.

Pour cela, on pourra surreprésenter les strates dans lesquelles la dispersion est la plus grande. En effet, la variance étant inversement proportionnelle à la taille de l échantillon, si on sur-représente cette strate, les estimateurs seront plus précis. On sur-représentera également des sous-populations ayant des effectifs trop faibles afin d obtenir, sur cette sous-population, des estimations aussi précises que possible en comparaison avec l ensemble de la population. Aurélie Vanheuverzwyn est chargée d études et maro méthodes à la Direction Recherche et Méthodes de Médiamétrie.

Le redressement Lorsque les informations auxiliaires maro on dispose sont insuffisantes ou trop contraignantes pour être utilisées au moment de l échantillonnage, on les utilise comme critères de redressement. L objectif du redressement est de calmzr affranchir des fluctuations d échantillonnage en corrigeant des éventuelles divergences de structure, entre l camlar et la population, de critères corrélés avec les variables d intérêt.

L étape préalable à tout redressement sera donc la recherche de tels critères.

REDRESSEMENT PAR LA MACRO CALMAR : APPLICATIONS ET PISTES D AMELIORATION

On ajuste ensuite l échantillon sur la population au regard de ces critères, qu on appellera critères de redressement ou de calage. Lorsqu on désire ajuster l échantillon sur une seule variable auxiliaire, si celle-ci est quantitative, on utilise l estimateur par calar quotient. Si, en revanche, elle est qualitative, on utilise la poststratification.

Dans la plupart des enquêtes, on dispose de plusieurs critères de calage et l on souhaite ajuster l échantillon sur l ensemble de ces critères simultanément. Si on connaît la répartition des individus de la population selon les croisements des modalités de ces différents critères, on se retrouve dans le cas de la post-stratification.

Mais généralement, on ne connaît que les distributions marginales et on utilise alors la méthode de calage sur marges. Le calage sur marges Le calage sur marges consiste donc à ajuster notre échantillon sur les marges des critères de contrôle, marges que l on connaît sur l ensemble de la population.

Pour cela, camar affecte des poids de redressement à tous les individus de l échantillon afin de pouvoir construire des estimateurs linéaires des variables d intérêt. On impose néanmoins à ces poids d être aussi proches que possible des poids d échantillonnage. Préalablement au redressement, les totaux des variables d intérêt peuvent être estimés par l estimateur de Horwitz-Thompson: Mqcro a donc un estimateur linéaire où le poids final attribué à chaque individu est égal au poids d échantillonnage multiplié par le coefficient de redressement.

Le coefficient de redressement doit être aussi proche que possible de, traduisant un moindre écart avec le poids initial clamar sondage. Pour que cette dernière calmat soit au mieux respectée, il faut éviter de multiplier exagérément les macroo de redressement et s imposer un nombre minimal d individus par modalité par exemple, pas moins de individus par modalité. Il conviendra aussi de vérifier l indépendance linéaire des critères de calage.

  TÉLÉCHARGER VIDEO YAMADA MA PREMIERE FOIS 3GP GRATUIT

En effet, toute colinéarité non structurelle entraînerait la non-convergence de l algorithme. Exemple Prenons l exemple de deux critères: On connaît, à partir des données de l INSEE, calmaar répartition des individus dans les classes d activité g i.

macro calmar

On a donc 9 marges. Pour ce qui est de l échantillon, on connaît de même les effectifs marginaux f i. L objectif est de faire tendre les marges de l échantillon les f i. Autres inactifs f f f 3 f f 5 f. Celui-ci doit être aussi proche que possible de. Le domaine de définition étant de calmra strictement positifs.

On détermine l intervalle optimal, au sens de l étendue la plus réduite, par approximations successives: Distribution « type » des coefficients de redressement Densité Linéaire Raing ratio Logit Linéaire tronquée,5,9,95,5,5, On a là des allures assez courantes des distributions des coefficients de redressement. On remarque que la méthode linéaire est la plus étendue vers la gauche, c est-à-dire qu elle donne les poids les plus faibles. La méthode raing ratio donne quant à elle les macto les plus élevés.

Les méthodes bornées ont, par définition, les étendues les plus faibles, mais les distributions des coefficients de redressement ont des allures moins proches de la courbe de Gauss de par les accumulations aux bornes. La méthode linéaire est celle qui converge le plus rapidement après deux itérations.

La macro SAS CALMAR | Insee

La méthode raing ratio donne des poids plus élevés que ceux issus de la méthode linéaire. Elle donne généralement la distribution la plus dissymétrique c est-à-dire la plus étendue vers la droite. Les méthodes bornées ont l avantage d avoir une étendue restreinte.

La contrepartie est l accumulation des poids sur ou au voisinage des deux bornes. En effet, contrairement à la méthode linéaire tronquée, la méthode logit n atteint pas strictement les bornes. La détermination des bornes se fait par approximations successives: Ces quatre méthodes sont asymptotiquement équivalentes et la précision des estimateurs ne marco pas de la maro de pondération choisie.

Les critères de choix entre les quatre méthodes sont donc finalement subjectifs: On pourra également se fier à l allure générale de la distribution des coefficients de redressement. Généralement, on préfèrera éviter d avoir des poids trop élevés ou trop faibles: Médiamat Médiamat est l outil de référence dans la mesure de l audience de la télévision en France au niveau national.

Il fournit quotidiennement l audience chaîne par chaîne. Des quotas sont de plus imposés au niveau des foyers. Il s agit d un sondage par grappes: Préalablement à l estimation sont effectués deux redressements: A l issue du F F F redressement, son poids final poids de redressement vaut: Ceci est justifié par la structure en grappes du plan de sondage. A l issue du redressement individuel, son poids final vaut: Les distributions des coefficients de redressement sont les suivantes: Distribution des coefficients de redressement du Médiamat,5 Densité,5,5,75,5 linéaire raing ratio logit linéaire tronquée,,3,5,7,9,3,5,7,9,3,5,7,9 3, 3,3 3,5 3,7 3,9, – 7.

La méthode raing ratio donne quant à elle des coefficients pouvant allant jusqu à, c est-à-dire qu un poids initial peut être multiplié par un coefficient de redressement allant jusqu à, ce qui paraît excessif. Les méthodes bornées permettent de réduire l intervalle à [, ;,]. Les allures générales des courbes sont similaires pour les quatre méthodes.

On choisira donc plutôt une méthode bornée et, afin d éviter une accumulation excessive des coefficients aux bornes, on optera pour la méthode logit. C est une enquête en face à face qui a pour but de quantifier l équipement multimédia des Français ainsi que les usages et comportements induits.

La population de référence est celle des individus de ans et plus. Le plan de sondage repose sur une stratification région UDA 9 régions par type d agglomération 5 catégories. Un redressement est ensuite effectué. Ce redressement a la particularité d ajuster l échantillon de foyers sur des critères exprimés en nombre de foyers et des critères exprimés en nombre d individus.

Pour passer d une base de données de niveau foyers à une base de niveau individus, on attribue à chaque individu le poids du foyer auquel il appartient, ceci étant justifié par la structure en grappes. Comparons les distributions des coefficients de redressement selon les quatre méthodes.

  TÉLÉCHARGER FISTON 1FICHIER GRATUITEMENT

Distribution des coefficients de redressement de la Multimédia linéaire raing ratio logit linéaire tronquée,5,5,5,5 On constate que les allures générales sont très différentes entre les méthodes non bornées et les méthodes bornées. La méthode linéaire donne des coefficients de redressement négatifs allant jusqu à,7.

La borne supérieure vaut. La distribution des coefficients issus de la méthode 3 Institut de Sondages Lavialle Union des Annonceurs -. La borne minimale vaut, et la borne maximale 3. Les méthodes bornées permettent de réduire de manière assez importante l intervalle dans lequel sont compris les coefficients, mais on remarque, dans le cas de l intervalle optimal au sens de l étendue minimale [,5 ;,5], une accumulation excessive aux bornes ou à leur voisinage.

Cette accumulation est le signe de contraintes de bornage un peu trop fortes.

macro calmar

La distribution obtenue est la suivante. Distribution des coefficients de redressement de la Multimédia marco [,5 ;,5] logit [,5 ;,] linéaire tronquée [,5 ;,5] linéaire tronquée [,5 ;,] Densité,5,7,9,3,5 Sur ce graphique sont comparées uniquement les méthodes bornées: La distribution obtenue est plus satisfaisante pour ce dernier dans la mesure où l accumulation aux bornes est moins importante et on retrouve une densité élevée aux alentours de.

Pistes d amélioration Même si les méthodes bornées ont l avantage de permettre une distribution des poids de redressement dans un intervalle réduit, l allure de cette distribution peut cakmar gênante de par les accumulations aux bornes. Mais dans une optique de production, cette manipulation est peu concevable. Une idée pour y remédier est de concevoir une fonction de distance adaptée à la production, c est-à-dire autonome ; plus cette fonction est convexe, moins la distribution des poids de redressement est étendue.

En effet, soient deux fonctions de distance G et G définies sur le domaine D, telles que: G x G xx D, alors les coefficients de redressement, solutions du problème d optimisation sous contraintes, seront plus concentrés autour de avec G qu avec G.

CALMAR 2 : UNE NOUVELLE VERSION DE LA MACRO CALMAR DE REDRESSEMENT D ÉCHANTILLON PAR CALAGE

Une nouvelle fonction G La fonction sinus hyperbolique a retenu notre attention dans la mesure où sa croissance est plus forte que celle des fonctions G proposées sous CALMAR.

Pour que G soit une fonction de distance, il faut qu elle vérifie les conditions suivantes: Applications aux données de la Multimédia L application de cette distance aux exemples du paragraphe précédent donne une distribution des coefficients de redressement similaire à celle issue de la méthode raing ratio, mais située dans un intervalle de valeurs plus restreint.

Si on reprend l exemple de la Multimédia, la méthode dérivée de la fonction sinus hyperbolique donne des coefficients de redressement compris entre,3 et, alors qu avec la camar raing ratio ceux-ci s inscrivent dans l intervalle [, ; 3, ]. Cette nouvelle fonction de distance permet donc de réduire confortablement l intervalle des coefficients de redressement, tout en conservant une allure générale satisfaisante Applications aux données du Médiamat L application de cette distance aux données du Médiamat est également concluante: Distribution calmzr coefficients de redressement du Médiamat raing ratio sinus hyperbolique densité,5,5,5 3, 3,5, On se rapproche ainsi de l intervalle optimal des méthodes bornées [, ;,]sans avoir l inconvénient des accumulations aux bornes.

macro calmar

En effet, en accentuant la convexité de la fonction de distance, on réduit, de manière mécanique, -. Le bornage de la fonction de distance apparaît comme un avantage de la méthode puisqu il permet, par le choix des bornes, de maîtriser l étendue de la distribution des coefficients de redressement, tout en gérant au mieux la question de l accumulation au voisinage des bornes.

On peut cependant souhaiter s affranchir de cette dernière question en renonçant au bornage mais en prenant une fonction de distance pénalisant rapidement et fortement les valeurs qui s éloignent de.

C est le sens de la dernière fonction proposée, dont on a vu l apport par calmad à la fonction raing ratio.