Bibm@th

Forum de mathématiques - Bibm@th.net

Bienvenue dans les forums du site BibM@th, des forums où on dit Bonjour (Bonsoir), Merci, S'il vous plaît...

Vous n'êtes pas identifié(e).

#1 11-04-2016 12:57:09

freddy
Membre chevronné
Lieu : Paris
Inscription : 27-03-2009
Messages : 7 457

Echantillonnage et médiamétrie

Salut,

entendu ce matin sur la poste : 5.000 "boites noires" servent à mesurer l'audience télévisuelle. Ces 5.000 boites noires sont censées représenter 25.000.000 de foyers, soit un taux de 0,02 % ! Autrement dit, chaque foyer équipé est représentatif de 5.000 foyers en moyennes.
Pour mesurer les enjeux, il faut savoir que ce sont ces audiences qui conditionnent la programmation de toute les chaînes gratuites et le prix à la seconde des spot publicitaires sur ces supports. Les chaînes à péages connaissent mieux leur part de marché. Elles font valser les présentateurs, les animateurs, avorter des émissions, donnent des boutons aux  directeurs de l'information, ceux des programmes et de l'insomnie aux directeurs généraux.

Qu'en pensez vous ?

Sur les principes de base, un échantillon est "correct" quand il est représentatif de la population selon certains caractéristiques. Personnellement, je pense à la CSP (au moins 7 valeurs), à la taille du foyer (nombre et âge des enfants, famille monoparentale ou non, l'âge regroupé par intervalle signification des adultes.

Retenons 7 CSP pour les adultes, les foyers sans enfant, avec 1, 2, 3 et plus de trois enfants. Dédoublons avec foyer mono parent ou avec un couple, puis complétons par tranche d'âge (important pour les cibles visées).
Pour les adultes, on prend entre 25 et 40 ans, moins de 50 ans et plus de 50 ans. On fait l'hypothèse que les couples sont dans la même tranche d'âge.
Pour les jeunes, on regroupe moins de 5 ans, entre 6 et 14 ans, entre 14 et 18 puis de 19 à 25 ans.

Au total et sauf erreur, on a 7x5x2x3x4 = 840 cases théoriques, car certaines n'ont peut-être pas de sens (couple de plus de 50 ans avec trois enfant de moins de 5 ans par exemples, quoi que ....).
Donc en moyenne et à la louche, 5,95 foyers par case. Comme il doit être représentatif de la population totale, il se peut qu'il y ait des cases avec un seul foyer. Ca fait froid dans le dos, non ? je fais confiance aux statisticiens, je sais comment les résultats bruts sont redressés, mais j'ai tout de même un léger frisson en pensant que l'avenir de mes émissions préférées dépend du point de vue de 3 gugusses qui me représentent !

Dernière question : comme dit dans le poste, connaissez vous quelqu'un qui connait quelqu'un qui connait un foyer équipé et a vu l'équipement ? Pour moi, c'est l'arlésienne. J'ai été sondé une fois par Médiamétrie pour la radio, en janvier 2012, indiquant durant un mois, heure par heure, la station écoutée, le lieu d'écoute et la seconde activité éventuellement pratiquée en écoutant.
Je n'ai jamais eu le retour de ce sondage via internet.

Dernière modification par freddy (11-04-2016 17:40:22)


De la considération des obstacles vient l’échec, des moyens, la réussite.

Hors ligne

#2 25-04-2016 18:04:35

Dlzlogic
Banni(e)
Inscription : 25-04-2016
Messages : 461

Re : Echantillonnage et médiamétrie

Bonjour,
Je suis nouveau sur ce forum.
J'ai lu avec intérêt votre étonnement. Je me suis aussi posé ce type de question.
Je n'ai pas d'information particulière, mais mon avis est que le calcul est fait par moyenne pondérée. Il y a une dizaine (en gros) d'issues possibles, c'est à dire les pourcentages correspondants à la dizaine de chaines testées. Un individu qui répond correspondra à l'une de 840 cases théoriques, tous les critères étant exclusifs, mais en réalité, il sera l'un des X% qui auront regardé telle chaine. Et je pense que c'est dans ce sens là que les résultats sont exploités.
D'ailleurs, ce sujet est intéressant et ce serait assez amusant de faire des simulations qui permettraient d'avoir une idée de la finesse du résultat.   
Je sais assez bien manier ce type de calcul.
Cordialement.

Hors ligne

#3 26-04-2016 07:51:00

freddy
Membre chevronné
Lieu : Paris
Inscription : 27-03-2009
Messages : 7 457

Re : Echantillonnage et médiamétrie

Salut,

merci de ta marque d'intérêt. Je ne comprends pas très bien : OK pour la moyenne pondérée, mais pour cibler des actions publicitaires à des heures d'écoute précises sur des "décideurs" précis (enfants de moins de 5 ans le dimanche matin, ménagère de plus de 50 ans avec 2 ados, célibataires avec poissons rouges,  ...), ça continue à me sembler fragile tout de même.
Comment t'y prendrais tu ?


De la considération des obstacles vient l’échec, des moyens, la réussite.

Hors ligne

#4 26-04-2016 11:16:40

Dlzlogic
Banni(e)
Inscription : 25-04-2016
Messages : 461

Re : Echantillonnage et médiamétrie

Bonjour,
Il faudrait se mettre d'accord sur un protocole.
D'abord la CSP. Peut-être y a-t-il de sources statistiques disponibles.
Le but de ce calcul est naturellement d'apprécier la finesse de la méthode et non le choix (bon ou mauvais) des spectateurs.
Donc on imagine un type d'émission, on "décide" du poids chaque critère, c'est à dire qu'on attaque le problème par la fin.
On "interroge" aléatoirement 5000 foyers sur les 25 millions, et on compare les résultats avec la grille de départ.
En fait le problème posé est de savoir si le choix de 5000 est représentatif du choix de 25 millions. 
Pour mémoire, cette notion de limite de confiance préoccupe pas mal de monde ces temps-ci.

Pour cibler les annonces publicitaires, je partirais d'une grille théorique, obtenue par des mesures précédentes, et je définirais les émissions et heurs d'écoute correspondantes.

Prenons un exemple simple : les aliments pour chat. A quelle heure et à qui les proposer ? Quand c'est la personne qui fait les courses qui regarde le télé.
(Saul le divertissement, les pub ne m'intéressent pas, contrairement aux proba).

Bonne journée.

Hors ligne

#5 28-08-2016 15:56:56

freddy
Membre chevronné
Lieu : Paris
Inscription : 27-03-2009
Messages : 7 457

Re : Echantillonnage et médiamétrie

Salut,

je fais remonter le sujet qui a attiré Dzl comme le sucre attire les guêpes.
Fidèle à son idée fixe, il propose une "moyenne pondérée" pour déterminer avec précision à quelle heure on doit passer un message publicitaires pour les propriétaires de chats angora ou bien pour les cibler les jeunes femmes sportives âgées de 18 à 30 ans pour rester sereines les jours de leurs lunes.
Ça relève du grand art et d'un profonde compréhension des sujets dont il veut parler.

Il attend une réponse, mais je me demande bien à quoi, puisque le post souligne un phénomène contemporain préoccupant, pas un problème à résoudre.


De la considération des obstacles vient l’échec, des moyens, la réussite.

Hors ligne

#6 11-10-2016 12:03:50

Milos
Membre
Inscription : 11-07-2013
Messages : 94

Re : Echantillonnage et médiamétrie

Bonjour,

freddy a écrit :

Au total et sauf erreur, on a 7x5x2x3x4 = 840 cases théoriques, car certaines n'ont peut-être pas de sens (couple de plus de 50 ans avec trois enfant de moins de 5 ans par exemples, quoi que ....).
Donc en moyenne et à la louche, 5,95 foyers par case. Comme il doit être représentatif de la population totale, il se peut qu'il y ait des cases avec un seul foyer. Ca fait froid dans le dos, non ? je fais confiance aux statisticiens, je sais comment les résultats bruts sont redressés, mais j'ai tout de même un léger frisson en pensant que l'avenir de mes émissions préférées dépend du point de vue de 3 gugusses qui me représentent !

Je doute de vous apprendre grand chose, mais à tout hasard je reprends mes cours de méthodes en épidémiologie.
Il y a évidemment intérêt à stratifier l'échantillon en plusieurs groupes relativement homogènes.
Je suppose que les sondeurs connaissent les paramètres de chacun des foyers équipés. Ils peuvent donc dans un premier temps regarder l'influence effective de ces paramètres ou regroupements de paramètres, et à partir de là choisir les strates les plus pertinentes, en tâchant d'en limiter le nombre (puisque d'ailleurs celles où la variance est plus élevée demandent des effectifs plus grands)
Et évidemment dans le second temps donner des estimations plus précises.
Enfin bon, je doute de toute façon que leurs résultats soient très précis..

Cordialement,

Hors ligne

#7 09-11-2016 07:40:54

freddy
Membre chevronné
Lieu : Paris
Inscription : 27-03-2009
Messages : 7 457

Re : Echantillonnage et médiamétrie

Salut,

et voilà, les sondages viennent encore de se prendre une belle gifle : à force de vouloir sonder moins de 1.000 gus "représentatifs" de quelque $n$ millions d'individu puis de corriger les résultats pour être "plus vraisemblables", les sondeurs d'opinion politique viennent encore, après le Brexit, de se prendre une belle claque aux USA.
Les sondages d'opinion ne font plus l'opinion, paradoxalement, c'est une bonne leçon d'inférence statistique.
Les gars, faut revoir impérativement vos cours et surtout les limites de l'exercice.


De la considération des obstacles vient l’échec, des moyens, la réussite.

Hors ligne

#8 09-11-2016 13:36:02

Fred
Administrateur
Inscription : 26-09-2005
Messages : 7 035

Re : Echantillonnage et médiamétrie

Salut,

  Tu as parfaitement raison. Je me demande si sur les sujets "sensibles" les sondages d'opinion apportent encore une réelle information. Pour en avoir discuté assez récemment avec un spécialiste, en France, le vote FN est tellement redressé qu'une toute petite erreur sur le facteur multiplicatif peut donner des résultats extrêmement différents.
  Il y a un autre cas d'école dont je ne sais pas comment il peut être géré : celui de la primaire de la droite qui doit avoir lieu fin novembre. Comment gérer toutes les incertitudes liées notamment au fait de voter ou non???

F.

Hors ligne

#9 09-11-2016 14:05:04

freddy
Membre chevronné
Lieu : Paris
Inscription : 27-03-2009
Messages : 7 457

Re : Echantillonnage et médiamétrie

Re,

déjà, j'aimerais qu'on revienne à une très ancienne pratique (abandonnée à partir de 1972/74) qui consiste à nous donner des résultats inscrits dans un intervalle de confiance à 5 % par exemple, que les sondeurs connaissent fort bien mais ne publient plus, seul le commanditaire ayant l'information.

Là, les résultats seraient tous inclus dans une fourchette genre [47.6 % ; 52.3 %] et les journaleux n'auraient plus qu'à aller se rhabiller au lieu d'envahir les ondes et participer au concours du commentaire le plus pertinent.

Sur je taux de participation, tu as raison, nul n'en parle et pourtant, c'est tout sauf "neutre" en ce sens que ça dirait combien de gens ça intéresse vraiment :-) et je suis quasi certain que presque tous les candidats connaissent parfaitement tous ces chiffres.


De la considération des obstacles vient l’échec, des moyens, la réussite.

Hors ligne

#10 09-11-2016 20:56:27

96Milos
Invité

Re : Echantillonnage et médiamétrie

Bonsoir,

Donner les IC n'y changerait pas grand chose, à part montrer la taille insuffisante de l'échantillon, en épidémiologie on dit que ce sont les biais qui posent le plus de problème dans ce genre de situations et que le résultat pourra bien plus facilement que 5 fois sur 100 sortir de l'IC

En premier lieu, les non-répondeurs ne se répartissent pas comme l'ensemble ayant répondu, s'ils ne répondent pas c'est qu'il y a un lien avec la question posée.

Et en second lieu, on raconte dans le cas des électeurs d'extrême droite qu'ils mentent carrément sur leur intention. Sans doute d'autres aussi.

La question de base est déjà différente et va influer sur la réponse : pour qui allez vous voter et pas pour qui avez-vous voté. Dans ce contexte, on peut aussi bien supposer que la personne qui répond répond sincèrement, qu'elle pense que sa réponse en dehors d'être honteuse peut à l'inverse pouvoir influer sur le vote dans un sens ou l'autre..

D'où ces redressements énormes des sondeurs et leurs erreurs. Il y en aurait bien moins si on demandait aux sondés s'il sucrent leur café ou autre au petit déjeuner, et encore je n'en suis pas sûr comme là aussi il y a des réponses "nutritionnelles" correctes supposées (à tort ou pas)

Pied de page des forums