Géométriquement le forum Dlz9
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.

Aller en bas
Dlzlogic
Dlzlogic
Admin
Messages : 9505
Date d'inscription : 26/04/2019
Age : 80
Localisation : Proville
http://www.dlzlogic.com

Cours de statistique Empty Cours de statistique

Ven 6 Mar - 14:31
Bonjour,
Je suis entrain de lire un cours de statistique : https://www.imo.universite-paris-saclay.fr/~gassiat/M1Stat.pdf
J'ai une certaine admiration envers le étudiants qui acceptent ce genre de document comme support de cours.
Mais ce n'est pas le sujet de ce fil.
J'ai réagi souvent concernant le sens des termes. Il est vrai que j'attache beaucoup d'importance à cela. Pour moi un terme doit avoir un sens précis et unique dans un contexte donné. Dans les cours sur le sujet des probabilité ou de la statistique, on lit souvent "soit une suite de variables aléatoires". Ces termes sont au pluriel, donc il y a plusieurs variables. On sait que l'on appelle "variable aléatoire" une fonction qui revoit un certain nombre de valeurs. Lorsque "variables" est au pluriel, cela signifie qu'il y a plusieurs variables. Or, il s'avère que très souvent il y a une seule variable mais plusieurs valeurs. L'ambiguïté est d'autant plus flagrante si l'auteur rajoute "iid et de même loi". En fait, il manque le terme "valeurs" et iid est sous-entendu puisque "aléatoire" est précisé et qu'il n'y a qu'un seul hasard, et "de même loi" est évident puisqu'il s'agit d'une seule variable, donc d'une seule fonction.

Or dans ce cours, on voit souvent l'expression habituelle écrite ainsi : "soit une suite de variable aléatoires". Le mot "variable est au singulier". Grammaticalement cela est une faute d'accord, sauf que l'auteur ne s'est pas trompé et il s'agit bien d'une seule variable.

Il y est, comme souvent, question de "biais". Je rappelle que dans le cas de calcul d'écart-type, ou de variance, ce qui est souvent le cas, comme dans ce cours, ce qui est appelé "biais" est une faute de calcul. Le biais, par définition ne peut pas être calculé et il s'applique à la moyenne adoptée.

J'ai lu des cours où il n'y avait pas de doute sur l'unicité de la variable et il était bien écrit "une variable aléatoire", mais c'est assez rare. Dans un cours, on peut à peu près suivre le raisonnement, mais l'emploi du terme "suite" laisse un doute, puisqu'il sous-entend une progression ou un ordre des valeurs, le préfère de terme "liste".
Par contre, dans l'énoncé d'un exercice, forcément hors contexte, ce type d'expression passe-partout est incompréhensible.
avatar
Invité
Invité

Cours de statistique Empty Re: Cours de statistique

Ven 13 Mar - 10:59
Ton arrogance et incapacité à te remettre ne question est quand même incroyable... Elisabeth Gassiat (https://www.imo.universite-paris-saclay.fr/~gassiat/CV.pdf), chercheuse en stat qui a encadré une quinzaine de thèse et publié une 50aine d'articles utilise à bon escient des termes que tu refuse de comprendre. Le fait qu'elle oublie 2 's' sur 16 occurences dans son document ne change rien... Et son poly est globalement bien écrit.

Une variable aléatoire réelle (ce dont on parle pour parler de loi des grands nombre par exemple) est une fonction de l'ensemble des évènements (Omega) dans R. Une suite de variables aléatoires est une suite de ces fonctions. Le fait qu'elles soit indépendantes et de même loi est une hypothèse fort utile pour la plupart des théorèmes fondamentaux des statistiques, en premier lieu la loi des grands nombres et le théorème central limite.

Prenons un exemple : je lance deux pièces (une de 1€ et une de 2€) et regarde les faces qui apparaissent.
Ici Omega a donc 4 éléments {(P,P),(P,F),(F,P),(F,F)}. Je considère 3 variables aléatoires :
X : 1 si la pièce de 1€ est tombé sur P, 0 sinon
Y: 1 si la pièce de 2€ est tombé sur P, 0 sinon
Z: 1 si les deux pièces ont la même face, 0 sinon

On a donc
X((P,P))=1
X((P,F))=1
X((F,P))=0
X((F,F))=0

Y((P,P))=1
Y((P,F))=0
Y((F,P))=1
Y((F,F))=0

Il s'agit donc bien de 2 variables aléatoires (fonctions) différentes.

Supposons que les pièces soit équilibrées et les lancer indépendants, c'est à dire que Pr((P,P))=Pr((P,F))=Pr((F,P))=Pr((F,F))= 1/4.
Alors X, Y et Z sont de même loi. En effet P(X=1)=P(Y=1)=P(Z=1)=1/2 et P(X=0)=P(Y=0)=P(Z=0)=1/2.
X et Y sont indépendantes : en effet on peut vérifier que
P(X=1,Y=1) = P(X=1)*P(Y=1)
P(X=1,Y=0) = P(X=1)*P(Y=0)
P(X=0,Y=1) = P(X=0)*P(Y=1)
P(X=0,Y=0) = P(X=0)*P(Y=0)

Pour faire des statistiques (en version simple du moins) on considère que l'on a une suite de variable aléatoires indépendantes et i.i.d.
Par exemple on suppose qu'on a une infinité de pièces équilibrées à lancer de manière indépendantes, et X_i définie la face du i-ème lancer.
Ce n'est pas "une seule variable aléatoire" mais bien différentes variables aléatoire qui sont indépendantes et de même loi.

Bon et sinon le biais d'un estimateur est quantité bien définie (pas une faute de calcul)... Que tu n'en comprennes pas l'utilité n'est pas surprenant
mais pas suffisant pour dénigrer son existence. On peut préférer choisir un estimateur biaisé si on réduit sa variance (plus généralement connu
sous le nom "compromis biais / variance").


avatar
beagle
Messages : 3696
Date d'inscription : 29/06/2019

Cours de statistique Empty Re: Cours de statistique

Ven 13 Mar - 12:07
Bonjour Syllviel, pour le biais
un exemple possible, je ne sais pas si cela conviendra à Pierre.

Deux appareils de mesures de je sais pas quoi qui fait en moyenne 1 metre, 1 kg , 1 truc
Un appareil sort des mesures qui sont en moyenne à 1,12 mais avec un écart type tres faible
Un appareil sort des mesures qui sont en moyenne à 0,98 mais avec un écart-type double du premier appareil

ben on préférera mesurer avec le premier appareil qui est plus précis, on enlèvera juste son biais.
Dlzlogic
Dlzlogic
Admin
Messages : 9505
Date d'inscription : 26/04/2019
Age : 80
Localisation : Proville
http://www.dlzlogic.com

Cours de statistique Empty Re: Cours de statistique

Ven 13 Mar - 12:24
Bonjour Sylviel,
D'abord, concernant ma "remise en question" que je suis "incapable" de faire, il me parait nécessaire de faire quelques petites remarques.
Quand j'ai lu les forums sur ces sujets j'ai découvert toute une série de notions et de termes que je ne connaissais pas. J'ai du beaucoup lire et me renseigner.
Par contre, il y a des notions que je connaissais parfaitement et parallèlement, je savais que, d'une façon générale, le matheux ne connaissaient pas ces notions de base mais ont appris certaines applications.
Donc tous ces termes passe-partout, pour comprendre de quoi il s'agissait, il a fallu que je lise beaucoup, parce que les définitions sont rares, Wikipédia est, par définition, non crédible (je peux développer si tu veux) et, lorsqu'il y a des définitions, elles  sont contradictoires.
Le sens de "biais" est un bon exemple. On en parle souvent à propos du calcul de l'écart-type. J'ai déjà expliqué souvent, en particulier dans le parier "Notion de probabilités" que tu qualifies de "torchon", sans dire pourquoi (preuve de ta compétence et de ta bonne foi).      
Je te cite :

Sylviel a écrit:Bon et sinon le biais d'un estimateur est quantité bien définie (pas une faute de calcul)... Que tu n'en comprennes pas l'utilité n'est pas surprenant
mais pas suffisant pour dénigrer son existence. On peut préférer choisir un estimateur biaisé si on réduit sa variance (plus généralement connu
sous le nom "compromis biais / variance").

D'abord, tu parles d'"estimateur". J'ai souvent posé la question de savoir si c'était une valeur ou une méthode. Il est vrai que cette confusion entre fonction et valeur est fréquente dans tes explications. Oui le biais est une quantité bien définie, puisque c'est la différence entre la valeur observée et la valeur vraie. Dans ma spécialité on appelle cela "erreur systématique". Il est possible de l'évaluer, mais c'est un autre sujet.
Dans le cas du calcul de l'écart-type, ou de son carré ( qu'on appelle la variance).
La définition de l'écart type est parfaitement précise : c'est l'écart moyen quadratique. Seulement il y a un problème, soit on connait la moyenne vraie, soit l'opération réalisée a justement pour but de déterminer cette moyenne. Ce sera donc une moyenne observée (appelée poétiquement "empirique"). En ce cas le dénominateur dans la formule est N-1, si N est le nombre de mesures. En aucun cas c'est "comme on veut", il n'y a pas à choisir, encore moins à trouver un compromis. 
Je sais bien que cette notion fait partie de celles qui sont apprises aux matheux, sans justification. Toi, tu es en début de carrière, tu peux encore te remettre en question et cela peut t'être utile.
Il y deux arguments incontestables en ma faveur :
1- ton ignorance de la raison pour laquelle en cas de plusieurs mesures de la même chose, dans les mêmes conditions, on adopte la moyenne arithmétique. Cela apparait dans toutes les formules. Il me paraitrait normal de se poser la question.
2- ton incompréhension de la corde de Bertrand. Jacques Harthong le détaille avec le plus grand soin, mais toi, tu es tellement sûr de tes certitudes que tu t'es contenté de chercher, et tu l'as trouvé, le bout de phrase qui te permettra de dire que j'ai tort.

Concernant la distinction entre "une liste de valeurs d'une variable aléatoire" (ce qui devrait être écrit) et "une liste de variables aléatoires", je connais la capacité des X à savoir démontrer ce qu'ils ont décidé de démontrer, dans le seul but de dire que l'autre a tort.
Dlzlogic
Dlzlogic
Admin
Messages : 9505
Date d'inscription : 26/04/2019
Age : 80
Localisation : Proville
http://www.dlzlogic.com

Cours de statistique Empty Re: Cours de statistique

Ven 13 Mar - 12:29
Oui, l'exemple de Beagle est correct.
Dans le premier appareil, le "biais" est 0.12, dans le second il est 0.02.
Dans tous les cas l'écart-type est calculé.
Dlzlogic
Dlzlogic
Admin
Messages : 9505
Date d'inscription : 26/04/2019
Age : 80
Localisation : Proville
http://www.dlzlogic.com

Cours de statistique Empty Re: Cours de statistique

Ven 13 Mar - 14:54
Cette question de la différenciation entre la chose et ce qui l'a crée est intéressante.
J'ai observé bien souvent ce phénomène. Il produit par exemple qu'un étudiant va d'abord chercher "comment" il va résoudre le problème avant de rechercher "quel" est le problème à résoudre. Je n'insisterai pas sur un exemple qui a fait l'objet de nombreux échanges, bien qu'il soit très caractéristique. Le but de ce message est d'analyser le phénomène et d'essayer d'en trouver la cause.

Chacun sait que l'une de mes spécialités est l'informatique dite scientifique, en termes plus modernes, on dirait plutôt CAO.
Quand j'ai commencé dans ce domaine, il s'agissait de choses très simples puisqu'il s'agissait de faire faire par la machine des opérations répétitives qu'on faisait à la main, soit avec une table de logarithme, soit avec une table de valeurs naturelles et une machine à calculer mécanique.
Puis sont arrivés les problèmes de dessin automatique. Cela était limité au report des points calculés. Assez vite, certains dessins plus technique comme les profils, les coupes, les courbes de niveau ont été abordés et là, il ne s'agissait plus seulement de "faire des calculs comme avant", mais d'indiquer à la machine ce qu'elle devait calculer pour produire un dessin.
Il est bien évident que les programmes informatiques devenaient de plus en plus volumineux et compliqués.

C'est alors qu'il y a eu un changement complet dans la logique de programmation. La programmation linéaire et séquentielle, seule admise dans les années 70, était très mal vue, dès le début des années 80. J'ai un souvenir très précis d'étudiants en stage de fin d'étude qui préféraient écrire une fonction pour chaque cas indépendamment plutôt qu'écrire une fonction unique traitant les situations au fur et mesure. C'était la programmation orientée objet avant la lettre. Pour être plus précis, il traitaient "le triangle", alors que moi je traitais "les segments" qui l'intersectaient. Je pourrai détailler si ça intéresse quelqu'un.

C'est alors qu'est apparu officielle la "programmation orientée objet". Sans rentrer dans les détails, le principe est le suivant : on défini un certain nombre d'objets. Personnellement je me suis limité à des "objets" relativement simples, le point, la ligne, la zone. Ces objets sont créés à une étape donnée du programme, et en créant un objet, on sait qu'il aura toute sorte de possibilité, lesquelles ont été définies il y longtemps, éventuellement par un autre développeur, le tout étant écrit dans une bibliothèque.
Ces possibilités peuvent être de toute sorte, d'abord, son mode de création, les constructeurs, ses possibilités de mise à jours, ses liaisons avec d'autres objets etc., sa destruction lorsqu'il est devenu inutile. Il est clair que l'activité intellectuelle du développeur se focalise sur l'utilisation de ces objets plutôt que sur l'opération à mener à bien.
Je vais prendre un exemple simple, la résolution d'un système linéaire, c'est très courant en calcul informatique. Les auteurs de logiciels ont prévu des classes "vecteur" et "matrice". Parallèlement les matheux ont enseigné le calcul matriciel. Il est donc logique qu'un développeur aura tendance à décrire son système linéaire sous forme matricielle et résoudra son système en utilisant les opérations sur les matrices. Or, dans le cas de cet exemple, il existe une méthode efficace de résoudre un tel système : le pivot de Gauss. Cette méthode est étudiée pour avoir le maximum de précision du résultat avec le minimum de calculs. Naturellement les opérations sur les matrices dans la bibliothèque concernée ne peut pas réaliser cela, pour la simple raison que les fonctions ne savent pas que le problème à résoudre est le calcul d'un système linéaire. J'ai déjà souvent évoqué ce problème.
Dlzlogic
Dlzlogic
Admin
Messages : 9505
Date d'inscription : 26/04/2019
Age : 80
Localisation : Proville
http://www.dlzlogic.com

Cours de statistique Empty Re: Cours de statistique

Ven 13 Mar - 16:39
Bon, au risque de me répéter, je tiens à confirmer que le biais, s'il est synonyme de "erreur systématique" comme dans l'exemple de Beagle, son emploi est correct et sans ambiguïté.
Par contre, si ce terme est associé au calcul de l'écart-type ou de son carré, la variance, alors, c'est un faute de calcul.
Il est possible que le biais soit connu, par exemple par une méthode d'étalonnage, en ce cas, on peut et on doit faire la correction.
On considère généralement que le biais n'est pas connu, et comme le disait La Palisse "Si une erreur était connue, ce ne serait pas une erreur !"
avatar
beagle
Messages : 3696
Date d'inscription : 29/06/2019

Cours de statistique Empty Re: Cours de statistique

Ven 13 Mar - 17:54
Salut Pierre,
"le biais, s'il est synonyme de "erreur systématique"

ah ben voilà je comprends mieux ton usage de erreur pour le biais.
Dlzlogic
Dlzlogic
Admin
Messages : 9505
Date d'inscription : 26/04/2019
Age : 80
Localisation : Proville
http://www.dlzlogic.com

Cours de statistique Empty Re: Cours de statistique

Ven 13 Mar - 18:52
Oui, c'est une notion très importante.
Les erreurs systématiques se combinent par multiplication, les erreurs accidentelles se combinent quadratiquement.
Exemple.
J'ai un appareil de mesure qui a une erreur systématique de 5 mm pour 10 m. et une erreur accidentelle de 10 mm par portée, c'est à dire pour 10 m.
Le mesure une distance de 1000 m. J'ai donc 100 portées.
L'erreur sur cette distance sera 100 x 0.005 = 0.50 m.
L'ecart-type sur cette même distance sera 0.01 x racine(100) = 0.10 m.

De nombreux matheux calculent l'écart-type en divisant par N. Alors que la moyenne n'est pas connue. Imagine ce que ça donne pour une mesure unique. Sylviel m'a sorti que ça faisait un écart-type nul, alors pourquoi faire plus d'une mesure, puis si l'écart-type est nul, l'intervalle de confiance est réduit à zéro donc la valeur est vraie.
D'où mon affirmation : parler de biais à propos du calcul de l'écart-type, c'est une faute de calcul. C'est écrit partout.
avatar
beagle
Messages : 3696
Date d'inscription : 29/06/2019

Cours de statistique Empty Re: Cours de statistique

Sam 14 Mar - 10:43
Je trouve que Syllviel a très bien expliqué la notion de variables aléatoires:

erreur c'est pour le message suivant


Dernière édition par beagle le Sam 14 Mar - 12:12, édité 2 fois
Dlzlogic
Dlzlogic
Admin
Messages : 9505
Date d'inscription : 26/04/2019
Age : 80
Localisation : Proville
http://www.dlzlogic.com

Cours de statistique Empty Re: Cours de statistique

Sam 14 Mar - 12:03
Bonjour Beagle,
J'avais omis de réagir sur ce point et je comptais le faire aujourd'hui.
Je rappelle la question évoquée et le sujet de notre désaccord : on lit souvent dans les énoncés d'exercices "soit une suite de variables aléatoires iid, ...".
Pour mémoire iid veut dire "indépendantes et identiquement distribuées", forcément au pluriel.
Alors la question que je pose : y a-t-il plusieurs variables, forcément, puisque le pluriel est utilisé.
Je cherche la signification de "variable aléatoire", je lis, et c'est très précis partout, que c'est une fonction qui renvoie des valeurs aléatoires suivant une loi donnée.

Wikipédia a écrit:En théorie des probabilités, une variable aléatoire est une application définie sur l'ensemble des éventualités, c'est-à-dire l'ensemble des résultats possibles d'une expérience aléatoire.  
Donc si "variables aléatoires" est au pluriel, il y a plusieurs applications (que j'appelle fonction dans mon vieux vocabulaire). Il n'est nulle part fait référence à une notion de probabilité. L'expression "ensemble des éventualités" est parfaitement satisfaisante, elle évite l'usage de "loi de probabilité".

En lisant cet énoncé, on imagine de quelles variables il pourrait s'agit, la taille, l'age, le niveau d'étude, le pays d'origine, la situation professionnelle etc., ben non, dans l'énoncé mis en cause, il s'agit d'une liste de valeurs d'une certaine variable, par exemple, une liste de taille, une liste de numéros minéralogiques.

Tout simplement, dans ce libelle d'énoncé il manque le mot "valeurs" qui, lui, est au pluriel, alors que dans cet énoncé in n'y a qu'une seule variable aléatoire.
L'explication de Sylviel est très astucieuse : il ne répond pas à la question. Il embraye sur les probabilités, alors que cette notion n'est pas évoquée dans la question posée.
Son explication mériterait des critiques, par exemple sur l'indépendance, mais c'est un tout autre sujet, et ce n'est pas mon habitude de diverger comme savent le faire les X.
avatar
beagle
Messages : 3696
Date d'inscription : 29/06/2019

Cours de statistique Empty Re: Cours de statistique

Sam 14 Mar - 12:10
Salut Pierre , tu fais référence à quel énoncé?
"En lisant cet énoncé, on imagine de quelles variables il pourrait s'agit, la taille, l'age, le niveau d'étude, le pays d'origine, la situation professionnelle etc., ben non, dans l'énoncé mis en cause, il s'agit d'une liste de valeurs d'une certaine variable, par exemple, une liste de taille, une liste de numéros minéralogiques.

Tout simplement, dans ce libelle d'énoncé il manque le mot "valeurs" qui, lui, est au pluriel, alors que dans cet énoncé in n'y a qu'une seule variable aléatoire."

lorsque Syllviel écrit:
"Par exemple on suppose qu'on a une infinité de pièces équilibrées à lancer de manière indépendantes, et X_i définie la face du i-ème lancer.
Ce n'est pas "une seule variable aléatoire" mais bien différentes variables aléatoire qui sont indépendantes et de même loi."
c'est bien, c'est clair, non?
Dlzlogic
Dlzlogic
Admin
Messages : 9505
Date d'inscription : 26/04/2019
Age : 80
Localisation : Proville
http://www.dlzlogic.com

Cours de statistique Empty Re: Cours de statistique

Sam 14 Mar - 12:48
Il n'y a pas de préférence précise, cette phrase se retrouve très souvent.


lorsque Syllviel écrit:
"Par exemple on suppose qu'on a une infinité de pièces équilibrées à lancer de manière indépendantes, et X_i définie la face du i-ème lancer.
Ce n'est pas "une seule variable aléatoire" mais bien différentes variables aléatoire qui sont indépendantes et de même loi."
c'est bien, c'est clair, non?
Qu'est-ce qu'on étudie dans cette expérience ? La manière dont se répartissent les X_i ? je me trompe ?
S'il y a N pièces, il y a N X_i indépendants, pouvant être mis en liste (là, elle doit être ordonnée), la variable est l'ensemble de ces résultats, ou plus précisément l'application qui a produit cette liste.
Il y a une seule variable qui prend N valeurs.
Une loi se rattache à une application, donc à une variable aléatoire et non à un résultat isolé.
En écrivant cela, je me rends compte à quel point c'est important. Au début, je croyais que c'était juste une forme de style, qui était incompréhensible mais tout le monde était habitué, et en fait, c'est beaucoup plus grave pour certains : une liste résultante d'une expérience n'a de signification et de valeurs que prise dans son ensemble.
Pour reprendre l'exemple de Sylviel, on se fout que X_i soit Pile ou Face, ce qui est important, c'est la répartition des P et F dans la liste où figure le X_i concerné. Ce X_i n'est pas une variable, c'est un résultat.  

D'ailleurs, c'est curieux qu'il ait écrit X en majuscule. Il me semble que l'habitude est d'écrire la loi en majuscule et les valeurs en minuscule. Ce qui me confirme dans mon hypothèse. "On a une infinité de pièces équilibrées, on défini la variable aléatoire X de la façon suivante : chaque lancé produira une valeur P ou F notée x_i pour le résultat du ième lancé. On étudiera la suite des N x_i". Voila ce qu'on devrait avoir dans les énoncés.

C'est cela qui a justifié mon long message d'hier.
avatar
beagle
Messages : 3696
Date d'inscription : 29/06/2019

Cours de statistique Empty Re: Cours de statistique

Sam 14 Mar - 13:36
Lorsque tu lances ta pièces pile ou face,
ben pour le ième lancer j'ai bien un aléatoire pile ou face, 0 ou 1
j'ai bien une variable aléatoire pour le lancer i
et le résultat du lancer i ne dit rien sur mon aléatoire du lancer k qui peut etre pile ou face, 0 ou 1,
il varie aussi de façon non prévisible, c'est bien la variable aléatoire du lancer k

C'est quoi qui te gène dans la répétition de n fois le meme tirage aléatoire de meme loi?
Dlzlogic
Dlzlogic
Admin
Messages : 9505
Date d'inscription : 26/04/2019
Age : 80
Localisation : Proville
http://www.dlzlogic.com

Cours de statistique Empty Re: Cours de statistique

Sam 14 Mar - 13:58
Oh, mais tout simplement que la définition de variable aléatoire c'est une fonction, une application, suivant une loi, et quand on écrit "liste de variables aléatoires" on doit traduire "liste des résultats d'une variable aléatoire".
"c'est bien la variable aléatoire du lancer k" NON, c'est un résultat parmi d'autres d'une même expérience.
Il est bien précisé dans des cours ou explication que "variable aléatoire" est une fonction et c'est par simplification que l'on "oublie" le mot fonction. Mais à force, c'est devenu la valeur renvoyée par la fonction. C'est pas tout à fait la même chose.

C'est un peu dans le même esprit que je n'ai jamais eu de réponse concernant le sens de "estimateur". s'agit-il de l'outil, de la méthode ou bien de la valeur obtenue.
De mon temps en math, on exigeait une certaine rigueur.
Il y a des tas d'exemples comme cela.
Donc, s'il faut définir les termes avant de les employer, on n'est pas arrivé.
avatar
beagle
Messages : 3696
Date d'inscription : 29/06/2019

Cours de statistique Empty Re: Cours de statistique

Sam 14 Mar - 14:13
"c'est bien la variable aléatoire du lancer k" NON, c'est un résultat parmi d'autres d'une même expérience."

non, k est une expérience unique,
et cette expérience unique est répétée n fois

si tu appelles une seule expérience les n lancers,
alors tu examines pour 5 lancers les évènements (0,1,1,1,0) comme (1,1,0,0,1)
Dlzlogic
Dlzlogic
Admin
Messages : 9505
Date d'inscription : 26/04/2019
Age : 80
Localisation : Proville
http://www.dlzlogic.com

Cours de statistique Empty Re: Cours de statistique

Sam 14 Mar - 15:39
J'avais envie de changer d'exemple et de prendre le cas de taille d'enfants, mais il vaut mieux rester sur le même.
Donc, je lance une pièce. Quel intérêt scientifique ? elle va retomber soit sur pile, soit sur face, mais de toute façon, d'un seul côté. je ne pourrai rien déduire, rien calculer et forcément rien conclure. Si tu appelles ça une expérience, là il y a encore un problème de vocabulaire. Dans un contexte expérimental, j'appelle ça une épreuve.
Ce terme était utilisé dans le contexte photographique type argentique. C'est un tirage, pas forcément bien réussi.
Dans le domaine expérimental, si on veut faire une expérience, on défini avant toute chose les modalités de l'expérience et l'interprétation des résultats.

Dans le cas pile ou face, on peut par exemple définir qu'on fera 10000 jets, qu'on groupera les jets par mot de 6 pour les traduire en nombre décimaux de 0 à 31 et qu'on vérifiera la répartition des fréquence de ces 32 nombres.
Si de jette une fois la pièce, je n'ai rien fait d'autre que de jeter une pièce.

Autre exemple : soit la liste des décimales de pi. Si je prend la ième décimale j'aurai un chiffre entre 0 et 9. Peux-tu appeler ça une expérience, qu'est-ce que tu en déduis, que probablement les décimales de pi n'étaient constituées que de caractères de 0 à 9 ? Ce caractère a-t-il le statut de "variable aléatoire", on sait que c'est une application ? N'importe quel caractère à la ième position d'une liste aurait-il le même statut ?

Bref, là je trouve qu'on se trompe carrément de cible. On cherche un vague support pour rédiger des exercices, on emploie des termes qu'il faut traduire suivant le contexte. Ca ne se passe pas seulement au niveau de Sylviel. Je prends le bouquin d'Aléa, il y a bien au début une liste des caractères spécieux utilisés, mais pas de chapitre "Introduction" où il définit précisément le sens des termes employés, et dès les première pages, un théorème faux, dont la "démonstration" est quelques centaines de pages plus loin.

Revenons sur le terme "variable".
Au plus bas niveau, il y a "constante" : c'est une valeur numérique fixe et définitive (dans un contexte donné)
Puis il y a "paramètre" : c'est une valeur connue, fixe, mais qui dépend de d'autres éléments.
Puis il y a "variable" : c'est une valeur non fixe, donc qui varie, soit on la mesure, soit des éléments extérieur la font varier.
Puis il y a "fonction". Là, c'est pas un nombre, c'est un action, un moteur, un outil. Il peut avoir des paramètre en entrée ou pas, généralement il produit un résultat, souvent un nombre.

Notre "variable aléatoire" est une fonction. Bien que les paramètres soient rarement indiqués (le hasard est unique) ils sont quelques fois sous-entendus. Cette fonction renvoie une valeur chaque fois qu'on lui demande.
Il est clair que j'écris tout cela, suite aux très nombreuses lectures de cours depuis une dizaine d'années. Ce n'est en aucun cas une interprétation personnelle. A titre d'exemple, j'ai découvert le terme "biais" quand j'ai parlé les premières fois du dénominateur dans le calcul de l'écart-type. Le crois que c'est Nuage qui m'a indiqué l'article de Wikipédia qui utilisait ce terme. En vain, j'ai demandé le sens de ce terme pendant plusieurs années et finalement, c'est son utilisation dans un article sérieux qui m'a permis de comprendre.
Il en est de même pour "variable aléatoire".
avatar
beagle
Messages : 3696
Date d'inscription : 29/06/2019

Cours de statistique Empty Re: Cours de statistique

Sam 14 Mar - 16:02
wiki loi binomiale:

"Une loi de Bernoulli décrit le comportement d'une expérience aléatoire qui possède deux résultats possibles traditionnellement appelés succès et échec1. Une telle expérience s'appelle une épreuve de Bernoulli. Par exemple, lors d'un lancer de pile ou face, on peut considérer qu'obtenir face est un succès et obtenir pile est un échec. Dans ce modèle, la probabilité de succès est une valeur fixe, c'est-à-dire qui reste constante à chaque renouvellement de l'expérience aléatoire.

On considère la situation où une telle expérience aléatoire (deux résultats possibles et une probabilité fixe) est répétée un certain nombre de fois de manière indépendante ; notons n ce nombre de fois. Cette répétition indépendante d'épreuves de Bernoulli s'appelle un schéma de Bernoulli ou simplement des épreuves de Bernoulli2. Une loi binomiale décrit le nombre de fois où le succès apparaît sur les n expériences effectuées. Le nombre de succès obtenus étant une valeur aléatoire, une loi binomiale est décrite grâce à la donnée des probabilités que le succès apparaisse précisément k fois sur les n essais. "

on parle bien d'expérience pour une épreuve de bernouilli
et ensuite de répétition de l'épreuve = l'expérience de base

après que tu appelles variables aléatoires, tous les différents résultats  de chaque épreuve
ou que tu appelles variable aléatoire le nombre de k succés
ben tout cela ce sont des variables aléatoires.
C'est juste que tu écrits ce que tu vas observer et calculer ...


Dernière édition par beagle le Sam 14 Mar - 16:03, édité 1 fois
Dlzlogic
Dlzlogic
Admin
Messages : 9505
Date d'inscription : 26/04/2019
Age : 80
Localisation : Proville
http://www.dlzlogic.com

Cours de statistique Empty Re: Cours de statistique

Sam 14 Mar - 16:03
Voila un très joli exemple de cet emploi tordu de "variable aléatoire".
https://www.ljll.math.upmc.fr/MathModel/enseignement/polycopies/gerardbiau.pdf
Dès le premier paragraphe il y a un contre-sens fondamental. L'auteur distingue et sépare par opposition les notions de probabilités et les applications à la statistique. Il n'a pas compris ou il ignore que la statistique n'existe que parce que le théorie des probabilités a été soigneusement mise au point et vérifiée depuis deux siècles.
On remarquera que il utilise ces x minuscules, des X majuscule et un X gras. Puis il éprouve le besoin de noter que
" Dans ce contexte d’échantillonnage, les va-riables aléatoiresXisont souvent appelées, avec un abus de langage,obser-vations."
(le gras est dû au copier/coller)
Pauvres étudiants.
Dlzlogic
Dlzlogic
Admin
Messages : 9505
Date d'inscription : 26/04/2019
Age : 80
Localisation : Proville
http://www.dlzlogic.com

Cours de statistique Empty Re: Cours de statistique

Sam 14 Mar - 16:07
Je me répète, une variable aléatoire est une fonction.
Cette fonction produit un résultat chaque fois qu'on s'en sert.

[Edit]
"ben tout cela ce sont des variables aléatoires.
C'est juste que tu écrits ce que tu vas observer et calculer ..."
Une variable aléatoire est une fonction.
Des variables aléatoires sont des fonctions, indépendantes ou pas.
On peut écrire les différents résultats d'une fonction, mais on ne peut pas "écrire" une fonction, on la "décrit" c'est à dire on dit ce qu'elle fait.
Il y a des cours où il y a plusieurs fonctions en cause, donc plusieurs variables aléatoires. Dans ces cours c'est très clair : il y a 2 indices ou bien plusieurs lettres, par exemple :
Soit une expérience qui comporte 2 variables aléatoires X et Y etc.
Alors on aura des valeurs x1, x2, ... xn et y1, y2, ... yn.
avatar
beagle
Messages : 3696
Date d'inscription : 29/06/2019

Cours de statistique Empty Re: Cours de statistique

Sam 14 Mar - 16:31
"Je me répète, une variable aléatoire est une fonction.
Cette fonction produit un résultat chaque fois qu'on s'en sert."

et elle s'use si on s'en sert ou pas?

"on appelle variable aleatoire de omega vers E tout fonction mesurable X de omega vers E"
d'apres wiki
donc tu vois bien que tu es d'accord !
Dlzlogic
Dlzlogic
Admin
Messages : 9505
Date d'inscription : 26/04/2019
Age : 80
Localisation : Proville
http://www.dlzlogic.com

Cours de statistique Empty Re: Cours de statistique

Sam 14 Mar - 16:56
Ben oui, justement, je n'ai pas être d'accord ou pas, j'ai lu cette définition, je l'ai comprise et si on parle de variables aléatoires, on parle de plusieurs variables, donc de plusieurs fonctions. Or dans le cas de pile ou face il y a une seule fonction, donc une seule variable aléatoire et plusieurs valeurs résultante de l'utilisation de la fonction.

Je cite mon cours. Ce sont les termes de Lévy, spécialiste incontestable de ces notions :
"Une variable est dite éventuelle lorsqu'elle peut prendre l'une quelconque des valeurs [...]."
C'est là que les matheux ont associé "variable" et "aléatoire" et l'ont défini comme une fonction, comme le dit Wikipédia.
Malheureusement, certains matheux, n'ont mémorisé que le terme "variable" et l'associent à une valeur. Comme il y a plusieurs valeurs, pour eux, il y a plusieurs variables et cela devient parfaitement obscur. C'est simplement ça le sujet de mes messages.
avatar
beagle
Messages : 3696
Date d'inscription : 29/06/2019

Cours de statistique Empty Re: Cours de statistique

Sam 14 Mar - 17:14
reprenons alors syllviel:
"Une suite de variables aléatoires est une suite de ces fonctions."
donc dans le cas pile ou face où chaque variable aléatoire est 1 pile ou zero face
en répétant les lancers tu fais une suite de fonctions…

il n' ya pas une seule fonction qui décrit 8 lancers et 100 lancers et 1500 lancers et 10 000 lancers ...
Dlzlogic
Dlzlogic
Admin
Messages : 9505
Date d'inscription : 26/04/2019
Age : 80
Localisation : Proville
http://www.dlzlogic.com

Cours de statistique Empty Re: Cours de statistique

Sam 14 Mar - 18:33
Le propre d'une fonction est de produire plusieurs valeurs suivant un même protocole.
En suivant le libellé de Sylviel, il y a une valeur par fonction et une fonction par valeur.
Dans ce cas là à quoi ça sert de faire des maths ?
La définition de Sylviel de rapproche de la théorie du chaos, c'est à dire ce qu'on peut observer avec une telle expérience dans un contexte quantique.
Dans ce cas, il est parfaitement inutile d'étudier les probabilités et toutes les applications, par exemple la statistique, puisqu'il n'y a  aucune justification.
C'est peut-être la raison pour laquelle il ne sait pas résoudre l'exercice du stock ou celui de la pêche industrielle.
Personnellement, ça ne me gène pas tant qu'il ne dit pas que mon papier "Notions de probabilités" est un torchon, sans dire pourquoi.

"en répétant les lancers tu fais une suite de fonctions…" NON, je fais une suite d'appels à une même fonction. Donc, "variable aléatoire" doit être au singulier.
Dlzlogic
Dlzlogic
Admin
Messages : 9505
Date d'inscription : 26/04/2019
Age : 80
Localisation : Proville
http://www.dlzlogic.com

Cours de statistique Empty Re: Cours de statistique

Sam 14 Mar - 19:01
Voila un exemple où il n'y a pas de faute :


On considère 2 archers A1 et A2 qui tirent chacun sur une cible de manière indépendante. L'archer A1 (respectivement A2) touche sa cible avec une probabilité p1 (repectivement p2) strictement comprise entre 0 et 1. On suppose de plus que les tirs des joueurs sont indépendants les uns des autres. On appelle X1 (respectivement X2) la variable aléatoire donnant le nombre de tirs nécessaires à l'archer A1 (respectivement A2) pour qu'il touche sa cible pour la première fois. On note q1=1−p1 et q2=1−p2.

Explication : les archers tirent plusieurs fois, jusqu'à atteindre la cible. A la fin de l'expérience, c'est à dire n tirs = n épreuves, la fonction variable aléatoire renvoie n. C'est typiquement une loi géométrique, mais c'est un autre problème.
Pour détailler dans le contexte de notre discussion, on peut citer par exemple les "paramètres" de cette variable aléatoire :
- la variation du vent
- les imperfection de fabrication des flèches
- la sensibilité à l'assimilation d'alcool
- la présence d'insectes sur le trajet
- etc.
Ce qui explique que le TCL parle de "somme de lois de probabilité".

Tu me diras, "Mais il y a une seule réponse, donc 1 variable aléatoire => 1 réponse". Si tu dis ça, c'est que tu n'as pas compris.
Contenu sponsorisé

Cours de statistique Empty Re: Cours de statistique

Revenir en haut
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum