Scénario co-construit au cours du défi pédagogique du Printemps de l'EMI 2021, à l'issue de la conférence de Guillaume Sire "La ligne éditoriale du web" du 7 avril 2021
Durée de la séance : 1h
Objectifs :
Faire prendre conscience aux élèves que le classement d'une recherche est réfléchi
Découvrir ce que sont les variables dans un algorithme d'information
Exercer son esprit critique sur des résultats de recherche dans une recherche d'information
Saisir les enjeux de l'information
Programme de SNT de seconde générale et technologique, thématiques abordées
(BO spécial n° 1 du 22 janvier 2019) :
Internet : les algorithmes et les programmes
Le web : moteurs de recherche
Mots clés : variable, pondération.
Organisation matérielle recommandée⚓
Pour l'activité “Une recherche, plusieurs réponses ?” :
CDI, salle informatique pour les recherches en binômes
Îlots pour la mise en commun en groupe de 4
Fiches “Moteur de recherche” (1 fiche par binôme) téléchargeable ci-dessous
Fiches “Observations” (1 fiche par groupe de 4) téléchargeable ci-dessous
Matériel informatique : ordinateurs ou tablettes reliés à internet (1 par binôme)
Pour la mise en commun et le débat :
Tableau blanc ou vidéoprojecteur
Disposition facilitant les interactions collectives, le débat
Attention :
Pensez à effacer historiques et cookies des ordinateurs et tablettes destinés aux recherches des élèves.
Les fiches à imprimer et photocopier⚓
Fiche "MOTEUR DE RECHERCHE" (1 par binôme)
Fiche "OBSERVATIONS" (1 par groupe de 4)
Déroulement⚓
Activité “Une recherche, plusieurs réponses ?” (15 min)⚓
En binômes, puis en groupe de 4
Les élèves sont répartis en groupes de 4, chacun étant constitué de 2 binômes. Chaque binôme dispose d'un ordinateur ou tablette.
Distribuer 3 fiches à chaque groupe :
2 fiches “Moteur de recherche” (soit 1 fiche par binôme)
1 fiche “Observations” (soit 1 fiche par groupe de 4)
Les élèves effectuent 1 recherche commune à tous les groupes sur 2 moteurs de recherche (Google et un autre).
Parmi les thèmes suivants (au choix du professeur) :
“avortement France”,
“Prince”,
“PMA”,
“Les usages de Versailles”,
“Vaccins”,
“régime alcalin”...
Dans chaque groupe, un binôme teste Google, l'autre teste un moteur alternatif (Duck duck go, Qwant, Ecosia, Bing... par exemple), de sorte qu'au moins 5 moteurs soient testés par la classe entière. Ce qui pourrait donner la répartition suivante :
Groupe 1 : Google / Duck duck go
Groupe 2 : Google / Qwant
Groupe 3 : Google / Ecosia
Groupe 4 : Google / Bing
Groupe 5 : Google / Duck duck go
Groupe 6 : Google / Qwant
Groupe 7 : Google / Ecosia
Groupe 8 : Google / Bing
Etc ...
Consignes :
Chaque binôme teste 1 moteur de recherche (5 minutes) et remplit une fiche "Moteur de recherche” en fonction des résultats obtenus (nombre de résultats, premiers résultats, hypothèses).
Au bout de 5 minutes, les binômes se rejoignent et remplissent la fiche “Observations” (5 minutes) en groupe de 4 (points communs, différences, hypothèses sur critères de classement).
Mise en commun (10 min)⚓
En classe entière
Au tableau, l'enseignant dessine ou vidéoprojette un tableau de 7 colonnes avec les titres :
pertinence | fréquence | performance | centralité | personnalisation | signaux sociaux | divers* |
... | ... | ... | ... | ... | ... | ... |
* Propositions qui ne rentrent dans aucune des variables définies par Guillaume Sire dans sa conférence du 7 avril 2021.
L'enseignant demande : "Selon vous, quels sont les critères qui justifient l'ordre/classement d'un résultat dans une recherche ?"
Chaque groupe donne au moins 1 critère (question 4 de la fiche “Observations”).
L'enseignant aide à la reformulation si nécessaire et note le critère dans la catégorie correspondante.
Apports théoriques : “Les variables de l'algorithme de Google” (10 min)⚓
En classe entière
L'enseignant commente et complète les propositions des élèves :
Pertinence : présence du terme dans la page, récurrence du terme, position du mot dans le texte (titre, corps du texte) ...
Fréquence : régularité des mises à jour, des consultations, des publications ...
Performance : vitesse d'affichage des pages, de chargement des pages ... (aspects techniques : nombre de serveurs interrogés par exemple)
Centralité : les documents les plus cités, liens entrants et sortants (notion d'équilibre et de réciprocité dans les liens) ...
Personnalisation : localisation, langue, sexe ...
Signaux sociaux : nombre de commentaires, de tweets, de likes ...
Ces critères s'appellent des “variables”. Pour concevoir un algorithme de traitement de l'information, il faut définir/choisir des variables. Puis accorder un poids, une importance à chacun d'eux : c'est ce qu'on nomme la pondération.
Les “variables” de l'algorithme de Google sont ceux indiqués dans le tableau = Google classe les résultats de recherche en fonction de ces critères.
Débat : “Construisez les variables d'un algorithme éthique” (15 min)⚓
En classe entière
Situation : “ Vous êtes informaticiens/programmateurs : vous devez définir les variables d'un algorithme de traitement de l'information.”
Faire débattre les élèves.
De façon progressive, l'enseignant précise les enjeux derrière certains choix : politique, commercial ... = éthique.
Complément : Questions possibles pour relancer le débat :
Quelle hiérarchie ? Quelle pondération ?
Doit-on intervenir “humainement”, manuellement, ou tout automatiser ?
Prolongement possible⚓
Au cours d'une deuxième séance :
Distribuer à des groupes de 5 élèves des photocopies de pages internet obtenues à l'issue d'une recherche. Leur demander de classer les résultats de recherche de 1 à 5 en définissant des critères.
Aller plus loin : conférence de Guillaume Sire (7 avril 2021)⚓
Pour trouver rapidement l'extrait qui vous intéresse :
00-03'22 : Introduction par Mme Fetouhi, directrice territoriale Canopé Occitanie
03'23 - 13'02: Introduction de Guillaume Sire
13'03 - 27'58 : La sociologie des techniques et la production d'algorithmes, interaction sociale
27'59 - 45'18 : Les algorithmes et le traitement de l'information
27'59 - 28'12 Les algorithmes et le traitement de l'information
28'12 - 30'34 : suggestion d'activité de débat et de création critique avec des élèves/étudiants
30'35 - 37'29 : définition d'un algorithme
37'30 - 39'59 : l'algorithme de Google, le « Pagerank »
44'00 - 44'45 : proposition de débat critique sur les critères de différents moteurs
44'46 - 45'18 : enjeux démocratiques de la transparence
45'19- 53'12 : Les classes de variables
45'19 - 47'09 : les variables de l'affinité, de poids, de temps : exemple de Facebook
47'10 - 53'12 : les 6 classes principales de variables de Google
47'31 : La pertinence
49'57 : La performance
50'05 : La fréquence
50'54 : la centralité
51'33 : les signaux sociaux
52'04 : la personnalisation
53'13 - 57'05 : Le secret algorithmique de Google
57'06 - 1'04'15 : Influence des algorithmes sur les contenus
58'26 : sur le choix des mots
1'00'22 : sur la mise en forme hypertextuelle
1'04'16 – 1'18'16 : Les controverses
1'04'16 La question de la responsabilité
1'11'30 L'interventionnisme manuel
1'12'40 La personnalisation (les bulles de filtre)
1'14'48 Les incitations au favoritisme
1'18-1'50 : Questions du public