Un corpus de SMS produits par de jeunes adolescents : méthode de recueil et premières données Antonine Goumi & Josie Bernicot CeRCA UMR 6234 CNRS et Université de Poitiers Maison des Sciences de l'homme de Montpellier - mardi 15 mars 2011 Séminaire «SMS4Science LR - Mutation des pratiques scripturales en communication électronique médiée» Recherche soutenue par l ANR «L adolescent et l écrit numérique : prérequis, usages et apprentissage» (ANR-08-COMM-011-01) ANR-08-COMM-011-01
L histoire du corpus de Poitiers Travail depuis 2002 sur le courrier électronique (thèse Volckaert-Legrier, 2007) Une première expérience de recherches sur l écrit chez des adolescents de 11 à 16 ans Un corpus d environ 300 emails adressés à un pair d âge ou à un professeur dans des situations où l on doit se présenter à l autre ou raconter un événement 2
L histoire du corpus de Poitiers Exemple : message d un adolescent adressé au professeur Lu M.Garreau! koment allé vous? Chui un eleve 2 4eme a ronsard. chui un exelent éleve... surtt en Latin.. lol je frise lé 6 de moynne =] moi mon truc c le foot é lordiiiiiiiiiiiiiiiiii...!! (+_+) (lol) Sur lé jeu vidéo ( san me venté ) je sui un dieu... =) é le foot c une passion pr moi! parlon de vs maintenant.. kel matiere ebseigné vs? ( jesper po le latin ) bon ++ 3
L histoire du corpus de Poitiers Principaux résultats : L utilisation d un registre spécifique (néographies) L utilisation du registre dépend plus de l expérience antérieure en CMC que de l âge L utilisation du registre varie avec l interlocuteur L utilisation des marques spécifiques du registre email n est pas liée au niveau en français conventionnel des adolescents Volckaert-Legrier, O., Bernicot, J. & Bert-Erboul, A. (2009). Electronic Mail, a New Written-Language Register: A Study with French- Speaking Adolescents. British Journal of Developmental Psychology, 27, 163 181. 4
Rencontre Poitiers-Louvain Dès 2006 : idée de compléter les résultats sur les emails par un travail sur les SMS, mode de communication particulièrement investi par les adolescents On a connaissance du projet sms4science, on prend contact et on signe une convention en 2008 On utilise le corpus recueilli en 2004 de 30 000 SMS issus de 2436 donneurs pour faire une recherche sur les adolescents de 13 à 18 ans (cf. intervention d Olga- Volckaert) Faute de moyens locaux, on n a pas encore pu lancer à Poitiers un recueil de type sms4science, mais on a fait un recueil longitudinal sur une population limitée 5
Les questions scientifiques à l origine du corpus de Poitiers Comment le registre SMS est-il appris? par une évolution progressive de l écrit conventionnel comme un registre dès le départ séparé de l écrit conventionnel Comment les caractéristiques des SMS varient-elles avec les caractéristiques des scripteurs (en particulier filles/garçons)? Quel est le lien entre l usage des SMS et le niveau en français conventionnel? (question sociale de l éventuel impact négatif des SMS sur la réussite scolaire) 6
Méthode Participants Collège public de la région Poitou-Charentes : semi-rural/urbain, commune de 2000 habitants (15km Sous-Préfecture) Critères d inclusion : Ne jamais avoir possédé ou utilisé de téléphone mobile avant le début de l étude Novices en communication SMS Langue maternelle française Non-redoublants 7
Proposition : Méthode Participants être équipé gratuitement d un téléphone mobile pendant 1an s engager à donner 20 SMS par mois de son choix (rédigés par l élève lui-même) à l équipe de recherche Respect des règles d éthique : Recueil du consentement éclairé de l élève et de ses parents Anonymat garanti à toutes les étapes de la recherche 8
Méthode Participants 19 participants de 11 à 12;5 ans au début de l étude (25 initialement) 10 filles et 9 garçons Professions et Catégories Socioprofessionnelles des parents : classes moyennes «ouvriers» et «employés», le père et la mère exerçant une activité professionnelle sauf dans un cas Equipement informatique : au début de l étude toutes les familles ont un ordinateur et une connexion internet à la maison 9
Méthode Participants Pour chaque participant nous disposons des informations suivantes : Pratique de la communication médiatisée par la technologie au début de l étude (hors SMS) : email, blog, réseau sociaux, tchat (pratique et fréquence) Niveau en français conventionnel au début de l étude (bulletin scolaire fournit par le collège) Niveau en orthographe mesuré à mi-parcours de l étude par une épreuve standardisée et codée de façon adaptée à notre étude (ANALEC) A mi-parcours, le nombre de SMS par mois que les participants déclarent envoyer (20-40 ; 40-80 ; >80 /mois) Chaque trimestre, les résultats scolaires des participants dans toutes les disciplines scolaires 10
Méthode Matériel Téléphones mobiles (à façade, sans clavier) Clé 3G + Logiciels Vodafone Mobile Connect et Vodafone SMS Crédits communication (coupons recharge) 15 = 150 SMS et/ou 30 minutes voix 5 = SMS illimités pendant 5 jours 11
12
Méthode Procédure 20 SMS 5 (=SMS illimités, 5 jours) 15 (=150SMS et/ou 30 min., 1mois) 13
Méthode Procédure Mois N x 12 mois J1 J2 J3 JN JN+1 J30 J31 15 (=150SMS et/ou 30 min. 1mois) «Bonjour. Ton crédit de [mois] est activé. Conserve bien tes sms ENVOYES. Merci.» X 19 élèves 5 (=SMS illimités, 5jours) «Bonjour [Prénom]. Tu es en sms illimités jusqu'à [jour]. Transfère 20 sms ENVOYES vers le 06xxxxxxxx. Merci.» x 1élève Rappel éventuel si nécessaire X 19 élèves Importation des SMS de Vodafone vers Excel 14
Bilan Nombre de SMS 4540 SMS recueillis pendant 12 mois (environ 20 SMS par mois par participant) Sur un an : Moy = 238,95 SMS/participant Ja v 2 ja fievre. Donc mer si 2 ta con(ne) passion. & merde. tu pe pa timaginer a quel poin il me manque <3 Bon on sen fou >.< On a quoi comme devoirs pour lundi?_? $arah C toi ki socupe d chien a valentin? En maths sest qoi l exesice conbien tro dégou t de pa etre alé au bal On mangera au flunch tu vien ver midi tu pourai prendre un rendé-vous ché le docteur pour mon genou 15
Méthode Transcription 3 transcriptions différentes : SMS original SMS transcrit en conservant les formes pratiquées à l oral SMS transcrit en rétablissant les codes de l écrit académique L analyse des données ne porte que sur les messages originaux 16
Méthode Transcription Exemples de messages originaux et de leurs transcriptions Âge du participant Genre Message Original Transcription conservant les formes de l oral Transcription rétablissant l écrit académique 11;2 F Cc alor ta dmende pour ce soir Coucou alors t as d mandé pour ce soir Coucou alors as-tu demandé pour ce soir? 11;11 M Jen sai rien chui pa aller ché le toubib J en sais rien j suis pas allé chez le toubib Je n en sais rien je ne suis pas allé chez le toubib. 13;5 M Ouai jen ai jamai vu des vivan mes kan il sn mor ca mderange pa Ouais j'en ai jamais vu des vivants mais quand ils sont morts ça m'dérange pas Ouais je n en ai jamais vu des vivants mais quand ils sont morts ça ne me dérange pas. 13;8 F Lèa t c se kil i a fair en techno Léa t sais ce qu il y a à faire en techno Léa sais-tu ce qu il y a à faire en technologie? 17
Méthode Codages Parmi divers indices : Longueur : nombre de caractères (espaces compris) et nombre d items (nombre de mots) ; Structure dialogique (Ouverture, Message, Clôture) ; Contenu (fonction) ; Forme (textisme). 18
Indices de longueur Nombre de caractères (avec espaces) Nombre d items (de mots) = ensemble de lettres séparées de deux espaces Message original Nombre de caractères Nombre d items Nan mais enfaite faudraitque tu minvite le vendredi soir tu c kom on fais dabitude et faut pas lui dire ke tu minvite pour une fète sinon elle voudra pas :S 156 31 Tu va au colege a quele heure 29 7 19
Premier résultat: nombre de caractères 20
Indices de forme : les textismes Définition : formes qui apparaissent en SMS et qui ne correspondent pas aux normes de l écrit académique Okei. Spa grave. La smaine pro quan tu sra ché moa on éseillera La plupart de ces formes ne correspondent pas aux fautes usuelles observées lors de l apprentissage de l écrit conventionnel, sauf par exemple : certaines simplification par chute des mutogrammes en finales : paren (parents), veule (veulent), certainemen (certainement), concer (concert) Complexification (allongement de la longueur d un mot) : lessons (leçon), Bonne anniversaire (bon anniversaire), ruggby (rugby), C est claire (c est clair) Substitutions de graphèmes d un même niveau de complexité : sa (ça), chanbre (chambre), fait (fais), rentrer (rentrez) 21
Indices de forme : classification des textismes On propose une classification qui est plus psychologique que linguistique : on prend en compte les processus cognitifs mis en œuvre dans le codage (et le décodage) par rapport à la phonologie et aux graphèmes du français traditionnel On a défini trois grandes catégories avec des sous-catégories dont on donne quelques exemples dans les diapositives suivantes 22
Indices de forme : classification des textismes 1. Pas de modification de la prononciation de mots existants en français conventionnel Remplacement par des graphèmes plus simple (existant en écrit conventionnel) Remplacement par des graphèmes n existant pas dans l écrit traditionnel Fusion de mots écrits les uns à la suite des autres sans espace 2. Modification de la prononciation de mots existant en français conventionnel 3. Mots ou formes graphiques n existant pas en français conventionnel (formes récentes) 23
Remplacement par des graphèmes n existant pas dans l écrit traditionnel Phonétisations : mwa (moi), moua (moi), twa (toi), wi (oui), qi (qui), qe (que), qoua (quoi), kwa (quoi), Wé (ouais) Rébus et/ou utilisation de lettres ou de chiffres pour homophonie : dem1, ri1 (rien), m1tenan (maintenant), 2van (devant), regard2 (regarde), G (j'ai), C (c'est), + (plus), D (des), 2bo (de beau), 29 (de neuf), V (vais), T (tu es), B1 (bien), 2v1 (deviens), gt (j étais), KC (cassé) 24
Modification de la prononciation de mots existants en français traditionnel Squelettes consonantiques : pk (pourquoi), bsx (bisous), cc (coucou), nn (non), bn (bon), ds (dans), tt (tout), slt (salut), dsl (désolé), d (de) Mots abrégés (parfois utilisés à l'oral) : ex (exercice), voc (vocabulaire), impec (impeccable), exam (examen), d'hab (d'habitude), phone (téléphone), rep (réponds) 25
Conclusions On a parcouru une partie du chemin : le recueil longitudinal pendant 1 an de 4540SMS chez de jeunes adolescent de 11 à 13;10 ans Il nous reste à poursuivre le chemin par l analyse des données On a déjà quelques pistes 26
Comment le registre SMS est-il appris? Messages du mois n 1: M1, 11;0 Ok a lundi Moi si Tu fai koi Ki ces A tou a leur Ba oui Sa va Alors Super Pourkoi Bon ses bon a+ A un copin Oui sa va Je vai rapelé Messages du mois n 12: M1, 12;0 Wé bn c tt se ke ta a me dir Ok sa auré été mieu ac mwa Tfk la Jariv alr t ou Si j vien on va samusé Bn tu tamus b1 Tw aussi Ok sympa ta r1 a me dir Ba ta plu r1 a dir Ok lol vien phé mwa Wé t ou jariv 27
Comment le registre SMS est-il appris? Messages du mois n 1, F1, 12;6 Coucou marine sv? moi de trp jtmg c nul on ne soi pa dans la même classe Cnucou sv peti potame? Jtmpa tu fait koi cette aprème et tuet dans la classe de maud et tu na jamais u de problème av ton portable sinon jtdgdt caro:- )tjao Bon adrien ô u ou c ki kî te la doné mon num? Messages )du mois n 12, F1, 13;8 Jme sui fè cnupè les chve Come sa jpe pa te le dire dègradè O èpole Uai Je t'aime Uai ns la danse music jazz C ki Pr 2min Ya pa de bus ui ou nn C c luci c kaka Lulu ta plu de crédi c carote ou carole Mwa je vè pa o colége Lol t va pa o colège 28
Rôle des caractéristiques des scripteurs 29
Quel est le lien entre l usage des SMS et le niveau en français conventionnel? Question sociale de l éventuel impact négatif des SMS sur la réussite scolaire. On traitera cette question en mettant en corrélation: des indices concernant la pratique des SMS (nombre d envois par mois) et la forme des SMS (densité et type de textismes) avec des indices concernant le niveau en français scolaire (et d autres disciplines comme les mathématiques), le niveau en orthographe conventionnel mesuré avec une épreuve standardisée 30
31