Accueil KIM Jin-Ok
Thèse de sciences du langage, Université de Paris III – Sorbonne Nouvelle
Étude des verbalisations métalinguistiques d’apprenants coréens sur l’imparfait et le passé composé en françaisIntroduction Chap. 1 Chap. 2 Chap. 3 Chap. 4 Chap. 5 Chap. 6 Chap. 7 Conclusion Résumé Biblio Corpus Index 1 Index 2 Annexe 1 : Exercice Annexe 2 : Conventions
Chapitre 3. Modèles d’appropriation d’une langue étrangère II : modèles cognitifs d’apprentissage
Nous examinerons dans ce chapitre le second type de modèles d’apprentissage d’une langue étrangère, celui des approches cognitives. La différence avec le premier type de modèles réside dans le fait que les modèles cognitivistes développent spécialement la partie correspondant au traitement, contrairement au béhaviorisme qui la considère comme une boîte noire et refusent de considérer la conscience. Ces modèles cognitivistes empruntent de nombreuses notions à la psychologie cognitive, surtout à la suite du développement récent de cette discipline.
Il existe deux types de modélisation en psychologie cognitive : le traitement de l’information symbolique et le traitement connexionniste. Le modèle de traitement de l’information simule les activités mentales dans lesquelles le sujet manipule des informations symboliques (Fayol, 1990). Ce type de modèle suppose, d’une part, l’existence de connaissances, de représentations, modélisées en réseaux sémantiques et en schémas, et d’autre part, des systèmes de mémoire et de contrôle, qui constituent les contraintes du système cognitif. Les modèles connexionnistes sont constitués ou simulent un réseau d’éléments reliés entre eux pour la propagation du signal, s’inspirant du fonctionnement des neurones.
Ces deux approches trouvent chacune des adeptes dans la modélisation du processus de l’acquisition d’une langue étrangère. La plupart des modèles d’approche cognitive relève de la modélisation de type symbolique. L’approche connexionniste se développe également grâce, par exemple, à Rumelhart et McClelland (dans McWhinney, 1987) qui ont réussi à simuler l’acquisition de microsystèmes linguistiques. Nous présenterons dans la première partie, les principes de chaque approche (symbolique et connexionniste), suivis des modèles élaborés pour l’acquisition d’une langue étrangère. Dans la seconde partie, nous aborderons différentes distinctions, notions et questions qui émergent dans le cadre de l’approche cognitive.
1. Psychologie cognitive et fonctionnement cognitif
Il nous paraît utile de présenter une vue générale de cette approche cognitive, notamment sur sa description du fonctionnement cognitif. Ceci nous aidera à mieux comprendre les notions empruntées par les chercheurs en acquisition. Pour cela, nous nous appuyons principalement sur les ouvrages de Richard, Bonnet et Ghiglione (1990) et de Richard (1990).
En psychologie cognitive, entendue comme « l’étude des processus et mécanismes de traitement de l’information » (Richard et al., 1990), un individu est vu comme doté, d’une part, de représentations (connaissances et interprétations) et d’autre part, de dispositif de traitements (inférences et jugements). Le traitement cognitif qu’effectue l’individu sur des stimuli sensoriels (des processus de bas niveau) sont souvent modulaires (traitement spécialisé, autonome et imperméable aux autres parties du système). Par ce traitement, l’individu identifie des formes, des objets (positions de mouvements, changements), et les divers éléments de la langue (lexique, marqueurs syntaxiques, significations propositionnelles). D’autres processus traitent l’information symbolique (significations et décisions) qui résulte du premier traitement. Ce sont ces activités que Richard appelle des activités mentales, qui interviennent après le traitement des informations sensorielles d’origine environnementale ou langagière.
Le sujet selon la psychologie cognitive « a une tâche avec des enjeux, il se donne des objectifs, prend des décisions, en contrôle l’exécution, évalue le résultat de ses actions et modifie en conséquence ses représentations » (Richard et al.,1990 : xvii). Cette description correspond aux six grandes fonctions du système cognitif, proposées par Richard (1990) : conservation (1ère fonction) et construction des connaissances et des croyances (2e), production de représentations transitoires d’une situation particulière (3e), d’inférences afin de comprendre l’objet (4e) ou de prendre des décisions d’action (5e). Finalement, régulation et contrôle de l’activité (6e). Ces activités subissent en outre les contraintes de fonctionnement du système de traitement, liées aux systèmes de stockage de l’information (mémoires permanentes et transitoires) et d’autres contraintes de réalisation des opérations de traitement (capacité, vitesse d’exécution, conditions de concurrence).
Appliqué à la situation d’apprentissage d’une langue étrangère, l’approche cognitive correspond, du point de vue global, à l’étude des processus mis en œuvre par des sujets qui se donnent l’objectif d’apprendre une langue et qui s’y appliquent. Du point de vue local, cette approche peut correspondre à l’observation du traitement d’un apprenant confronté à une tâche langagière particulière ou à un problème de communication verbale en langue étrangère.
2. Modèles du traitement de l’information symbolique
Dans cette partie consacrée à la modélisation du traitement de l’information symbolique, nous aborderons d’abord le fonctionnement cognitif général dans ses composantes et ses fonctions principales : mémoires, connaissances ou représentations, activités de raisonnement, et contrôle de l’activité. Les trois derniers éléments sont les plus utilisés par les chercheurs en acquisition. Nous évoquerons aussi un des modèles d’acquisition de compétence cognitive, le modèle d’Anderson (1983 cité par Richard et al.), considéré par les psychologues cognitivistes comme le plus représentatif. Nous terminerons cette partie par l’examen de quelques modèles d’apprentissage d’une langue étrangère inspirés de cette approche cognitive.
2.1. Composantes et fonctions du traitement de l’information symbolique
2.1.1. Formes de mémoire : structures de stockage de l’information
Les mémoires sont identifiées, en psychologie cognitive, comme des structures de stockage de l’information qui ont chacune une loi d’accès différente. Elles sont utilisées dans les processus de traitement de l’information symbolique qui consistent à construire des représentations, des raisonnements, à élaborer de stratégies et des activités de contrôle.
Les types de mémoire font encore l’objet de débat en psychologie. Selon Richard (1990), on trouve deux positions sur cette question. Dans la position moniste, défendue par l’associationnisme, seul le degré d’apprentissage est différent. Pour la position dualiste, la capacité de traitement limitée entraîne le postulat de deux systèmes, mémoire à court terme et mémoire à long terme. La limite de la capacité de traitement s’explique notamment par les contraintes du système de stockage à court terme et elle rend compte des phénomènes attentionnels.
La notion de mémoire à court terme (transitoire) a été progressivement abandonnée, selon Richard, au profit de la notion de mémoire de travail. Celle-ci est conçue, selon l’auteur, comme un système qui fait à la fois du stockage et du traitement. La récupération de l’information en mémoire de travail est un processus contrôlé de nature séquentielle : on a accès à une seule information à la fois. Quant à la mémoire à long terme, c’est une mémoire permanente dans laquelle l’accès a lieu par activation d’informations structurées en réseau. Sa disponibilité n’est pas limitée par la durée de l’intervalle de rétention. La récupération d’informations dans cette mémoire est un processus automatique, et non séquentiel — rendant possible l’accès à plusieurs informations à la fois.
Cette distinction des mémoires est liée, selon Richard, à la notion de charge mentale ou de charge attentionnelle, notion qui permet d’évaluer le coût cognitif des différentes activités. Les types de mémoires sont, comme nous l’avons vu, également liés à la distinction entre processus automatique et processus contrôlé, notions initialement utilisées de façon opérationnelle par Posner et Snyder (1975), et reprises par Schneider et Shiffrin (1977).
2.1.2. Connaissances
Les connaissances semblent unanimement désignées, chez les psychologues cognitivistes comme des « structures cognitives permanentes » qui nécessitent une activation pour être effectives. Les représentations, au sens strict, désignent les « structures transitoires liées à la réalisation de la tâche » dont l’opérationnalité est immédiate.
A. Formes de connaissances[76]
Richard et al. distinguent trois formes de connaissances, a) connaissances imagées ; b) connaissances propositionnelles ; et c) connaissances liées à l’exécution des actions. Les deux dernières connaissances nous semblent plus étroitement liées à l’activité linguistique.
Les connaissances propositionnelles expriment des structures sémantiques relativement simples[77]. Selon Richard et al., elles se caractérisent préférentiellement par un modèle prédicat-argument, utilisé aussi bien pour exprimer des connaissances générales et stables en mémoire que des représentations transitoires élaborées pour des tâches particulières.
Les connaissances liées à l’action sont décrites par Richard et al. comme des connaissances qui concernent l’exécution des procédures et le contrôle du déroulement. Elles concernent les activités motrices et des habiletés cognitives de nature symbolique, qui se sont construites à l’aide du langage et se sont automatisées. Comme exemple de connaissance motrice, les auteurs prennent la pétanque dont les connaissances d’exécution sont difficilement détachables de l’action. Les règles s’expliquent mieux en jouant, c’est-à-dire, en montrant leur application dans des situations concrètes. Ces connaissances sont très peu conceptualisées, et donc très peu communicables, d’où, selon Richard et al., la difficulté d’enseignement des savoir-faire.
Contrairement aux connaissances liées aux activités motrices, pour les habiletés linguistiques en langue étrangère, il nous semble que deux situations sont possibles en ce qui concerne la communicabilité et l’extraction des connaissances : l’apprenant peut avoir oublié ou ne pas savoir les règles de la langue étrangère tout en ayant la compétence en compréhension et en production, mais il peut également connaître les règles et les verbaliser.
B. Contenus des connaissances
Ils peuvent se classer, selon Richard et al., en concepts et catégories naturelles, en procédures, et en conceptions du monde physique et de l’environnement technique. Nous nous intéresserons notamment aux deux premiers types de contenu, aux concepts et aux catégories d’une part, et aux procédures d’autre part.
1) Concepts et catégories naturelles
Pour acquérir des concepts et des catégories, le sujet effectue une opération de catégorisation et de sous-catégorisation. Dans cette opération, la notion de typicalité joue un grand rôle. Deux positions s’affrontent, position dite classique et position relativiste. Selon la position classique, la typicalité des objets dans une même classe s’applique à l’ensemble des objets d’une classe : pour la classe des oiseaux, la poule et le moineau sont équivalents. Selon la position relativiste, la typicalité s’applique au prototype : le moineau est considéré comme le plus représentatif de la catégorie. Selon Richard, l’hypothèse la plus vraisemblable est qu’il y a, dans le réseau sémantique, à la fois des prototypes et des propriétés. Et, ajoute-t-il, on peut faire l’hypothèse que dans l’acquisition des mots également, les propriétés se construisent à partir de prototypes.
2) Procédures
Une procédure est vue, par Richard et al., comme un système d’opérations exécutables pour réaliser une tâche. De même que les connaissances sur les objets sont organisées autour de catégorie - exemplaire, les connaissances de procédures sont structurées, autour de résultat - modes de réalisations.
Richard et al. distinguent trois types d’opérations dans une procédure : transformations, identifications (relever une propriété pertinente de l’environnement pour choisir l’opération adaptée à la situation) et sélections d’opération (indiquant l’opération suivante à exécuter). L’enchaînement de ces opérations est pris en charge par le contrôle de la procédure.
Pour ces connaissances, l’opposition entre connaissances déclaratives et connaissances procédurales, introduite par les sciences cognitives, constitue le point de départ. On parle de cette distinction dans les nombreux cas où existe un décalage entre le niveau de performance et les connaissances verbalisées. Ces auteurs notent que cette opposition confond parfois deux critères, comme nous l’avons vu avec la distinction entre connaissances implicites et explicites, l’un qui concerne le contenu des connaissances, l’autre, leur mode d’expression[78].
C. Acquisition des connaissances
Pour Richard et al., il existe deux définitions usuelles de l’apprentissage : processus de modification des connaissances, définition qu’ils adoptent, ou processus de modification du comportement au cours des interactions d’un organisme (d’un système) avec son environnement. Il est généralement entendu en psychologie que les connaissances ne sont pas toutes verbalisables et explicitables par le sujet qui les possède, même s’il est expert.
Le repérage de l’acquisition de connaissances n’est pas facile. Une difficulté vient du fait que certains progrès ne se manifestent pas dans le comportement observable. Dans ce cas, il faut trouver des indicateurs appropriés. Inversement, certaines modifications du comportement ne sont pas le reflet de changements dans les connaissances, mais peuvent résulter de variations dans les conditions internes ou externes de mise en jeu de connaissances (vigilance, motivation, indices supplémentaires, hasard...).
L’acquisition de connaissances peut être étudiée dans ses différents aspects par les psychologues cognitivistes :
Formes d’apprentissage : Différentes distinctions sont possibles. Apprentissage par l’action (by doing), apprentissage par le tutorat (by being told), ou apprentissage avec ou sans prise de conscience (intentionnel ou automatique, implicite ou explicite) ;
Types de changement intervenant dans l’acquisition : Changements quantitatifs (accumulation de connaissances) et changements qualificatifs (élimination d’une règle ou d’une hypothèse erronée, différenciation ou intégration de notions) ;
Mécanismes d’apprentissage : Richards et al. distinguent trois groupes de mécanismes : modification quantitative de paramètres mnésiques de connaissances existantes (augmentation de disponibilité d’une connaissance), constitution de nouvelles connaissances par mémorisation de constats singuliers, constitution de nouvelles connaissances par transformation qualitative de connaissances existantes (induction, généralisation, assimilation, test d’hypothèses).
Dans le processus d’acquisition de connaissances, le sujet déploie des raisonnements (induction, déduction). Dans ce processus, l’activité de réflexion se déclenche par reconnaissance d’une situation critique. Cette reconnaissance relève, selon les notions piagétiennes, d’une attitude qui consiste à comprendre plutôt qu’à réussir[79].
2.1.3. Le Modèle d’apprentissage d’Anderson
Richard et al. présentent la théorie ACT*[80] d’Anderson (1983)[81] comme la seule théorie cognitiviste ayant une valeur prédictive. C’est un modèle testé par simulation informatique. Dans ce modèle, les connaissances déclaratives sont représentées en trois modes, par des propositions, des séquences temporelles et des images spatialisées et elles sont stockées dans une mémoire déclarative à structure de réseau. Les connaissances procédurales sont toutes représentées sous forme de règles de production. Comportant une force qui détermine la vitesse d’exécution, elles sont stockées dans un autre registre de mémoire, la mémoire procédurale. L’acquisition de nouvelles connaissances résulte du transfert des structures provisoires créées en mémoire de travail dans l’une des deux mémoires permanentes.
Pour l’apprentissage de connaissances procédurales, deux phases sont proposées par Anderson : a) la phase d’interprétation où on sélectionne les connaissances déclaratives disponibles permettant de choisir les actions à réaliser ; b) la phase de compilation entraînant l’automatisation de l’habileté, composée de deux mécanismes, la procéduralisation[82], qui intègre dans des productions (actions) les connaissances déclaratives utilisées guidant l’action, et la composition qui groupe en un seul bloc les actions qui se suivent régulièrement dans le même ordre, ce qui réduit la charge mentale.
Le modèle d’Anderson est un modèle d’apprentissage par action. D’ailleurs, selon Richard et al., ce type de modèle représente la plupart des tentatives de modélisation. Dans ce modèle, le sujet acquiert d’abord des connaissances sur les propriétés de l’objet et ce n’est qu’ensuite que ces connaissances se transforment en une action de plus en plus automatisée. Nous savons que chez les enfants qui acquièrent leur première langue (cf. Karmiloff-Smith, 1992), c’est le processus contraire qui se produit : l’enfant maîtrise d’abord la langue et ce n’est qu’après qu’il prend progressivement conscience des structures et qu’il arrive à en parler et à expliquer le pourquoi. Il nous semble que, dans l’acquisition d’une langue étrangère par l’adulte, ces deux types d’apprentissage (antériorité de l’acquisition des connaissances déclaratives ou des connaissances procédurales) interviennent sans ordre fixe, suivant l’environnement ou l’input auquel est confronté l’apprenant, ainsi que des types de règles de la langue cible (certaines sont formulées au mode procédural). Mais le processus contrôlé précède toujours le processus automatique chez l’apprenant adulte.
2.2. Modèles d’apprentissage d’une langue étrangère inspirés du modèle de traitement de l’information symbolique
Nous considérons comme faisant partie de cette approche, les auteurs qui, en attribuant au traitement de l’apprenant un rôle principal dans l’appropriation, empruntent certaines de leurs notions aux travaux sur le traitement de l’information symbolique, notamment celles de processus cognitifs contrôlés et automatiques, et celles de connaissances déclaratives et procédurales, ainsi que celle de procéduralisation.
2.2.1. McLaughlin et al. et McLaughlin
McLaughlin et al. (1983) choisissent la même position que les psychologues dualistes en ce qui concerne les systèmes de mémoire (cf. supra). Ils utilisent également les notions d’attention focale et d’attention périphérique. Ces deux dimensions sont utilisées dans leur modèle pour décrire la performance du traitement et le processus d’acquisition.
Pour eux, il existe deux sous-types de processus contrôlés permettant aussi de représenter l’acquisition d’une langue étrangère de deux façons. Le premier processus contrôlé est le traitement descendant ou déductif (top-down information processing, ou knowledge-driven way), dans lequel on utilise des connaissances de type déclaratives pour faciliter le traitement de données de l’input. Ce sont des connaissances plus générales qu’on applique dans des contextes concrets. L’autre processus contrôlé est le traitement inductif (bottom-up ou data-driven way) qui s’appuie principalement sur les informations dans l’input. Les processus contrôlés et automatiques peuvent être, tous deux, en principe, conscients ou non conscients.
Le paramètre attention dépend largement des tâches, et la capacité de traitement dépend de comment les individus traitent l’information sur la base des expériences passées. La performance se décrit ainsi comme une fonction du traitement de l’information et de la focalisation de l’attention. Ces deux dimensions combinées donnent lieu à quatre types de performance, comme le montre le tableau suivant :
Type d’attention
Type de traitement d’information
Contrôlé
Automatique
Focalisé
(A) Production intentionnelle d’une nouvelle compétence (« Intentional » performance of a new skill)
(B) Production intentionnelle d’une compétence bien entraînée
(« Intentional » performance of a well- trained skill)
Périphérique
(C) Production contingente d’une nouvelle compétence
(« Incidental » performance of a new skill)
(D) Production contingente d’une compétence bien entraînée
(« Incidental » performance of a well-trained skill)
[Tableau 4 : Quatre types de production selon le type d’attention et de traitement, McLaughlin et al.1983 : 141]
Dans l’emploi d’une connaissance acquise récemment, on peut constater dans le tableau que pour ces auteurs, ce sont les processus contrôlés qui sont utilisés, avec attention focalisée ou périphérique, selon l’intentionnalité d’emploi de la connaissance. Une habileté bien entraînée s’effectue par un traitement automatique, le type d’attention impliqué dépendant toujours de l’intentionnalité de son emploi.
Les auteurs expliquent également à l’aide des deux dimensions que la référence aux propriétés formelles de la langue cible fait intervenir différents types de traitement et d’attention, comme le montre le tableau suivant :
Attention portée aux propriétés formelles de la langue
Traitement d’information
Contrôlé
Automatique
Focalisée
(A) Production basée sur l’apprentissage de règles formelles (Performance based on formal rule learning)
(B) Production dans une situation de test
(Performance in a test situation)
Périphérique
(C) Production basée sur l’apprentissage implicite ou analogique (Performance based on implicit learning[83] or analogical learning[84])
(D) Production dans des situations de communication
(Performance in communication situations)
[Tableau 5 : Quatre types de production selon les types de connaissances et de situations, McLaughlin et al., 1983]
Selon ce tableau, le traitement contrôlé intervient dans l’emploi de règles formelles de la langue, acquises dans un apprentissage formel ou non formel. Ces types d’apprentissages influencent seulement sur le type d’attention lorsque les règles sont employées : les règles acquises dans un contexte formel nécessitent l’attention focalisée, et celles acquises dans un contexte non formel nécessitent l’attention périphérique. Par ailleurs, le contexte d’emploi des règles formelles de la langue, comme le test ou la communication fait intervenir le traitement automatique. Seul le type d’attention impliqué varie.
Pour ces auteurs, l’acquisition d’une langue seconde se produit par accumulation d’habiletés linguistiques de bas niveau dans la mémoire à long terme, ce qui se traduit dans leur modèle par la transition du traitement contrôlé au traitement automatique.[85] Ces traitements se combinent tantôt avec l’attention focale, tantôt avec l’attention périphérique, selon l’intention d’employer une habileté nouvelle ou non, selon le contexte (test ou situation de communication) et les types de connaissances mises en jeu (acquises de façon formelle ou non formelle). McLaughlin et al. postulent que le processus d’apprentissage donne lieu à plusieurs chemins possibles, suivant la combinaison entre traitement contrôlé et automatique d’une part, et l’attention focale et périphérique d’autre part. Les processus contrôlés par l’attention focale nous semblent sous-tendre la majorité de la production en début d’acquisition. Une fois acquis certains processus de traitement linguistique automatiques, les quatre types de traitement nous semblent possibles. Leur développement différencié dépendrait, comme l’ont dit ces auteurs, des situations dans lesquelles l’apprenant se trouve, et où il doit faire appel à certains processus plutôt qu’à d’autres.
2.2.2. Hulstijn
Outre les notions de traitement contrôlé et de traitement automatique, Hulstijn (1990) emprunte à la psychologie cognitive celles de représentations déclaratives et de représentations procédurales. Selon lui, l’acquisition d’habiletés linguistiques est vue non seulement comme un changement graduel du traitement contrôlé en traitement automatique des représentations mentales, mais aussi un changement des représentations mentales déclaratives en représentations procédurales. Cette approche à double entrée lui semble capable de rendre compte de la construction et de la reconstruction des représentations aussi bien implicites qu’explicites, sous forme déclarative ou procédurale. Il précise avec Anderson (1980) que le traitement automatique n’est pas incompatible avec la représentation déclarative : on peut toujours se souvenir des règles grammaticales, tout en parlant couramment une langue étrangère.
L’apport de ce modèle par rapport à celui de McLaughlin et al. réside dans l’introduction des types de connaissances. En effet, l’attention focale ou périphérique porte notamment sur l’input mais, le traitement contrôlé ou automatique peut porter aussi bien sur l’input que sur les connaissances déjà existantes de l’apprenant. Seulement, pour Hulstijn, à la suite d’Anderson, le développement des connaissances va dans le sens des connaissances déclaratives vers les connaissances procédurales. L’apprentissage commence avec le traitement contrôlé des représentations mentales et finit en traitement automatique, via la pratique.
2.2.3. Bialystok
Nous avons vu que Bialystok adopte l’approche cognitive depuis les années 80. Sa nouvelle version des années 90 (Bialystok, 1990, 1992) ne comporte pas de grands changements par rapport au modèle de 1982. Contrairement aux auteurs précédents, Bialystok n’inclut pas dans son modèle les notions de processus contrôlés et automatique, telles qu’elles sont proposées en psychologie cognitive, même si, au bout du compte, son modèle peut se décrire en termes de ces deux processus. Son modèle porte sur deux aspects liés à l’activité linguistique, d’une part, l’analyse, correspondant aux « connaissances linguistiques que possèdent les apprenants » et le contrôle (anciennement facteur automatique), correspondant à la « façon dont ils utilisent effectivement ces connaissances » (Bialystok 1990 : 50). Ces deux composantes procédurales peuvent expliquer, selon elle, non seulement l’émergence des compétences langagières par leur développement, mais aussi la disparité des niveaux de compétence des apprenants, ainsi que la variabilité intra-individuelle « inhérente au processus d’apprentissage d’une langue étrangère ».
L’analyse et le contrôle sont décrits comme étant « des composantes relevant de mécanismes cognitifs généraux relatifs à l’apprentissage, à l’organisation de l’information, et à la résolution de problème », et « elles jouent tout autant un rôle dans le traitement de la langue maternelle que dans celui d’une langue étrangère » (Bialystok 1990 : 51).
La composante analyse des connaissances linguistiques est le traitement responsable, selon Bialystok (1992), de la nature de la représentation mentale qu’a l’apprenant du langage. Cette composante est à la base de la construction, de la structuration et de l’explicitation des représentations mentales liées aux connaissances du langage, ainsi que de leur meilleure interconnexion. L’activité d’analyse rend ainsi possible l’accès à la connaissance jusqu’alors implicite.
Le contrôle, seconde composante procédurale, remplit, selon Bialystok, trois fonctions d’attention et peut s’accompagner ou non de la conscience (awareness) : a) la sélection d’une réponse à exécuter dans un ensemble de réponses possibles ; b) l’intégration ou l’exécution efficace de la sélection ; c) et la prise en compte des contraintes en temps réel.
Ces deux composantes, ayant une responsabilité conjointe dans le traitement du langage, se développent de façon différenciée selon les différents types d’utilisation du langage auxquels est confronté l’apprenant. C’est ce qui explique la variabilité entre les apprenants et la variabilité chez le même apprenant suivant les tâches.
L’indépendance des deux composantes signifie qu’une connaissance avec un haut degré d’analyse n’entraîne pas pour autant son contrôle (application) automatique. D’ailleurs ce point peut servir d’argument contre les propos de Krashen, pour qui l’apprentissage traditionnel de la grammaire ne constitue pas réellement une base pour la production. Son argument était que même des apprenants d’anglais avancés font des fautes de niveau élémentaire, comme celle de l’omission du s au verbe à la troisième personne du singulier. Comme l’a dit à juste titre Noyau (1980a), la critique de Krashen est fondée sur la démarche transversale ignorant l’aspect évolutif de l’apprentissage. Cette persistance de fautes de base dans la production spontanée à un niveau avancé peut s’expliquer, avec le modèle de Bialystok, par le fait que la composante de contrôle n’est pas encore au point. Cet exemple de Krashen illustre bien le caractère indépendant des deux composantes. D’ailleurs ce décalage entre la compétence et la performance est un caractère représentatif de l’acquisition d’une langue étrangère par l’adulte qui l’apprend dans le cadre institutionnel qui n’offre souvent pas suffisamment d’activités pour développer la composante de contrôle.
Le modèle de Bialystok semble réconcilier celui de McLaughlin et al. avec celui de Hulstijn, en ne négligeant ni le traitement (dans le sens du contrôle), ni les connaissances. Le point d’arrivée décrit dans ce modèle, du point de vue de la composante de contrôle, est de satisfaire aux conditions du temps réel. Du point de vue de la composante d’analyse, l’apprentissage consiste, outre l’accumulation de connaissances, en une explicitation des connaissances acquises.
2.2.4. R. Ellis
R. Ellis (1994) a élaboré un modèle d’apprentissage d’une langue étrangère en milieu formel. Un tel modèle devrait, selon lui, éclairer le rôle joué par l’instruction formelle sur le code de la langue cible, et apporter des aides pour l’enseignement. Il combine les deux approches de modélisation, systémique et cognitive. Tout en utilisant le schéma chronologique avec la notion d’intake et celle des connaissances implicites et explicites, Ellis fait appel aux éléments empruntés à la psychologie cognitive, comme le processus contrôlé et le processus automatique, les mémoires à court, à long terme, et un troisième type qu’il introduit, la mémoire à moyen terme.
Pour Ellis, les connaissances explicites désignent les connaissances analysées, abstraites et explicatives, qui existent indépendamment de leur utilisation, dont l’apprenant est conscient et qui sont verbalisables. Les connaissances implicites se divisent en deux catégories : les connaissances d’expressions figées (formulaic knowledge) et les connaissances basées sur les règles. Elles sont intuitives, dans le sens où l’apprenant semble ne pas être conscient de les avoir apprises et dont il est probablement inconscient. Elles se manifestent uniquement dans la performance, et dans ce sens, sont procédurales.
L’auteur adopte la position d’interface faible (weak interface position) entre les deux types de connaissances, à la suite des observations de Long (1988) et Ellis (1990) et de l’hypothèse de Meisel, Clahsen et Pienemann (1981) qui ont avancé que les phénomènes grammaticaux peuvent se distinguer en deux catégories selon qu’ils subissent ou non les contraintes de disponibilité (readiness constraints). Cette position d’interface faible avance que la connaissance explicite obtenue par l’enseignement peut se convertir en connaissance implicite, mais seulement si l’apprenant a atteint le niveau de développement qui permet de l’assimiler.
A l’instar de McLaughlin et al., R. Ellis combine deux couples de notions (types de connaissances et types de traitement) pour rendre compte de différentes possibilités de traitement en relation avec les types de connaissances, comme l’illustre le tableau suivant :
Types de connaissance
Types de traitement
Contrôlé
Automatique
Explicite
(A) Une nouvelle règle explicite est employée consciemment et avec effort délibéré
(A new explicit rule is used consciously and with deliberate effort)
(B) Une règle ancienne explicite est employée consciemment mais relativement rapidement
(An old explicit rule is used consciously but with relative speed)
Implicite
(C) Une nouvelle règle implicite est employée inconsciemment mais avec accès lent
(A new implicit rule is used without awareness but is accessed slowly)
(D) Une règle implicite apprise complètement est employée inconsciemment et sans effort
(A thoroughly learnt implicit rule is used without awareness and without effort)
[Tableau 3 : Quatre possibilités d’emploi de règles selon le type de traitement et de connaissance, R. Ellis 1994]
On notera dans le tableau que c’est le caractère récent ou non d’une règle acquise qui détermine l’intervention d’un traitement contrôlé ou automatique : tout ce qui est acquis récemment, que ce soit une règle explicite ou implicite, nécessite le traitement contrôlé pour être utilisé (demande d’effort ou accès lent).
Pour R. Ellis, l’acquisition de connaissances implicites et explicites résulte de différents processus d’apprentissage. Pour l’acquisition des connaissances explicites, sont impliqués des mécanismes et des processus non spécialisés comme la mémorisation et la résolution de problème. L’instruction formelle contribue principalement à la constitution des connaissances explicites. Ces dernières peuvent faciliter le développement ultérieur des connaissances implicites. Mais il y a souvent un délai et celui-ci explique le paradoxe de l’instruction formelle selon laquelle elle est censée raccourcir l’acquisition et rendre celle-ci plus efficace, alors qu’en réalité ce n’est pas le cas.
Quant à l’acquisition de connaissances implicites, R. Ellis formule une réserve en ce qui concerne l’hypothèse de Krashen et de Long qui ont avancé que les règles nouvelles sont intériorisées quand l’apprenant comprend l’input (comprehensible input hypothesis). Selon l’auteur, des travaux récents montrent que la compréhension peut avoir lieu sans qu’il y ait acquisition, car l’apprenant peut comprendre l’input à l’aide de traitement descendant (top-down) qui se base sur les connaissances linguistiques existantes et des informations contextuelles. Suivant la position de White (1987) qui avance, contrairement à Krashen, que ce sont l’incompréhension et l’attention de l’apprenant portant sur les formes problématiques qui déclenchent l’apprentissage, Ellis formule l’hypothèse selon laquelle l’apprenant doit effectuer trois opérations relevant du processus contrôlé pour acquérir des connaissances implicites : a) porter l’attention aux aspects spécifiques de l’input (noticing)[86] ; b) comparer ce qui est remarqué avec ce qu’il produit d’habitude (comparing) ; c) construire de nouvelles hypothèses pour incorporer les faits remarqués dans son système d’interlangue (integrating)[87].
L’automatisation des connaissances explicites nécessite, par contre, les traditionnelles activités de grammaire contrôlées. Selon R. Ellis, la pratique permet d’automatiser les connaissances déjà existantes en améliorant la performance en langue cible, mais elle permet aussi de relâcher l’attention et orienter les efforts pour un processus contrôlé portant sur des formes nouvelles de la langue étrangère (Van Patten 1987 cité par Ellis 1994 : 100).
A la suite des études de Schmidt (1990), Ellis fait l’hypothèse que les connaissances explicites peuvent être importantes en particulier pour l’apprenant adulte. Alors que l’enfant est capable de remarquer (notice) des aspects linguistiques dans l’input par attention périphérique (la focalisation portant sur le message), l’adulte peut avoir besoin d’une attention plus focalisée et contrôlée. Il souligne que les connaissances explicites ne sont pas des substituts des connaissances implicites et à terme, conclut-il, le succès de l’acquisition d’une langue étrangère dépend des connaissances implicites. Il faut noter que le processus d’acquisition de ces connaissances implicites commence, dans le modèle d’Ellis, par l’intake et la comparaison, deux instances conscientes : qu’il s’agisse de connaissances implicites ou explicites, les processus requis au début de leur acquisition sont des processus contrôlés.
2.2.5. Pienemann
Pour étudier le processus d’apprentissage d’une langue étrangère, selon Pienemann, outre le problème d’« apprenabilité » que se posent certains chercheurs, il faut ajouter les contraintes psychologiques de l’être humain, constituant la capacité de traitement (processability) (Pienemann 1998). Ces contraintes ne font pas référence aux types de mémoire, mais à la nécessité de procédures de traitement, appliquées à diverses structures linguistiques. Par rapport à la vision de l’acquisition du langage comme acquisition d’habiletés procédurales par automatisation des opérations linguistiques (avec des contraintes psychologiques comme l’attention et les systèmes de mémoire), la théorie de la traitabilité (processability Theory) tente, dit Pienemann, d’aller au-delà de cette approche cognitiviste, en déterminant, de façon expérimentale, certaines des procédures essentielles de ces approches (Pienemann 1999 : 383-386). Une fois définies les séquences de développement des routines de traitement de langage de l’apprenant, on pourra prédire, selon lui, les éléments de grammaire traitables aux différents moments du développement chez un apprenant.
La théorie de la traitabilité de Pienemann envisage d’abord la nature des routines computationnelles et, l’ordre dans lequel elles deviennent disponibles chez l’apprenant. Pour Pienemann, l’acquisition du langage consiste essentiellement à acquérir graduellement ces routines computationnelles, compétences (skills) procédurales nécessaires au traitement du langage. Il s’ensuit que l’ordre dans lequel l’apprenant acquiert une langue étrangère est déterminé par l’ordre de développement des routines de traitement (processing routines) nécessaires pour manipuler les composantes de la langue cible. Il établit cinq étapes développementales des routines de traitement applicables à l’acquisition de toute langue, étapes reliées par un rapport implicationnel. De ce fait, on peut prédire l’apprenabilité d’une structure linguistique pour l’apprenant d’un niveau donné.
Le traitement suit l’ordre suivant : d’abord le choix de l’item lexical selon le message conçu (lemma access), contenant des informations comme la catégorie syntaxique (nom par exemple), le nombre, la personne. Ensuite, se déclenche l’attribution de la fonction syntaxique à ce mot (category procedure), par exemple sujet de la phrase, qui entraîne le processus de constitution de syntagme (phrasal procedure) avec, par exemple, l’ajout d’un déterminant. S’ensuivent la construction du reste de la phrase (S procedure) et, éventuellement, la construction d’une proposition subordonnée (subordinate clause procedure). La conception du message continue pendant que se poursuit graduellement la conversion en mots. La linéarité de la phrase impose un ordre différent des éléments par rapport à ceux du message conçu. Il faut donc une mémoire pour stocker les informations grammaticales, à laquelle l’apprenant aura accès lors du traitement grammatical.
Le modèle ne traite pas la conversion de l’input en connaissance linguistique, ni les principes généraux du processus d’automatisation comme on a pu le voir chez les auteurs précédents. Le problème développemental, la détermination des séquences dans lesquelles se développent les habiletés procédurales automatisées chez un apprenant (procedural skills) est son seul objectif. Pour le système implicationnel, il utilise l’idée qui n’est d’ailleurs pas nouvelle, selon laquelle pour maîtriser certaines règles, il faut en avoir maîtrisé certaines autres. L’hiérarchie des règles est établie selon le découpage classique de la phrase : syntagmes, proposition, phrase simple, et phrase complexe. Cet ordre est jugé commun à l’acquisition de toutes les langues.
L’inclusion de l’aspect linguistique dans la charpente même du modèle donne à ce modèle un caractère plus linguistique par rapport aux autres modèles que nous avons vus. Etant donné cette structure commune, pour pouvoir l’appliquer sur l’acquisition d’une langue particulière, il faut y incorporer le modèle de structures spécifiques de cette langue. Mais les phénomènes courants chez les apprenants qui sont capables de produire des phrases simples et complexes sans avoir maîtrisé complètement les différentes structures du syntagme nominal mettent en cause le fondement de ce modèle.
2.2.6. Conclusion des modèles d’apprentissage d’une langue étrangère d’approche du traitement de l’information symbolique
On a pu constater que les éléments les plus fréquemment empruntés à la psychologie cognitive dans ce type de modèles sont les types de traitement (contrôlé et automatique), les types de mémoires et les types de connaissances (déclaratives et procédurales). A l’aide de ces notions, les auteurs décrivent l’acquisition d’une langue étrangère comme une transition : du point de vue du traitement, elle se décrit comme une transition du traitement contrôlé au traitement automatique (Hulstijn et R. Ellis). En termes de mémoire, l’acquisition consiste à transférer les connaissances de la mémoire à court terme à la mémoire à long terme (McLaughlin et al., Ellis). Du point de vue du type de connaissances, elle produira une transition des connaissances déclaratives aux connaissances procédurales (Hulstijn). En fait, la transition de l’une de ces trois dimensions entraîne ou s’accompagne de celles des deux autres. Mais pour McLaughlin et al. et Bialystok, ces orientations constituent un des chemins possibles d’acquisition, lesquels sont déterminés par l’approche de l’apprenant vis-à-vis de l’input et les types d’activités langagières auxquels est soumis l’apprenant.
3. Modèles d’apprentissage d’approche connexionniste
Le connexionnisme est une modélisation du traitement de l’information essentiellement basée sur des hypothèses simulant le fonctionnement du système nerveux. Cette modélisation repose sur la force ou l’interaction associative entre éléments, déclenchée par des signaux à l’intérieur d’un réseau homogène (Béroule, 1989). Ces processus de fonctionnement sont décrits par Laks comme étant distribués, continus et dynamiques, dans un cadre probabiliste et statistique.
Le connexionnisme se situe ainsi au niveau sub-symbolique et ne reconnaît comme relations causales que les relations ascendantes : elles ne reposent sur aucune manipulation algorithmique de structures symboliques explicites. Le connexionnisme se définit comme « descendant sophistiqué de l’empirisme et de l’associationnisme », et il « réactive un certain nombre de thèses associationnistes et béhavioristes tout en proposant un dépassement conceptuel » (Laks 1996 : 27).
Le connexionnisme est né dans les années 1940. McCulloch et Pitts (1943) ont montré qu’une architecture directement inspirée du fonctionnement neuronal pouvait calculer des fonctions logiques sans recourir à un langage symbolique et à un niveau syntaxique autonome. Les modèles connexionnistes ont été appliqués notamment à la cybernétique dans les années 1940 et 1950 et plus récemment à l’intelligence artificielle dans le domaine de la perception des formes et des opérations élémentaires et automatiques. Dans le domaine linguistique, le connexionnisme a été introduit dans les années 1980 dans les études sur le traitement langagier en général et sur l’apprentissage d’une langue première (McWhinney & Leinbach, 1991, Marcus et al., 1993 cités par Broeder & Plunkett, 1994). Le modèle PDP (Parallel Distributed Processing) proposé par Rumelhart et McClelland en 1986 arrive ainsi à modéliser le traitement de phénomènes linguistiques complexes.
3.1. La mémoire, la compétence et l’apprentissage dans le connexionnisme
Pour le connexionnisme, la mémoire est un système associatif ne possédant qu’un type de mémoire constitué d’unités élémentaires. Les unités sont toutes semblables et répondent à la somme de leurs entrées pondérées, en générant sous certaines conditions un signal qui se propage vers d’autres éléments du réseau (Béroule, 1989). Ce qui est stocké dans la mémoire, dit Béroule, n’est pas un ensemble de connaissances, mais un ensemble de relations qui active ou inhibe la propagation de signaux, et qui conduit à des schémas de connectivité différents, et un ensemble de « traces mnésiques matérialisées par des connexions neuronales ».
La compétence connexionniste perçue comme inconsciente est modélisée comme un savoir disponible et explicite seulement sous forme procédurale qui n’est pas directement représenté physiquement dans l’esprit ni n’est manipulé par computation mentale. Ce savoir est, selon Laks, immanent aux architectures sub-symboliques qui le supportent sous forme de poids de connexions : les connaissances ou la compétence correspondent aux états stables des schémas de connectivité, conséquences de la régularité des activités du substrat physique.
La conception connexionniste de l’apprentissage découle d’une représentation du fonctionnement mental caractérisé par l’absence de règles et de représentations explicites. Dans le cognitivisme symbolique qui distingue, d’une part, les types de connaissances et les représentations, et d’autre part, les activités inférentielles portant sur elles, l’apprentissage est un processus d’acquisition de connaissances déclaratives et procédurales, s’accompagnant d’une automatisation de déclenchement des procédures. A l’opposé, l’apprentissage connexionniste se manifeste uniquement par l’augmentation ou la diminution progressive du poids des connexions entre unités de traitement et consiste à associer un type d’entrée et un type de sortie (Béroule, 1989). Suivant les modèles, l’apprentissage connexionniste peut se représenter tantôt comme le chemin d’accès privilégié qui lie les unités activées de l’entrée et la sortie (modèle à représentation locale), tantôt comme une formation de configuration stable du réseau (modèle à représentation distribuée). Dans les deux cas, au fur à mesure du cumul d’expériences, le poids de connexions augmente entraînant le transfert de plus en plus rapide du signal.
3.2. Modèles connexionnistes de traitement linguistique
Le connexionnisme a commencé, dans les années 1980, à élaborer des modèles de traitement linguistique[88], domaine réservé jusqu’alors au cognitivisme symbolique. L’interprétation du langage naturel y est traitée comme une tâche de reconnaissance de forme, dans laquelle la part du raisonnement est faible[89] (Béroule, 1989). En ce qui concerne l’acquisition langagière, le modèle de compétition proposé par Bates et McWhinney (1987[90] et McWhinney, 1987) combine le connexionnisme et l’approche linguistique fonctionnelle. Il concerne principalement l’acquisition de la langue première mais secondairement aussi la production en langue étrangère.
Le modèle connexionniste semble mieux apte à expliquer l’acquisition de certains phénomènes linguistiques. Par exemple, l’apprentissage du genre en français par des natifs (Tucker, Lambert et Rigault 1977, cités par Schmidt 1994) semble un cas d’apprentissage implicite : les sujets français d’expérimentation ont attribué un genre à la plupart des noms présentés (noms rares ou inventés) en fonction de leur terminaison, alors qu’ils n’ont appris aucune suggestion d’utilisation d’indice de type phonologique pendant leur scolarisation et qu’ils n’étaient pas conscients d’une telle classification. Pour Schmidt (1990 : 148), « speakers assign gender under simultaneous pressure from all gender/stem pairs in memory, with each pair given an association strength based on experience[91] ».
D’autres microstructures ont fait également l’objet de modélisation ou de simulation connexionniste : l’acquisition du passé des verbes anglais à l’aide du modèle PDP(Parallel Distributed Processing) par Rumelhart et McClelland (1986), l’acquisition des articles définis en allemand langue première (McWhinney, Leinbach, Taraban et McDonald 1989 cités par Schmidt, 1994), l’acquisition des allomorphes /s/ /z/ et /iz/ du morphème régulier de pluriel en anglais langue première (Lee et Gasser 1992 cités par Schmidt). Les données empiriques observées dans l’acquisition du système de pronoms du néerlandais langue étrangère par des apprenants adultes turcs et marocains, du projet ESF, ont aussi été simulées par le modèle connexionniste (Blackwell et Broeder 1992 cités par Broeder et Plunkett, 1994).
Selon Broeder et Plunkett (1994), le modèle connexionniste contribue à comprendre quelques phénomènes d’acquisition d’une langue étrangère : le rôle de la fréquence des unités type/occurrence (token) dans l’input (simulé par Blackwell et Broeder 1992, cités par Broeder et Plunkett, 1994) ; l’acquisition de l’ordre des mots de la langue étrangère (simulée par Elman 1990, cité par Broeder et Plunkett, 1994) ; le rôle du transfert de la langue première (simulé par Gasser 1988, 1990, cité par Broeder et Plunkett, 1994).
3.3. Pour conclure
Il existe, dans tout apprentissage, un traitement non conscient de l’input et un traitement conscient et intentionnel. Comme le connexionnisme élabore un modèle de traitement qui a lieu au niveau sub-symbolique et subconscient, il se prête naturellement à la modélisation du traitement non conscient. Selon Richard (1990), les modèles connexionnistes ont été effectivement utilisés pour modéliser des phénomènes d’identification perceptive (systèmes de reconnaissance automatique de formes, élaborés par McClelland et Rumelhardt 1981, cités par Richard, 1990) ou la construction de prototypes en mémoire, ainsi que les acquisitions élémentaires comme la catégorisation ou l’identification des traits pertinents dans la sélection de règles. Le connexionnisme simule aussi avec succès l’apprentissage d’autres activités cognitives automatiques, liées notamment à la fréquence d’un élément dans l’input.
Il semble aussi que les réseaux connexionnistes soient appropriés pour modéliser les aspects de la langue que les systèmes basés sur les règles ont du mal à traiter, comme les zones de la grammaire où les cas réguliers et les cas exceptionnels ne sont pas clairement distincts (ex. le genre du français, les articles définis en allemand), ainsi que les aspects de la langue qui sont considérés comme régis par des règles sans qu’elles soient explicites (le cas des allomorphes du morphème régulier du pluriel en anglais).
Mais il existe quelques points faibles dans cette approche. Comme le signale Schmidt (1994), si les réseaux connexionnistes rendent bien compte du caractère graduel de l’acquisition, ils apprennent trop lentement pour refléter l’apprentissage humain. Ce modèle rend compte difficilement de l’acquisition extrêmement rapide des informations complexes suivant les règles explicites, ou de la restructuration après une compréhension soudaine. Ce défaut du modèle est dû au refus de la prise en compte du caractère effectif ou productif (génératif) des règles. Or dans l’apprentissage d’une langue étrangère, une règle peut exister d’abord en compréhension. Dans ce cas, la règle est générative. Ou encore, elle peut exister en extension, sous forme de liste d’exception, comme la liste de mots bijou, caillou, chou, genou, hibou, joujou, et pou. pour la marque de pluriel avec x, au lieu de s. Cette problématique semble bien celle de l’apprenant qui a tendance à surgénéraliser une règle effective pour lui, et qui doit progressivement intégrer des contraintes qui limitent sa capacité générative en permettant d’éliminer des expressions non valables. Ce refus des règles effectives ou génératives provient de l’absence de processus descendant ou déductif dans le connexionnisme, qui existe pourtant bel et bien dans le processus d’apprentissage d’une langue étrangère, aussi bien en milieu formel qu’en milieu naturel. Notons que le caractère génératif des règles est plus évident pour des règles simples, comme l’exemple de marqueurs de pluriel. Quant à l’acquisition des règles non formalisées, règles souvent complexes, et qui peuvent ainsi difficilement fonctionner comme base de production pour l’apprenant, le modèle connexionniste constitue par nature une bonne simulation.
4. Apports de la psychologie cognitive à l’étude de l’appropriation d’une langue étrangère
Dans cette partie, nous aborderons les notions qui s’emploient dans l’acquisition d’une langue étrangère et les questions pour lesquels la psychologie cognitive offre des éléments de réponse. Nous discuterons notamment la question de l’apprentissage implicite/explicite qui reste encore un débat ouvert en psychologie cognitive, et le phénomène de décalage entre les connaissances métalinguistiques et leur utilisation dans la communication en langue cible, qui s’observe souvent dans le contexte d’apprentissage institutionnel et qui témoigne du processus d’appropriation.
4.1. Apprentissage implicite/apprentissage explicite
Quand on parle de l’opposition entre l’apprentissage implicite et l’apprentissage explicite, il existe deux acceptions. Dans la première acception, où la distinction se base sur les conditions extérieures d’apprentissage, l’apprentissage implicite est celui où l’apprenant ne reçoit pas ou peu de métalangage ou d’informations métalinguistiques dans l’input ou sous une forme non explicite (feedback négatif comme incompréhension de l’interlocuteur). Et l’apprentissage explicite est celui où l’environnement offre à l’apprenant des informations métalinguistiques explicites. L’effet de différentes conditions d’apprentissage d’une langue réelle a fait l’objet de plusieurs expérimentations (N. Ellis 1993, Michas, Scott 1989 cités par Berry, 1994, Robinson 1996, De Graaff 1997 cité par McWhinney, 1997) et leurs résultats ont tendance à indiquer l’efficacité supérieure de la situation explicite.
Dans la seconde acception, les deux types d’apprentissage renvoient à différents mécanismes internes d’apprentissage, quel que soit l’environnement et le type d’input. De ce point de vue, l’apprentissage implicite désigne un apprentissage inconscient et l’apprentissage explicite, un apprentissage avec recherches conscientes de règles. Nous nous intéresserons dans ce qui suit à l’acception générale de l’apprentissage, qui relève du traitement de l’input linguistique par l’apprenant.
4.1.1. Apprentissages implicite et explicite étudiés en psychologie cognitive comme deux formes générales d’apprentissage
En tant que processus internes d’apprentissage, les processus implicite et explicite forment un thème de recherche actif en psychologie cognitive. Berry et Broadbent (1988)[92] ont distingué ces deux types d’apprentissage comme modes possibles d’apprentissage dans leurs expériences portant sur l’apprentissage complexe des relations entre les variables. Le mode décrit comme implicite ou non sélectif (unselected-mode) est celui dans lequel le sujet observe des variables d’une façon non sélective et essaie de stocker une agrégation d’informations contenant des cooccurrences d’événements ou des traits environnementaux : les facteurs pertinents et non pertinents sont mémorisés et après beaucoup d’expériences, le sujet retient bon nombre de relations condition-action qui assurent une performance efficace. Pour Schmidt, ce mode non sélectif (implicite) joue un grand rôle quand la tâche est plus complexe et que le nombre d’hypothèses possibles devient impossible à gérer.
Le second mode d’apprentissage décrit comme sélectif ou explicite (S-mode) est celui dans lequel le sujet sélectionne quelques variables clés et mémorise les circonstances liées seulement à ces variables. Une fois les variables correctes sélectionnées, ce mode est rapide et efficace. Etant donné le faible nombre de relations impliquées, la connaissance acquise par ce mode peut être explicitée. Ce mode semble impliqué en général dans des situations de résolution de problème, dans l’évaluation d’hypothèses explicites et dans l’application de règles et dans d’autres processus conscients similaires. Si la tâche implique beaucoup de variables non pertinentes ou si les mauvaises variables sont sélectionnées, ce mode d’apprentissage est moins efficace que le mode non sélectif. Berry et Broadbent (1987 cité par Schmidt 1994) ont également constaté que le caractère saillant influe sur l’intervention du mode explicite.
4.1.2. Caractéristiques de l’objet d’apprentissage dans deux modes d’apprentissage
A. Diverses caractéristiques de la règle
L’existence des deux modes d’apprentissage étant observée, la question est de savoir dans quelles circonstances le sujet a recours à l’un ou l’autre mode de façon délibérée ou spontanée. Diverses expérimentations semblent indiquer que les caractéristiques de l’objet de l’apprentissage ont une relation avec l’intervention des deux modes : certaines règles s’acquièrent plus facilement par le mode implicite et certaines autres, par le mode explicite. Sharwood Smith (1994) a avancé que certains aspects de la langue s’acquièrent mieux par des règles explicites. Les expériences menées par Mathews et al. (1989) sur une grammaire artificielle montrent que certains types de règles sont mieux appris implicitement, mais cet apprentissage implicite n’est pas adéquat pour des règles logiques simples, comme les relations de deux variables correspondant au phénomène d’accord. Robinson (1996), quant à lui, a constaté dans son expérience que les règles simples étaient les mieux apprises par le groupe du contexte explicite. Green et Hecht (1992 cité par Schmidt, 1994) ont constaté dans leur expérience que les règles qui se réfèrent à des catégories facilement reconnaissables pouvaient s’appliquer mécaniquement. R. Ellis (1994) y ajoute les règles qui ne dépendent pas de contextes larges. Pour Berry (1994), l’apprentissage explicite, basé sur le test explicite d’hypothèses peut être bénéfique quand les relations pertinentes sont saillantes mais il peut être inefficace quand les relations ne sont pas saillantes[93] ou évidentes. Par contre, les règles plus difficiles à acquérir étaient, selon Green et Hecht, celles contenant des distinctions sémantiquement subtiles ou celles qui ne sont pas gouvernées par un contexte linguistique immédiat. Les règles concernant la catégorie grammaticale, aspect, dont R. Ellis (1994) parle de la difficulté d’acquisition nous semblent en être un exemple.
Schmidt remarque que ces constats vont dans le même sens que l’hypothèse d’Andersen (1988 cité par Schmidt, 1994) selon laquelle les apprenants découvriront dans l’input plus précocement les relations forme-sens transparentes et encodées uniformément, et qu’ils percevront plus tôt la fonction des mots grammaticaux (functors) qui sont attachés ou positionnés près des items informationnels (content words) auxquels ils s’appliquent.
B. Complexité de la règle et apprentissage implicite
De nombreuses discussions portent sur les règles complexes, animées par les expérimentations menées depuis 1965 par Reber[94] et ses collègues sur l’acquisition d’une grammaire artificielle miniature et les controverses qui s’en suivirent. Dans les tâches, on présentait aux sujets des phrases générées par la grammaire artificielle et on leur demandait d’être attentifs ou de les mémoriser. On vérifiait l’acquisition par la sollicitation de jugements de grammaticalité sur de nouveaux exemples (Schmidt, 1994). Reber, qui, depuis 1965, a entamé une longue série d’expérimentations avec une grammaire artificielle a observé que les sujets exposés à des exemples sont devenus sensibles aux régularités sous-jacentes à l’input et étaient capables de juger correctement la grammaticalité des nouveaux exemples sans pouvoir verbaliser les règles sous-jacentes. Il en tire la conclusion que les sujets ont acquis des règles par apprentissage implicite et que cet apprentissage est le processus par lequel on développe des connaissances intuitives sur la structure sous-jacente d’un stimulus complexe. Pour Reber, ce processus est inconscient dans un double sens, non intentionnel et d’induction inconsciente. Ce système d’induction implicite est considéré par ailleurs par Winter et Reber (1994) comme plus primitifs et plus robuste que les processus cognitifs conscients en tant que moyen de résolution de problème et d’élaboration de décisions. Reber avance encore qu’outre le processus lui-même, le produit de l’apprentissage est également inconscient et sert de base pour les jugements intuitifs et non déductifs. L’une des interprétations des résultats expérimentaux de Reber qui a suscité les réactions les plus vives est le caractère abstrait du produit de l’apprentissage, manifesté, selon lui, par la capacité des apprenants à appliquer les règles sous-jacentes sur de nouveaux exemples.
La conclusion de Reber selon laquelle l’apprentissage implicite est un processus inconscient est critiquée par diverses autres expériences qui montrent une conscience de règles chez les sujets, certes personnelles mais sur lesquelles ils basent leur jugement de grammaticalité de nouveaux exemples, et leur capacité de verbaliser ces règles (Dulany, Carlonson et Dewey 1984 cités par Schmidt, 1994). Ces données montrent au contraire l’apprentissage comme conséquence d’un processus conscient, conclusion vers laquelle convergent également les résultats d’expériences conduites par Robinson (1996) qui compare les effets de différentes conditions d’apprentissage.
D’autres expérimentations fournissent des arguments pour critiquer le caractère abstrait des règles induites par les sujets, l’abstraction étant exclusivement associée avec les fonctions cognitives conscientes comme le raisonnement logique (Perruchet et Pacteau 1990, 1991 cités par Schmidt, 1994). Ce qui est acquis n’était pas des règles abstraites, mais des connaissances plus concrètes, comme des connaissances de vraisemblance de groupes de lettres spécifiques dans les chaînes grammaticales. Pour les opposants, le processus de l’apprentissage implicite serait basé sur l’accumulation graduelle des informations (Perruchet et Pacteau, Ibid.) ou une forme complexe de traitement de fréquence (Hayes et Broadbent 1988 cités par Berry 1994, Lewicki cité par Schmidt, 1994), ou encore un processus automatique basé sur la mémoire à travers des mécanismes de reconnaissance de configurations (Mathews et al. 1989, Ibid.).
Nous suivons quant à nous la lecture de Berry (1994) de diverses expériences sur des tâches complexes : selon ces données, les connaissances obtenues semblent le résultat des deux modes, implicite et explicite, le poids de l’un ou l’autre dépendant de facteurs comme la nature des instructions et la saillance des variables clés.
4.1.3. Apprentissages implicites et explicites dans l’acquisition d’une langue étrangère
Le débat en psychologie sur l’apprentissage implicite/explicite a eu des répercussions sur les recherches en acquisition d’une langue étrangère et on trouve les mêmes divergences d’avis dans cette discipline. Entendus comme des mécanismes internes d’apprentissage, inconscient et conscient, nous pouvons considérer ces deux processus d’apprentissage du point de vue de l’attention et de l’induction. Ces deux formes de conscience (cf. Huot et Schmidt, 1996) nous semblent pertinentes dans l’acquisition d’une langue étrangère.
A. Acquisition implicite et explicite d’une langue étrangère du point de vue de l’attention et de l’identification (noticing)
Du point de vue de l’attention, les deux modes d’apprentissage implicite correspondent à l’apprentissage sans attention sélective (ou avec attention périphérique selon le terme de McLaughlin et al. 1983) par opposition à celui avec attention sélective.
Schmidt est le représentant de ce mode avec attention sélective et il met notamment l’accent sur la nécessité de l’activité de remarquer quelque chose dans l’input (noticing)[95]. A partir de sa propre expérience d’acquisition du portugais du Brésil il a formulé l’« hypothèse de la perception de l’écart (notice the gap principle) », selon laquelle l’acquisition a lieu quand l’apprenant compare consciemment le décalage entre ce qu’il entend et ce qu’il produit lui-même en langue étrangère (Huot et Schmidt 1996 : 111-112). L’attention sélective peut rendre une règle critique (Klein 1989) qui va potentiellement faire l’objet de l’acquisition.
Cette hypothèse de la nécessité de l’attention et de l’action de remarquer s’oppose à l’hypothèse, ou à la croyance répandue, que l’apprenant peut néanmoins attraper ça et là des aspects de la langue cible sans d’attention focalisée ou sans en être conscient, comme dans l’expérience d’Altman (1990 cité par Schmidt, 1994).
Richard et al. nuancent d’ailleurs les résultats corroborant cet apprentissage implicite, sans attention. Selon eux, même pour des informations comme la fréquence d’apparition d’un trait, le degré de covariation entre deux traits, la localisation spatiale d’un indice… supposés être intégrés automatiquement sans faire l’objet d’une attention consciente, ne se révèlent pas toutes automatiques, puisque d’après un contrôle ultérieur, les sujets peuvent verbaliser plus que ce qui a été rapporté (Perruchet 1988 cité par Richard et al., 1990). En effet, dans l’expérience de Michas (supra. cité par Berry, 1994), l’interview avec les sujets montre que dans le contexte implicite d’apprentissage, ils avaient cherché les règles dans la phase d’apprentissage. Pour avoir des données valables, un tel test final est donc nécessaire.
B. Acquisition implicite et explicite d’une langue étrangère du point de vue de l’induction
Les tenants de l’induction inconsciente sont nombreux. Beaucoup d’entre eux sont des générativistes. A commencer par Corder (1980), l’apprenant adulte d’une langue étrangère est souvent considéré comme procédant à la formation et à la vérification inconsciente d’hypothèses. Seliger avance que « obviously, it is at the unconscious level that language learning takes place » (Seliger 1983 cité par Schmidt 1994 : 171). Pour Felix (1981, 1985, cité par Schmidt, 1994), le succès de l’acquisition n’a pas de rapport avec la formation consciente d’hypothèses ainsi que d’autres processus conscients, typiques de la résolution de problèmes. Selon cet auteur générativiste qui ne nie pas l’existence du processus explicite, de tels processus conscients sont des caractéristiques de l’apprentissage d’une langue étrangère par l’adulte, mais ils nuisent finalement à l’acquisition, car les capacités générales de résolution de problème sont inférieures au système inné d’acquisition de langues, avec lequel elles sont en compétition. Eubank (1991, dans Schmidt, 1994) et White (1981, dans Schmidt 1994) avancent aussi que l’apprenant construit inconsciemment une théorie de la langue et que cette théorie est, de plus, très proche de la théorie que le linguiste construit par l’analyse consciente.
Une partie des générativistes s’investissant depuis les années 80 dans les recherches sur l’acquisition d’une langue étrangère soutient l’apprentissage implicite avec induction inconsciente dans le cadre de deux aspects de leur théorie : le postulat de la grammaire universelle, et le réglage ou le réajustement de paramètres (parameter setting or resetting). Dans le cadre de l’hypothèse d’accès à la grammaire universelle lors de l’acquisition d’une langue étrangère[96], la grammaire universelle est disponible pour tous les apprenants, et grâce à elle, ils connaissent déjà un bon nombre de choses sur la langue cible avant même l’exposition à cette langue, et ils ne violent pas les principes de la grammaire universelle dans leur interlangue. Une position mixte limite l’influence de la grammaire universelle à l’acquisition de la langue première, avec une dépendance de stratégies générales de résolution de problèmes pour l’acquisition d’une langue étrangère par l’adulte (Bley-Vroman, Clahsen, Clahsen & Muysken, Schacheter, Ibid.).
Quant aux paramètres, c’est un groupe de propriétés abstraites de la grammaire reliées entre elles, mais qui se manifestent par divers phénomènes en surface. Par exemple, le paramètre pro-drop inclut la capacité d’omettre les pronoms sujets, l’inversion du sujet-verbe, et les effets de trace lorsque les sujets sont extraits de propositions contenant des ‘complementizer’. L’acquisition d’une des propriétés entraîne celle des autres (Bley-Vroman 1989, Ibid.). Dans une expérimentation sur l’acquisition du placement des adverbes en anglais par des apprenants français, White (1991, Ibid.) avait fait l’hypothèse que les apprenants maintiendraient le réglage du paramètre de leur langue maternelle ou qu’ils le réajusteraient automatiquement sur les valeurs de l’anglais. Selon ce paramètre, la structure française Sujet-Verbe-Adverbe-Objet (Marie regarde souvent la télé) ne peut pas apparaître simultanément avec la structure anglaise Sujet-Adverbe-Verbe (Mary often watches television). Mais ces deux structures ont été constatées simultanément dans la plupart des productions de ses apprenants et White constate l’échec de sa prédiction de réajustement de paramètres.
Outre les travaux générativistes, Schmidt (Ibid.) relève plusieurs expérimentations ou spéculations qui proposent l’hypothèse de l’induction inconsciente : entre autres, celle de Block (1990) en phonologie de l’anglais langue première (L1), celle de Freidin (1990) pour les règles d’accord du sujet et du verbe en nombre et en personne en anglais L1, celle de Seliger (1979) sur les contextes d’emploi de deux allomorphes de l’article indéfini a/an en anglais L1 et L2. Mais Schmidt critique les arguments de ces auteurs : pour lui, ces derniers surestiment ce que savent inconsciemment les locuteurs, notamment quand les règles en questions sont théoriquement motivées (l’exemple de -nger, et celui de l’article a/an), et sous-estiment ce que les locuteurs ou apprenants savent consciemment.
Trévise (1992 : 4) plaide pour l’intervention des deux processus (induction consciente et inconsciente) dans l’appropriation d’une langue étrangère chez « des sujets qui ont un passé métalinguistique scolaire, en langue 1 ou en langues 1 et 2 », sur la base de deux types de connaissances observés, connaissances de règles conscientes et connaissances inconscientes résultant des hypothèses inconscientes.
4.2. Connaissances métalinguistiques et communication
Si la problématique de l’apprentissage implicite et explicite relève du processus général d’apprentissage, englobant le volet de la construction de connaissances en langue étrangère et celui de la production, la question de l’utilisation des connaissances métalinguistiques relève plus particulièrement de la phase de production. Dans la position du processus implicite de l’apprentissage d’une langue étrangère, basée sur l’attention et l’induction inconscientes, le rôle joué par les activités métalinguistiques conscientes de l’apprenant et par ses connaissances explicites est quasi nul ou il est réduit à un rôle minimal (cf. l’hypothèse du monitor de Krashen). Dans cette section, nous examinerons les expériences et observations qui mettent au jour un phénomène de décalage et les notions susceptibles de l’expliquer, empruntées à la psychologie cognitive.
4.2.1. Décalage entre les connaissances métalinguistiques et leur utilisation
Nombreuses sont les expériences et les observations qui font état du décalage entre la performance et la possession de connaissances métalinguistiques. Ces expériences ont utilisé la verbalisation de règles pour vérifier la possession de connaissances métalinguistiques et les résultats montrant le décalage sont souvent utilisés comme arguments pour l’hypothèse de l’apprentissage implicite ou inconscient, ou de l’inutilité des connaissances métalinguistiques.
Différentes expériences portant sur la capacité de verbalisation de la règle (possession de la règle) ou la conscience de la règle et sur la performance en production d’apprenants d’une langue étrangère montrent des réalités diverses : outre les cas de corrélation entre les connaissances des règles et la bonne performance dans la production (Hulstijn et Hulstijn 1984, Grigg 1986, cités par Schmidt, 1990), on observe aussi que des sujets n’ayant pas pu verbaliser les connaissances métalinguistiques correspondantes faisaient preuve d’une certaine compétence et même d’un progrès (Hulstijn et Hulstijn 1984, Ibid.), mais aussi que la possession de telles connaissances semblant jouer souvent un rôle important, n’avait, dans certains cas, aucun impact sur la performance (Berthoud 1980, Schachter 1986, Trévise 1994).
Cette hétérogénéité reflète trois différents cas possibles de relations entre la connaissance de la règle et son utilisation, comme Dakowska l’a relevé (1993 : 89) :
a) – règle + énoncé
b) + règle + énoncé
c) + règle – énoncé
La non-utilisation de connaissances métalinguistiques, qui s’observe mieux dans le milieu formel d’apprentissage chez des apprenants adultes, conduit Lawler et Selinker (1971 cités par Dakowska, 1993 : 95) à parler du paradoxe de la règle (rule paradox) qui désigne la difficulté d’appliquer en particulier une nouvelle règle, alors qu’une règle sert à générer la production. Ce phénomène est également à la base de la question que se pose ensuite Seliger (1979 dans Ibid.) sur l’opérationnalité de la règle grammaticale : « does having a conscious rule, either from a teacher, grammar book, or formulated by the learner, mean that the learner knows what to do with it ?[97] ».
Face à ces observations, Lawler et Selinker (1971 cités par Dakowska, 1993) ont vu une indépendance entre la règle et son utilisation, et d’autres chercheurs (Dakowska 1993, Trévise 1992, Sharwood Smith 1994) y voient, dans la même perspective, une absence de relations causales ou implicationnelles.
A défaut de données démontrant une quelconque relation, de nombreux chercheurs ont avancé des hypothèses ou leur propre conviction sur le rôle ou l’utilité des connaissances métalinguistiques, pour l’instant sans fondement, dit Sharwood Smith (1994). Pour Mittner et Kahn (1982), les connaissances métalinguistiques assurent la rapidité de l’acquisition ; pour Bialystok (1990), elles contribuent aussi à l’organisation des connaissances et à la compréhension de la structure déjà connue ; pour Trévise (1992 : 20), la fonction et l’utilité des connaissances conscientes sont, à long terme, de servir de moyen de secours ou de repères conscients ; pour Dakowska (1993), elles fonctionneraient dans un processus de raisonnement, comme l’inférence ; pour Véronique (1993), elles contribuent à la saisie de données langagières, à un travail sur les règles de la langue cible et à la mise en mémoire ; et pour Trévise (1996), dans une perspective cognitive, elles interviennent dans la régulation de la mémoire et permettent l’automatisation à travers la mémoire et le contrôle.
Il existe trois explications de ce décalage dans la littérature. La première concerne les différents types de règles et leur statut psychologique, la deuxième caractérise le rôle des connaissances métalinguistiques comme focalisateur sur l’input, et la troisième, issue de la psychologie cognitive, explique le phénomène en termes de formulation des connaissances métalinguistiques et d’automatisation.
4.2.2. Première explication du décalage : types de règles et statut psychologique
Cette explication est proposée par Sharwood Smith (1994 : 34) qui, partant du constat qu’une conscience (awareness) accrue ne semble souvent pas s’accompagner de l’amélioration de la performance, pose la question suivante : « les règles aident-elles l’acquisition ? » Pour trouver des éléments de réponse, ce chercheur repère d’abord plusieurs types de règles du point de vue de la forme et postule ensuite deux statuts psychologiques différents à leur propos qui peuvent expliquer le décalage observé. Du point de vue de la forme, les règles peuvent se présenter :
a) sous forme d’instruction, comme « dans la situation X, faire Y », correspondant à la connaissance de procédure (condition-action) ;
b) sous forme de principes comme « quand il y a P, c’est presque toujours Q », ou alternativement, « quand il y a P, c’est presque jamais Q »;
c) en terme de tendance, correspondant aux règles plutôt vagues comme « P a tendance à inclure Q dans le contexte X » ou « P inclut X à 90 % de temps dans le contexte Z ».
Sharwood Smith relève deux types de règles ayant un statut psychologique différent correspondant en fait aux connaissances déclaratives, et aux connaissances procédurales entendues comme connaissances automatisées et non verbalisables[98], qui ne se manifestent que dans l’action. Le premier type concerne les règles descriptives telles qu’elles sont élaborées par les linguistes ou grammairiens. Une fois que ces règles ont été acquises, l’apprenant peut en être conscient et il peut en parler, indifféremment du fait qu’il peut s’en servir ou non en production. Le deuxième type regroupe les règles que l’apprenant a captées sans réflexion ou analyse, comme les enfants apprenant leur langue maternelle. La possession de ces règles se manifeste par le fait qu’on est capable de produire des phrases systématiques dans une langue mais sans pouvoir en parler.
En reprenant les caractéristiques des connaissances procédurales dégagées par les psychologues, Sharwood Smith explique le décalage entre les connaissances métalinguistiques et leur utilisation par la non-acquisition du statut psychologique approprié, à savoir la non-conscience et la non-verbalisation. Alors que pour Frauenfelder et Porquier (1979), le décalage est dû à l’absence de connaissances implicites correspondant à la connaissance explicite, suggérant par là la possibilité pour une même connaissance d’exister sous deux états différents. La proposition de Sharwood Smith nous ramène encore aux questions d’apprentissage implicite/explicite et de connaissances implicites/explicites.
4.2.3. Deuxième explication du décalage : rôle indirect et limité des connaissances métalinguistiques par rapport à la production
Un autre type d’explication du décalage est proposé par Seliger (1979 cité par Schmidt, 1994). Les règles pédagogiques, règles grammaticales utilisées dans la classe de langue, joueraient un rôle non comme système de production, mais comme dispositif cognitif focalisant. Cet auteur a avancé que le mécanisme de l’instruction est d’augmenter la saillance des formes de la langue cible pour qu’elles soient plus facilement remarquées par l’apprenant. Cette fonction de l’instruction explicite est aussi proposée par Mathews et al. (1989 cités par Schmidt, 1994), pour qui elle consiste à diriger et focaliser l’attention des sujets, en stimulant le processus implicite.
Lightbown (1985 cité par R. Ellis, 1994) attribue aussi un rôle annexe aux connaissances de règles mais leur intervention a lieu après la formation de connaissances implicites. Selon cet auteur, leur contribution au développement de l’interlangue est indirecte, en servant de fixateur de connaissances implicites.
Cette position secondaire attribuée à la connaissance de règles est d’ailleurs représentée dans le modèle de l’apprentissage formel de R. Ellis, où ce type de connaissances, notamment quand elles ne correspondent pas au niveau de développement de l’apprenant, interviennent indirectement, non seulement dans le processus d’acquisition de connaissances implicites, surtout dans l’étape de noticing et de comparaison, en produisant un impact différé plutôt qu’immédiat sur l’interlangue de l’apprenant, mais aussi dans le processus de production, toujours fondé sur les connaissances implicites.
Certains pensent que les connaissances de règles interviennent dans le processus de production mais leur attribuent un rôle limité, comme celui de monitor (Krashen, Dakowska) dont la fonction consiste à vérifier l’exactitude des énoncés, avant ou après la production. Pour Krashen (1981), le monitor intervient seulement quand certaines conditions sont remplies : la connaissance de la règle, l’attention portée à la forme et au temps. Dakowska (1993) relève d’autres conditions : le type de tâche comme résolution de problème et la pression temporelle. Le décalage entre les connaissances métalinguistiques et la production s’explique ainsi, dans cette position, par le lien non direct de ces connaissances à la production, lui-même basé sur le rôle certes important mais secondaire de telles connaissances dans le processus d’apprentissage et leur rôle limité dans la production.
4.4.4. Troisième explication du décalage : l’explication cognitive
La troisième explication du décalage est issue de la psychologie cognitive. Cette discipline nous fournit deux éléments de réponse : la formulation des connaissances métalinguistiques et l’utilisation automatique de ces connaissances. Les propositions en ces termes intègrent les deux types d’explications précédents (en termes de statut psychologique des règles et du décalage) et résolvent les problèmes du pourquoi.
A. Formulation des connaissances métalinguistiques
L’une des explications du décalage entre la possession des connaissances métalinguistiques et leur utilisation dans la production concerne la formulation de ces connaissances. Du point de vue de la formulation, les connaissances métalinguistiques, comprises comme connaissances déclaratives formulées sous forme de propositions[99], sont inaptes à être utilisées telles quelles[100]. En effet, Richard (1990) dit que les connaissances déclaratives ne sont pas liées à une utilisation particulière mais peuvent servir à différentes activités comme comprendre, réaliser, et faire des inférences. Bresson (1991 cité par Trévise 1996 : 28-29) avait noté ce problème de formulation des règles de la langue cible données en classe : l’enseignement se fait sur le mode déclaratif, alors que le but est de produire « la parole de manière procédurale ».
La formulation non appropriée des connaissances métalinguistiques par rapport à son emploi est également notée par Dakowska (1993). Selon cet auteur, il est impossible à l’apprenant de consulter des informations stockées sur le mode déclaratif dans une tâche communicative complexe avec une fluidité naturelle, car de telles informations ne peuvent pas fonctionner comme un algorithme pour la production. Quelques règles contiennent de plus des informations trop abstraites pour être pertinentes.
Bange (1999) avance également que pour que les règles de grammaires enseignées en classe se manifestent comme performance chez l’apprenant, il faut que ces règles descriptives et établies par un observateur externe deviennent d’abord des règles internes, règles de production de l’apprenant. Or ces règles restent à élaborer.
L’élément de réponse que nous fournit la psychologie cognitive concerne donc ce qui sous-tend l’exécution d’une action, qui ne sont pas les connaissances déclaratives, mais les connaissances procédurales. Comme le dit Richard (1990), les connaissances procédurales sont constituées d’une part, de la condition d’utilisation d’une action et d’autre part, de l’action à effectuer, ce qui donne lieu à une formule telle que ‘If X, then Y’ (Levelt, 1991), utilisée notamment dans la programmation informatique[101].
Le décalage observé entre les connaissances métalinguistiques et leur utilisation s’explique ainsi d’abord par la non-acquisition de connaissances procédurales, les conditions d’action et l’action à effectuer[102]. Pour Richard et al., la recherche de ces connaissances de procédures à partir des connaissances déclaratives, consistant à les traduire en des actions concrètes, demande un travail approfondi. Le problème dans une classe de langue étrangère est le manque de ces connaissances procédurales, et son élaboration, qui peut être coûteuse incombe ainsi à l’apprenant seul. Le plus souvent, l’apprenant doit trouver les conditions d’application d’une forme, et quelquefois il doit chercher la forme également[103].
Les travaux en psychologie cognitive nous montrent que les instructions verbales censées fournir des règles d’action n’entraînent pas immédiatement les actions correctes et efficaces : que ce soit pour une procédure particulière (ex. mode d’emploi d’un appareil ou du montage des pièces) ou pour une procédure générale (celle utilisée par ex. en mathématiques et en informatique), la conversion de la règle verbale en procédure fait intervenir le processus de compréhension dans lequel l’apprenant doit préalablement constituer une connaissance déclarative de l’instruction ou d’autres connaissances additionnelles qui ne sont pas explicitées dans l’énoncé de la règle. De plus, les instructions peuvent être formulées en terme de règles de fonctionnement d’un dispositif, au lieu de règles d’utilisation. Dans ce cas, ces dernières doivent non seulement être déduites des premières, mais il peut également se produire des problèmes lors de l’interprétation de l’énoncé conditionnel selon lequel les règles de fonctionnement sont formulées. L’expérimentation de Bourguignon et de Candelier (1984) sur l’acquisition d’une langue étrangère par des élèves français (5e, 4e, et 3e) montrent bien que pour pouvoir appliquer une règle, il ne suffit pas de la connaître, mais qu’il faut également acquérir les procédures de son utilisation.
B. Automatisation de l’exécution des procédures
Le deuxième élément d’explication concerne l’automatisation de l’exécution des procédures, comme le mentionne Dakowska (1993). L’utilisation rapide et spontanée de procédures, comme le demandent les conditions en temps réel, nécessite un processus d’automatisation. Deux opérations font l’objet de cette automatisation : l’accès aux connaissances procédurales stockées dans la mémoire et la mise en œuvre de ces procédures. La psychologie cognitive montre que la rapidité d’accès augmente avec la fréquence d’utilisation et de réussite de l’action. Au début, l’accès aux connaissances nécessaires et la mise en œuvre des procédures sont des processus contrôlés, qui demandent du temps. L’utilisation réussie et répétée des mêmes connaissances conduit à un accès et au contrôle de plus en plus rapide, et à terme, automatique.
Tant que l’accès aux connaissances procédurales et leur exécution reste une activité contrôlée, elle occupe une partie importante de la charge cognitive. Dans une interaction réelle, de nombreux aspects (par exemple, déroulement et maintien de la conversation) demandent une attention qui augmente encore la charge cognitive. Du fait de cette capacité limitée de traitement, tant que la mise en œuvre des procédures n’est pas automatisée, les connaissances métalinguistiques des apprenants ne sont pas toutes utilisées en temps réel. Pour McLaughlin, Rossman et McLeod (1983), ceci explique partiellement le phénomène de décalage qu’on observe fréquemment chez des apprenants adultes d’une langue étrangère : un bon nombre d’entre eux peuvent produire parfaitement des mots, des phrases en langue étrangère dans la classe, mais n’utilisent pas leurs connaissances devant un natif de la langue cible. L’automatisation de l’exécution de procédures dépendant de la multiplication de la pratique dans les conditions réelles de production, elle relève plutôt de l’environnement ou des stratégies individuelles que de l’activité cognitive.
5. Conclusion
Les modèles d’apprentissage d’une langue étrangère d’approche cognitive symbolique sont centrés sur les activités cognitives de l’apprenant, notamment sur le traitement des informations linguistiques. Le processus d’apprentissage est décrit en terme d’une évolution qui se développe en général de l’état contrôlé à l’état automatique, liés respectivement à la mémoire à court terme et à la mémoire à long terme. Mais dans le processus d’apprentissage, le mouvement inverse d’explicitation nécessite essentiellement un traitement contrôlé (cf. Bialystok). Ces processus contrôlés et automatiques peuvent porter, d’une part, sur la construction et la restructuration des connaissances de la langue cible, et d’autre part, sur l’accès à ces connaissances et sur leur mise en œuvre dans des conditions réelles de communication. Cette modélisation du traitement de l’information symbolique décrit les deux modes d’apprentissage (explicite, implicite) aussi bien dans l’explicitation que dans l’automatisation des connaissances. Par contre, le modèle connexionniste ne semble pouvoir décrire que l’apprentissage implicite, processus d’apprentissage sans prise de conscience et sans induction consciente.
Les modèles d’apprentissage d’une langue étrangère d’approche cognitive (symbolique) ne sont pas fondamentalement différents des modèles systémiques dans le sens où les deux approches mettent l’accent sur le traitement cognitif de l’apprenant. Seulement, dans l’approche systémique centrée sur l’interaction avec l’environnement, le processus est décrit dans une perspective linéaire, à la fois synchronique (de l’intake à l’output dans un laps de temps court) et diachronique montrant l’itinéraire dans le temps d’un élément linguistique capté jusqu’à son intégration finale dans le système de connaissances et jusqu’à son utilisation en production. Dans l’approche cognitive, ce sont les contraintes du système cognitif de l’être humain et son mode de fonctionnement qui offrent des éléments de description du processus d’apprentissage en terme de modification des traitements.
Les connaissances explicites et implicites, distinction utilisée dans les modèles systémiques, ne recoupent pas les connaissances déclaratives et procédurales, mais ne sont pas non plus incompatibles avec celles-ci. Dans les modèles d’approche cognitive, l’activité métalinguistique intervient lors du traitement contrôlé, notamment, a) lorsque l’apprenant porte une attention focalisée sur un élément de l’input (correspondant à l’instance d’intake) ; b) lorsque l’apprenant tente de découvrir ou d’induire des connaissances de type déclaratif (concepts, propriétés, relations) pour les intégrer ; et c) lorsque l’apprenant cherche les conditions d’utilisation d’une forme et la forme à employer, et qu’il essaie de mettre en œuvre en temps réel ces connaissances procédurales (correspondant à l’instance d’output).
L’apport des modèles d’approche cognitive réside dans l’introduction des notions de connaissances procédurales et de procéduralisation, ainsi que d’automatisation de mise en œuvre de ces procédures. Ces notions permettent d’identifier les différentes étapes du processus laborieux d’opérationnalisation des connaissances acquises chez l’apprenant et de mieux rendre compte de certains phénomènes comme le décalage entre la possession de connaissances et leur apparente non-utilisation.
Accueil | Articles | Equipes | Thèse | CV | Perso | Liens |