Langues romanes

Un article de Wikipédia, l'encyclopédie libre.
Ceci est une version archivée de cette page, en date du 13 janvier 2015 à 17:31 et modifiée en dernier par Jules* (discuter | contributions). Elle peut contenir des erreurs, des inexactitudes ou des contenus vandalisés non présents dans la version actuelle.

Langues romanes
Région jusqu'au XVe siècle : Péninsule Ibérique, France, Suisse, Italie, Balkans, actuelles Roumanie et Moldavie ; expansion mondiale par la suite
Classification par famille
Codes de langue
IETF roa
ISO 639-2 roa
ISO 639-5 roa
Linguasphere 51

On nomme langues romanes[1] les langues issues du latin vulgaire, c'est-à-dire la forme de latin véhiculaire utilisée pour la communication de tous les jours.

Pays européens où une ou plusieurs langues romanes sont officielles.

Ces langues ont été parlées ou le sont encore dans un ensemble géographique désigné par le terme de Romania[réf. souhaitée], désignant le Nord-Ouest européen de l'ancien Empire romain d'Occident et l'Empire Romain d'Orient, où les Valaques parlaient une forme de latin vulgaire (mais où la langue grecque est rapidement devenue officielle en Europe et en Anatolie, tandis que la Syrie, la Palestine et l'Égypte sont passées à l'arabe après la conquête musulmane). Les mots roman(e) et Romania remontent bien sûr à des dérivés de l'adjectif latin romanus : l'on considérait en effet que leurs locuteurs utilisaient une langue issue de celle des Romains, par opposition à d'autres introduites ultérieurement dans les territoires de l'Empire, comme le francique au nord de la France, langue des Francs appartenant à la famille des langues germaniques. La première attestation du terme roman remonte au concile de Tours (813). C'est lors de ce concile – l'un des cinq réunis cette même année à l'initiative de Charlemagne – qu'une distinction fut faite entre une langue de type roman et une langue germanique (qualifiée de tudesque). Il s'agissait d'une forme évoluée de l'une des langues gallo-romanes, ancêtre des langues actuelles parlées sur le territoire français et nommée rustica romana lingua, ou encore roman. Ce texte, encore largement latinisé, est, dans l'état actuel des connaissances, la première source écrite romane attestée.

Classification des langues romanes[réf. souhaitée]

Le premier ouvrage mentionnant plusieurs langues romanes est le De Vulgari Eloquentia (« De l'éloquence vulgaire ») de Dante (XIIIe siècle), où l'on trouve les dénominations de langue d'oïl, langue d'oc et de langue de si. Il s'agit pour Dante de proposer, pour remplacer le latin comme langue littéraire, l'une de ces trois langues, la langue d'oïl des chansons de geste, la langue d'oc des troubadours, ou un parler local, le toscan florentin, qui sera finalement à l'origine de l'italien littéraire[2].

On date grosso modo l'évolution du latin vulgaire vers les langues romanes de la manière suivante[3] :

  1. entre -200 et 400 environ : différentes formes de latin vulgaire ;
  2. entre 500 et 600 : ces formes commencent à se différencier plus ou moins nettement ;
  3. En 813, au concile de Tours, l'existence d'une langue romane est reconnue, puisque le concile demande que désormais les sermons soient prononcés en « rusticam Romanam linguam » (langue romane rurale) et non plus en latin afin d'être compris par tous.
  4. Après 842 : premier texte complet rédigé dans une langue romane (sans doute le prémices de la langue d'oïl), les Serments de Strasbourg.

Les langues romanes partagent un ensemble de traits communs donnant une bonne cohérence à cette famille de langues, parmi lesquels les plus importants sont :

Les langues romanes sont habituellement groupées en :
Les aires romanes occidentales et orientales séparées par la ligne Spezia–Rimini[réf. souhaitée]

Liste des langues romanes

Les langues romanes sont classées en plusieurs groupes, chacun pouvant comprendre plusieurs « dialectes » ; le choix d'un de ces dialectes comme langue officielle est purement politique et, surtout, relativement récent dans de nombreux pays (sauf en France, par l'édit de Villers-Cotterêts). Quoi qu'il en soit, les langues romanes forment un continuum de langues entre lesquelles les différences sont parfois minimes ; il est toujours possible de distinguer au sein d'un ensemble ce que l'on nommera un ou plusieurs « dialectes ». La liste suivante présente entre parenthèses : nom dans la langue envisagée, date de la première attestation connue.

Classification des langues romanes.[réf. souhaitée]

Exemples

Les similarités lexicales et grammaticales des langues romanes, ainsi qu'entre le latin et chacune d'entre elles, peuvent être mises en évidence à l'aide des exemples suivants :

Latin (Illa) claudit semper fenestram antequam cenat.
Aragonais Ella tranca siempre la finestra antes de cenar.
Aroumain Ea încljidi totna firida ninti di a tsina.
Asturien Ella pieslla siempre la ventana/feniestra primero de cenar.
Bergamasque (Lombard de l'Est) (Lé) la sèra sèmper sö la finèstra prima de senà.
Bourbonnais Alle farme terjou la croisée devant de souper.
Bourguignon-morvandiau All farme tôjor lai fenétre aivan de dîgnai.
Catalan (Ella) tanca sempre la finestra abans de sopar.
Corse (Ella) chjode sempre u purtellu nanzu di cenà.
Émilien (Lē) la sèra sèmpar sù la fnèstra prima ad snàr.
Espagnol (Ella) siempre cierra la ventana antes de cenar.
Estrémègne Ella afecha siempri la ventana endantis e recenal.
Français Elle ferme toujours la fenêtre avant de dîner/souper.
Franc-comtois Lèe çhioûe toûedge lai f'nétre d'vaïnt loù dénaie.
Francoprovençal valaisan (Ye) hlou totin a fenetre deant que de cena.
Frioulan Jê e siare simpri la feneste prime di cenâ.
Gallo Ol terjou la couésée avant qe de hamer.
Galicien (Ela) pecha sempre a xanela antes de cear.
Guadeloupéen I toujou ka fenmé finèt-la avan i manjé.
Haïtien Li toujou fèmen fenèt la avan li manje.
Italien (Lei) chiude sempre la finestra prima di cenare.
Judéo-espagnol Eya serra syempre la ventana antes de senar.
Léonais Eilla pecha siempres la ventana primeiru de cenare.
Ligurien (Le) a saera sempre u barcun primma de cenà.
Martiniquais I toujou fèmen fénet-la avan i manjé.
Mauricien Li touzour ferm la fenet avan li manze.
Milanais (Lombard de l'Ouest) (Lee) la sara semper su la finestra primma de disnà.
Mirandais Eilha cerra siempre la bentana/jinela atrás de jantar.
Napolitain Chella chiude sempe 'a fenesta primma 'e mangià.
Normand Ol froume tréjouos al crouésie dévaunt ké dînaer.
Occitan Barra totjorn la fenèstra (la croseia) abans de sopar.
Perciscain[réf. souhaitée] (Ena) cerovâ suempre la velustra atratès dî cedar.
Picard Ale frunme tojours l’creusèe édvint éd souper.
Piémontais Chila a sara sèmper la fnestra dnans ëd fé sin-a.
Portugais (Ela) fecha sempre a janela antes de jantar.
Romanche Ella clauda/serra adina la fanestra avant ch'ella tschainia.
Romanesco (Quella) chiude sempre 'a finestra prima de magnà.
Roumain Ea închide totdeauna fereastra înainte de a cina.
Sarde meridional Issa serrat sempri sa ventana innantis de cenai.
Sarde septentrional Issa serrat semper sa bentana antes de chenare.
Sassarais Edda sarra sempri lu balchoni primma di zinà.
Sicilien Idda chiudi sempri 'a finestra avanti ca pistìa.
Vénitien Ela la sera sempre la fenestra prima de cenar.
Wallon Ele sere todi li finiesse divant di soper.

Groupe gallo-roman

Pour connaître les détails de la composition de ce groupe, voir l'article gallo-roman.

  1. Langue(s) d'oïl (842) : peut-être les Serments de Strasbourg qui sont dans une langue romane composite). On trouve dans cette famille de nombreux dialectes appartenant au groupe des langues d'oïl. Une vision plus traditionnelle de la linguistique romane considère que le français (au sens large) et la langue d'oïl (au singulier) désignent une seule et même langue qui correspond principalement à un ensemble de traits d'oïl provenant de divers dialectes répartis historiquement autour de Paris (dans les faits, la langue française actuelle est très composite et doit beaucoup à une langue littéraire interrégionale). Une autre vision considère au contraire que les langues d'oïl (au pluriel) sont un groupe de langues et que le français (au sens restreint) n'est que l'une de ces langues (venue du francien), parmi d'autres.
  2. Francoprovençal (XIIIe siècle : Méditations de Marguerite d'Oingt) : langue répartie entre l'Italie (Val d'Aoste, Piémont), la SuisseFribourg et en Valais principalement), la France (Dauphinois, Lyonnais, Savoie) ; le francoprovençal semble être à la croisée entre langues d'oïl et occitan mais il possède aussi des traits propres. Il est menacé d'extinction mais est défendu, notamment dans le Val d'Aoste.
  3. L'occitan est tantôt compris dans ce groupe, tantôt inclus dans le groupe occitano-roman.

Groupe occitano-roman

occitan

Carte dialectale de l'occitan.

L'occitan ou langue d'oc (en occitan occitan, lenga d'òc ; premier texte peut-être en 842 : les Serments de Strasbourg dans une langue romane composite ; IXe siècle : traces de vulgarismes occitans dans des textes latins ; fin du Xe siècle : documents juridiques ; 1102 : premier texte complet) est constitué de différents dialectes :

L'occitan, sous le nom de limousin ou de provençal à l'époque, a été la langue utilisée dans la littérature et les poésies des troubadours de toute l'Europe. Il a ensuite connu deux renaissances littéraires, l'une avec le Félibrige et Frédéric Mistral au milieu du XIXe siècle, l'autre avec l'occitanisme dans la seconde moitié du XXe siècle.

catalan

Carte dialectale du catalan.

Le catalan (català ; fin du IXe siècle), très proche de l'occitan, est généralement rattaché au même groupe. Celui-ci, très compact[6], est, selon le linguiste Pierre Bec, intermédiaire entre le groupe gallo-roman incluant l’occitan, le français, le francoprovençal et le romanche, et le groupe ibéro-roman incluant l'aragonais, le castillan ("espagnol"), l'asturo-léonais, le galicien et le portugais (ensemble galaïco-portugais)); mais il possède aussi des caractères propres. Certains linguistes considèrent l'occitan et le catalan comme une seule langue (autrement dit des éléments d'un même diasystème)[6], dont le catalan serait issu "par élaboration"[7].

Des traces de vulgarismes catalans ont été conservées dans des textes latins ; entre 1080 et 1095, les Homilies d'Organyà, l'un des documents littéraires les plus anciens du catalan ; fin du XIIe siècle : premier texte complet dans un document juridique ; XIIIe siècle : sous l'égide de Ramon Llull, le catalan accède au statut de langue littéraire et de pensée reconnue) : l'une des langues officielles de la Catalogne (Espagne) ; il est parlé principalement dans cette Communauté autonome et dans une frange de l'Aragon, ainsi que dans celle méridionale de Valence (où il est aussi appelé valencien), ainsi qu'aux Îles Baléares, en Andorre (où il est la seule langue officielle), dans le Roussillon (France), connu en catalan sous le nom de Catalogne Nord (Catalunya Nord), ainsi que dans la ville de l'Alguer (en Sardaigne). L'usage du catalan a été sévèrement contrôlé et réprimé durant plusieurs périodes, notamment sous le regne de Philippe V et le franquisme.

Groupe ibéro-roman

Ce groupe inclut parfois le catalan.

  • L'aragonais (aragonés) est parlé dans certaines zones de l'Aragon, sans reconnaissance officielle. L'aragonais est de plus en plus vu comme un pont entre l'occitano-roman et l'ibero-roman puisque cette langue a une tradition littéraire très ancienne, indépendante de l'espagnol, avec quelques caractéristiques originales et d'autres partagées avec le catalan et l'occitan [8],[9]. Le même terme est utilisé pour se référer au dialecte « castillanisant » parlé aussi dans cette région. L'aragonais est parfois considéré comme intermédiaire entre l'occitano-catalan et l'ibéro-roman stricto sensu [réf. nécessaire].
  • L'asturien (asturianu en asturien, connu sous les noms d'asturo-léonais, astur-léonais ou bable), est parlé aux Asturies, ainsi que dans certaines parties des provinces de León, Zamora et Salamanque (où on l'appelle le léonais). Par le passé l'asturo-léonais était la langue d'un territoire beaucoup plus important s'étendant au sud de la péninsule Ibérique. Aux Asturies, bien que non reconnu comme langue coofficielle par le statut de la principauté, il est protégé par des textes de loi. Dans la région portugaise de Miranda do Douro, on parle le mirandais, variante de l'asturien ; le mirandais possède le statut de seconde langue officielle du Portugal depuis 1999 pour la partie du territoire où elle est parlée.
  • L'espagnol ou castillan (castellano ou español) : langue officielle en Espagne, dans vingt et un pays d'Amérique latine[10] et en Guinée équatoriale.
  • Le galaïco-portugais est la langue mère écrite du portugais et du galicien. C'est la langue littéraire de toute la côte ouest de la péninsule ibérique jusqu'au XIIe siècle et début du XIVe siècle, période au cours de laquelle le portugais s'est différencié du galicien[11]. Langue de culture pendant sept siècles, y compris en dehors de la Galice et du Portugal ; ainsi le roi de Castille Alphonse X le Sage aurait rédigé, ses Cantigas de Santa Maria dans cette langue. Langue de troubadours elle compte des poètes illustres, tel Martin Codax, Bernal de Bonaval, Arias Nunes, etc.

Groupe italo-roman

Carte des Langues italo-romanes[12],[13],[14],[15]

Italien (italiano ; Xe siècle : documents juridiques ; XIe siècle : texte complet) ; très nombreux dialectes (plus de deux cents). On distingue deux groupes clairement différenciés, séparés par un grand faisceau d'isoglosses, la ligne Massa-Senigallia (dite de manière moins exacte « ligne La Spezia-Rimini »), qui correspond à la coupure des langues romanes en deux grands groupes : la Romania occidentale (incluant l'italien septentrional) et la Romania orientale (incluant l'italien centro-méridional et de l'extrême-sud)[16]. Cette séparation nette entre Romania occidentale et orientale remet en cause la pertinence de ce groupement, qui n'est plus liée qu'à l'appartenance à un même ensemble politique, récemment unifié, l'Italie.

  1. Italien septentrional (ou plus récemment padan, terme proposé par le linguiste Geoffrey Hull depuis 1982[17],[18]), parfois nord-italien[19], groupe de dialectes parlés dans le nord mais aussi dans le sud de l'Italie :
  2. Italien centro-méridional :
  3. Italien de l'extrême-sud :
    • Sicilien de Sicile, ancré sur l'île aux trois pointes et divisé en une multitude de dialectes et de sous-dialectes régionaux voire communaux. Pour exemple, le parler d'Agrigente est un sous-dialecte du sicilien occidental, lui-même un dialecte du sicilien de Sicile.
    • Calabrais centro-méridional, parlé en Calabre citérieure et lui aussi divisé en plusieurs dialectes.
    • Salentin usité dans la région du Salento, dans le sud des Pouilles. Les dialectes apuliens à transition salentine sont parlés, quant à eux, dans les parties méridionales des provinces de Brindisi et de Tarente.

Cette dialectologie est toutefois sommaire et ne décrit pas avec précision l'extraordinaire diversité, largement conservée, des parlers italiens à proprement parler.

Groupe sarde

La carte des langues de Sardaigne.

Sarde (sardu, limba sarda ; XIe siècle) : parlé en Sardaigne ; c'est une des langues romanes des plus conservatrices, ce que l'on explique par sa situation insulaire[21] ; il a néanmoins connu de nombreuses influences, parmi lesquelles celles du catalan, du castillan puis de l'italien sont les plus importantes ; on distingue plusieurs dialectes, dont les principaux sont[22] :

  • campidanien (région de Cagliari),
  • logudorien (Logudoro), qui constitue la langue considérée classique, dont la variété du nuorais (Nuoro) ; ces deux derniers dialectes sont plus archaïsants que le premier.
  • une tentative de normalisation d'une langue sarde unifiée (LSU) est appuyée par la région autonome.

Groupe rhéto-roman

Ce groupe est intermédiaire entre l'italo-roman et le gallo-roman (à l'instar de l'italien septentrional).[réf. nécessaire]

  • romanche (rumantsch) : le sursilvan (haute vallée du Rhin), le sutsilvan et le surmiran (centre du canton des Grisons), le puter et le vallader (Engadine) forment les cinq dialectes écrits ; ils sont parlés en Suisse (dans les Grisons) par environ 45 000 personnes. Le premier texte en puter a été écrit en 1527 à Zuoz (La chanzun da la guerra dal chasté da Müsch), le premier en vallader en 1560 à Susch. Le rumantsch grischun est la variété standard du romanche utilisée en Suisse pour unifier les cinq groupes dialectaux ; il s'appuie en grande partie sur le sursilvan, le vallader et le surmiran ; c'est une des 4 langues nationales de Suisse et une langue officielle dans le canton des Grisons.
  • ladin occidental (ladin) : utilisé dans les Dolomites italiennes (dans la Région Autonome du Trentin-Haut-Adige et en Vénétie, province de Belluno, vers Cortina d'Ampezzo et dans le Cadore, ainsi que dans un ilôt linguistique très minoritaire à Erto e Casso, dans les Dolomites frioulanes, province de Pordenone, en Région Autonome du Frioul-Vénétie Julienne).
  • frioulan ou ladin oriental (furlan) : parlé dans les 3 provinces italiennes d'Udine, de Pordenone et de Gorizia, et très minoritairement dans celle de Trieste, dans la Région Autonome du Frioul-Vénétie Julienne, et aussi à Sappada et à Portogruaro, en Vénétie. Deuxième langue minoritaire en Italie, il serait parlé par un million de personnes dans le monde, à la suite de la forte émigration dans d'autres régions d'Italie et à l'étranger aux XIXe et XXe siècles.

Frioulan et ladin n'ont qu'un statut de langue régionale, mais sont reconnus par la Constitution italienne. Certains linguistes, minoritaires, y rattachent l'istrien ou istro-roumain. Toutes ces langues, morcelées en de multiples dialectes, sont en régression constante.

Groupe illyro-roman

Ce groupe également dit istro-dalmate est parfois inclus dans un Diasystème roman de l'Est avec les langues romanes orientales. Il présente des caractères intermédiaires entre le groupe rhéto-roman et le groupe roman oriental.

Connu au Moyen Âge (fin XIIIe siècle) sous les noms de mavro-valaque ou morlaque, attesté directement vers 1840, le dalmate est éteint. Parlé autrefois dans les îles et les régions côtières de Croatie et du Monténégro, il comprenait deux dialectes recensés : le végliote (veklisuṅ, au nord, dans l'île de Krk ou Veglia), dont le dernier locuteur s'est éteint en 1898) et le ragusain (au sud, dans l'actuelle Dubrovnik, éteint dès le XVe siècle).

Groupe roman oriental

Carte des langues romanes orientales.

Ce groupe, également appelé Diasystème roman de l'Est, Ensemble roman oriental (ERO) ou langues romanes orientales, comprend quatre langues vivantes et trois éteintes :

  • le daco-roumain ou daco-roman nommé officiellement roumain en Roumanie (română, limba română) et au choix moldave ou roumain en Moldavie (limba moldovenească selon l'article 13 de la Constitution adoptée en 1992, limba română selon l'arrêt n° 36 du 05.12.2013 de la Cour constitutionnelle) ; partiellement attesté au XIIe siècle, complètement attesté au XVe siècle, le roumain est la langue de l'ancienne province romaine de Dacie coupée du reste de la Romania ; le superstrat slave y est important et en tant que langue romane le roumain s'avère assez conservateur ; c'est en cela qu'il est relativement différent des autres langues romanes et dissymétrique par rapport à elles (il est beaucoup plus facile à un roumanophone de comprendre l'italien ou le français, que l'inverse) ; il est langue coofficielle en Voïvodine serbe, mais est également parlé en Serbie (Portes de Fer et vallée du Timoc). Des minorités roumanophones vivent également en Ukraine, et une importante diaspora vit depuis les années 2000-2005 en Espagne et en Italie.
  • l'aroumain ou aroman, appelé macédo-roumain en Roumanie, parlé principalement en Grèce septentrionale, en Albanie, en Serbie, en Macédoine et en Roumanie.
  • le mégléno-roumain ou mégléno-roman, ou mégléniote, jadis parlé en Macédoine et aujourd'hui par la diaspora, en Roumanie ou en Turquie.
  • l'istro-roumain ou istro-roman ou istrien, encore parlé par quelques dizaines ou peut-être centaines de locuteurs en Istrie orientale, en Croatie.

Ces quatre langues vivantes sont issues de l'évolution de trois langues éteintes :

En aroumain et en méglénite, le superstrat slave est moins fort qu'en roumain et istrien, alors que l'influence du grec et de l'albanais est prépondérante. Certains linguistes incluent également dans ce groupe l'illyro-roman ou dalmate, éteint au XIXe siècle.

Classification cladistique

Une classification différente basée sur le vocabulaire permet une comparaison systématique (Projet ASJP). On mesure la similarité lexicale telle que la distance de Levenshtein pour une liste de mots apparentés. Dans ce cas les langues regroupées sous l'appellation gallo-romane par Ethnologue.com[23] apparaissent dans des branches différentes de l'arbre cladistique des langues romanes[24] :





créoles à base romanes



français





francoprovençal





divers créoles à base romane







aragonais



galicien





judéo-espagnol



castillan (espagnol)





divers créoles à base romane






romanche (sursilvan)





divers créoles à base romane



portugais







catalan



frioulan







italien



sicilien





roumain



aroumain










Ce qui précède indique que d'un point de vue lexical, français et franco-provençal, constituent l'une des branches les plus dissemblables des langues romanes. Cela est dû à la forte incidence de la phonologie et du lexique en contact avec les langues germaniques au cours du Bas Empire romain et le début du Moyen Âge.

Peut-être encore plus étonnant en comparaison avec les classifications conventionnelles (historiquement fortement basées sur la géographie, voire influencées la division politique, au-delà des traits proprement linguistiques), l'occitan et le catalan, et même le portugais, sont plus à rapprocher du point de vue du lexique de l'italien et du roumain que des langues ibériques (castillan, galicien, aragonais).

Du latin classique au latin vulgaire

Quelques modifications phonétiques propres au latin vulgaire

Note : les transcriptions phonétiques sont en alphabet phonétique international.

À propos du latin vulgaire, il convient de noter que les Romains, comme les Grecs, vivaient en situation de diglossie : la langue de tous les jours n'était pas le latin classique (celui des textes littéraires ou sermo urbanus, « langue de la ville », c'est-à-dire une langue figée par la grammaire comme l'a été le sanskrit), mais une forme distincte bien que très proche, au développement plus libre (le sermo plebeius, « langue vulgaire »). Il semble acquis que le latin classique ne se limitait pas à un emploi livresque, mais qu'il était couramment parlé par les catégories sociales élevées, bien que ces dernières aient trouvé plus raffiné encore de s'exprimer en grec (et il semble que César n'ait pas dit à Brutus Tu quoque, fili mais Kaì sù, téknon), tandis que le sermo plebeius était la langue des soldats, des commerçants, du petit peuple ; n'ayant jamais accédé au statut de langue littéraire, le latin vulgaire nous est surtout connu par la linguistique historique, des citations et des critiques prononcées par les tenants d'un latin littéraire ainsi que de nombreuses inscriptions, des registres, comptes et autres textes courants. D'autre part, le Satyricon de Pétrone, sorte de « roman » écrit vraisemblablement au Ier siècle et se passant dans les milieux interlopes de la société romaine, est un témoignage important de cette diglossie : selon leur catégorie sociale, les personnages s'y expriment dans une langue plus ou moins proche de l'archétype classique.

Parmi les textes qui ont blâmé les formes jugées décadentes et fautives, il faut retenir l’Appendix Probi[25], sorte de compilation d'« erreurs » fréquentes relevées par un certain Probus et datant du IIIe siècle.

Ce sont bien ces formes, et non leur équivalent en latin classique, qui sont à l'origine des mots utilisés dans les langues romanes. Voici quelques exemples de « fautes » citées par Probus (selon le modèle A non B, « [dites] A et non B »), classées ici par type d'évolution phonétique et assorties de commentaires permettant de signaler les principales différences phonologiques entre le latin classique et le latin vulgaire ; il n'est bien sûr pas possible d'être exhaustif en la matière et de référencer toutes les différences entre le latin classique et le latin vulgaire, mais l’Appendix Probi peut constituer une introduction pertinente sur le sujet.

Calida non calda

Calida non calda, masculus non masclus, tabula non tabla, oculus non oclus, etc. : ces exemples montrent l'amuïssement des voyelles post-toniques (et aussi prétoniques) brèves ; les mots latins sont en effet accentués cálida, másculus, tábula et óculus, la voyelle suivante étant brève. Cet amuïssement prouve aussi que l'accent de hauteur du latin classique est devenu un accent d'intensité en latin vulgaire (en effet, un accent de hauteur n'a pas d'influence sur les voyelles atones environnantes). L'on reconnaît dans cette liste les ancêtres de chaude (ancien français chalt), mâle (ancien français masle), table et œil ; ce processus a donné naissance à des transformations importantes des consonnes entrées en contact après la chute de la voyelle les séparant : ainsi, un /l/ devant consonne est passé à l vélaire (soit /ɫ/) puis à /u/ en français (vocalisation), d'où chaud ; de même, /kl/ a pu donner un l palatalisé (voir au paragraphe suivant).

Vinea non vinia

Vinea non vinia, solea non solia, lancea non lancia, etc. : l'on voit là le passage en latin vulgaire de /e/ bref devant voyelle à /j/ (son initial de yacht ; le phénomène est nommé consonification) qui, après consonne, la palatalise ; ces consonnes palatalisées (qui peuvent provenir d'autres sources), sont importantes dans l'évolution des langues romanes. Cette transformation explique pourquoi l'on obtient, par exemple, vigne (avec /nj/ devenant /ɲ/, noté dans les langues romanes par le digramme gn en français et italien, ñ en castillan, ny en catalan, nh en portugais et occitan, etc.), seuil (avec anciennement un l palatal, soit /ʎ/, noté par ill/il en français, devenu ensuite un simple /j/, conservé en italien, où il est noté gli et toujours prononcé comme une double consonne, en castillan, où il est noté ll, « double l » [sauf quand il provient de /lj/, où il passe à /x/, phonème dit jota], comme en catalan, en portugais et occitan, écrit lh, etc.), et lance (avec le son /s/ issu de /t͡s/, forme palatalisée de /k/, que notait bien la lettre c latine ; de même en italien lancia /lanʧa/, castillan lanza /lanθa/, anciennement lança /lantsa/, ou en roumain lance /lanʧe/, etc.).

Auris non oricla

Probus note dans cet exemple plusieurs phénomènes : premièrement la réduction des anciennes diphtongues (ici /au/ devenant /ɔ/, soit o ouvert ; l'on a aussi en latin vulgaire /ae/ donnant /ɛ/, e ouvert, ainsi que /oe/ passant à /e/, e fermé), puis l'utilisation d'une forme de diminutif au lieu de la forme simple (auris « oreille », auricula « petite oreille »). L'utilisation des diminutifs en latin vulgaire est fréquente : ainsi soleil vient de solic(u)lu(m) et non de sol, ou encore genou de genuc(u)lu(m) et non de genu. Enfin, on note l'amuïssement du /u/ bref après une voyelle accentuée : on attendrait oricula. Comme on l'a dit au premier paragraphe, la rencontre de c et l, /kl/, causée par la chute de la voyelle les séparant, donne naissance à une nouvelle consonne, ici un l palatal, conservé en catalan dans orella, devenu /j/ en français mais /x/ en castillan, dans oreja /ɔrexa/).

Auctor non autor

On remarque aussi des réductions de groupes de consonnes ; ainsi, /kt/ passe à /t/, donnant en français auteur, ou autor en castillan et catalan ; de même, /pt/ passe à /t/. C'est le cas dans dom(i)tare devenu domtar puis domptar et enfin dontar. L'insertion d'un /p/ entre /m/ et une occlusive est normale : on parle d'une épenthèse, donnant en français dompter que l'on prononçait /dõte/ avant que l'orthographe n'influence la prononciation, devenant parfois /dõpte/. Autre simplification : /pt/ donne /t/, comme dans comp(u)tare devenu comptare puis compter et conter /kõte/ en français, contar en castillan, etc.

Rivus non rius

Rivus non rius, sibilus non sifilus : le son /w/ du latin, noté par la lettre u (ou v dans les éditions modernes) a évolué de manières diverses, soit en s'amuïssant entre voyelles (ri(v)us donnant rio en castillan, pa(v)or donnant peur, italien paura), en devenant une spirante bilabiale sonore (/β̞/, en castillan et catalan) puis se renforçant en /v/ (dans la majorité des langues romanes) ; /p/ et /b/ entre voyelles connaissent le même sort, ce qui explique que sibilus donne sifilus, sachant que /f/ n'est que la variante sourde de /v/ ; ainsi explique-t-on siffler (de sibilare, devenant sifilare puis siflare) ou savoir (de sapere, puis sabere, savere ; le castillan saber montre, par son orthographe, qu'il en est resté au stade /β̞/), etc.

Pridem non pride

Dernier exemple, montrant que le /m/ en fin de mots n'est plus prononcé (ce qui est déjà le cas en latin classique : la scansion du vers latin le prouve facilement). Cet amuïssement est, entre autres, à l'origine de la disparition du mécanisme des flexions : les langues romanes, en effet, n'utilisent plus la déclinaison.

Cette liste n'est bien sûr pas exhaustive ; il faudrait aussi aborder la question de la diphtongaison « panromane » (que toutes les langues romanes ont connue) et signaler que nombre de voyelles ont subi par la suite des diphtongaisons secondaires.

Transformations en profondeur du système morpho-syntaxique

Système nominal

La chute du /m/ final, consonne que l'on rencontre souvent dans la flexion, crée donc une ambiguïté : Romam se prononçant comme Roma, l'on ne peut savoir si le mot est au nominatif, à l'accusatif ou à l'ablatif. Ainsi, les langues romanes ont dû utiliser des prépositions pour lever l'ambiguïté. Plutôt que dire Roma sum (classique Romæ sum avec un locatif que n'a pas gardé le latin vulgaire) pour « je suis à Rome » ou Roma(m) eo pour je vais à Rome, il a fallu exprimer ces deux phrases par sum in Roma et eo ad Roma. À cet égard, il convient de rappeler que si en latin classique déjà, dès l'époque impériale, le /m/ en fin de mots s'amuïssait, Roma sum et Roma(m) eo ne pouvaient être confondus : à l'ablatif (Roma sum), le /a/ final est long ; il est cependant bref à l'accusatif : ainsi l'on prononçait /rōmā/ pour le premier, /rōmă/ pour le second. Le latin vulgaire, toutefois, n'utilise plus le système de quantité vocalique : les deux formes sont d'autant plus ambiguës.

Dans un même mouvement, les adverbes et les prépositions simples sont parfois renforcées : ante, « avant », ne suffit plus ; il faut remonter à ab + ante en vulgaire pour expliquer le français avant, le castillan antes et l'occitan avans, ou bien in ante pour le roumain înainte, etc. ; de même avec provient de apud + hoc, dans de de intus, etc. Le cas limite semble être atteint avec le français aujourd'hui, notion qui se disait simplement hodie en latin classique. Le terme français s'analyse en en + le + jour + de + hui, où hui vient de hodie (qui a donné hoy en castillan, oggi en italien, azi en roumain, uèi en occitan, avui en catalan, hoz en romanche, oûy en wallon, etc.). Le composé agglutiné résultant est donc redondant, puisqu'il signifie mot à mot : « au jour d'aujourd'hui » (qu'on trouve en français familier). Certaines langues conservatrices ont cependant gardé des adverbes et prépositions simples : le castillan et l'italien con, le portugais com et le roumain cu viennent bien de cum « avec », de même que en castillan ou în roumain sont hérités de in. L'on constate le même phénomène avec les mots simples hérités de hodie.

De langue flexionnelle à la syntaxe souple (l'ordre des mots comptant moins pour le sens que pour le style et la mise en relief), le latin vulgaire est devenu un ensemble de langues utilisant nombre de prépositions, dans lesquelles l'ordre des mots est fixe. S'il est théoriquement possible de dire en latin Petrus Paulum amat, amat Petrus Paulum, Paulum Petrus amat ou encore amat Paulum Petrus pour signifier que « Pierre aime Paul », ce n'est plus possible dans les langues romanes, qui ont plus ou moins rapidement abandonné les déclinaisons ; ainsi, en castillan Pedro ama a Pablo et Pablo ama a Pedro ont un sens opposé, seul l'ordre des mots indiquant qui est sujet et qui est objet. Lorsque les langues romanes ont gardé un système de déclinaisons, celui-ci est simplifié et se limite à quelques cas (à l'exception du roumain) : c'est ce qui arrive en ancien français, qui n'en possède que deux, le cas sujet (hérité du nominatif) et le cas régime (venant de l'accusatif), pour tout ce qui n'est pas sujet. En français, toujours, le cas sujet a disparu ; les noms actuels hérités de l'ancien français sont donc presque tous d'anciens cas régime (il y a quelques exceptions, comme ancêtre, peintre, traître, anciens cas sujets, et chandeleur, provenant d'un génitif pluriel latin candelorum) et, partant, d'anciens accusatifs ; on peut le constater avec un exemple simple :

Latin classique
Singulier Pluriel
Nominatif murus muri
Accusatif murum muros
Ancien français
Singulier Pluriel
Cas sujet murs mur
Cas régime mur murs
Français
Singulier Pluriel
mur murs

Le roumain, toutefois, conserve un système flexionnel fonctionnant avec trois cas syncrétiques : cas direct (nominatif + accusatif), cas oblique (génitif + datif) et vocatif. Ces cas se distinguent principalement si le nom est marqué par l'article défini. Dans le cas contraire, ils ont tendance à être confondus.

D'autres points méritent d'être signalés. Tout d'abord, à l'exclusion du roumain, les trois genres, masculin, féminin et neutre, sont réduits à deux par l'élimination du neutre. Ainsi le mot latin folia, nominatif/accusatif neutre pluriel de folium « feuille », est réinterprété comme un féminin : c'est le cas, par exemple, en français, où il devient feuille, mais aussi en castillan (hoja), en italien (foglia), en romanche (föglia), en wallon (fouye), en portugais (folha), en catalan (fulla), en occitan (fuèlha), etc., tous mots féminins. De plus les langues romanes ont développé un système d'articles définis inconnu du latin classique. Ainsi, en français, le et la proviennent respectivement des pronoms/adjectifs démonstratifs ille et illa ; l'évolution est la même en castillan pour el et la (plus un neutre lo < illud), en italien pour il et la (ainsi que lo, neutre, < illud), etc. Le roumain se distingue en étant la seule langue romane dans laquelle l'article est enclitique : om « un homme », om-ul « l'homme », ce qui s'explique par le fait qu'en latin, l'adjectif démonstratif pouvait précéder ou suivre le substantif (ille homo/homo ille). Les articles indéfinis, pour leur part, proviennent simplement du numéral unus, una (et unum au neutre). Enfin le système de l'adjectif est modifié. Alors que les degrés de l'adjectif étaient marqués par des suffixes, les langues romanes ne se servent plus que d'un adverbe devant l'adjectif simple. Cet adverbe continue soit magis (devenu más en castillan, mai en occitan et en roumain, mais en portugais, més en catalan, etc.), soit plus (più en italien, plus en français et en occitan, pus en wallon et en catalan ancien ou dialectal, plu en romanche, etc.). Par exemple, plus clair (comparatif de supériorité) se disait en latin classique clarior (dérivé de clarus). En revanche le castillan emploie más claro, l'italien più chiaro, l'occitan plus clar ou mai clar, etc. De même le superlatif le plus clair se disait clarissimus en latin classique, mais el más claro en castillan et il più chiaro en italien. On trouve cependant quelques archaïsmes : le portugais a conservé des mots différents pour le plus grand, o maior, et le plus petit, o menor, comme le castillan avec mayor et menor, comparables, bien que d'emploi très différent, aux majeur et mineur du français.

Système verbal

En outre, les conjugaisons sont profondément modifiées, notamment par la création de temps composés : ainsi notre j'ai chanté, espagnol he cantado ou encore catalan he cantat, occitan ai cantat, roumain am cântat, viennent d'un habeo cantatu(m) vulgaire, qui n'existe pas en latin classique. L'utilisation de verbes auxiliaires, être et avoir, est notable : le latin utilisait déjà, d'une manière différente, être dans sa conjugaison, mais pas d'une manière aussi systématique que dans les langues romanes, qui ont généralisé leur emploi afin de créer un jeu complet de formes composées répondant aux formes simples. Généralement, les formes composées marquent l'aspect accompli.

Un mode nouveau apparaît, le conditionnel (attesté pour la première fois dans une langue romane dans la Séquence de sainte Eulalie), construit à partir de l'infinitif (parfois modifié) suivi des désinences d'imparfait : vivr(e) + -ais donne vivrais en français, et, mutatis mutandis , viviría en castillan, viuria en catalan, viuriá en occitan. Certaines modifications du radical sont à noter : devoir + ais > devrais et non *devoirais, ou bien haber + ía > habría et non *habería. De la même manière, le futur classique est abandonné au profit d'une formation comparable à celle du conditionnel, c'est-à-dire l'infinitif suivi du verbe avoir (ou précédé en sarde) : ainsi cantare habeo (« j'ai à chanter ») donne chanterai, castillan cantaré, catalan cantaré, occitan cantarai, etc.

Le passif est évacué au profit du système composé qui préexistait en latin (cantatur, « il est chanté », classique devient le vulgaire est cantatus, qui, en classique signifiait « il a été chanté »). Enfin, certaines conjugaisons irrégulières (comme celle de velle, « vouloir ») sont rectifiées (mais restent souvent irrégulières dans les langues romanes) et les verbes déponents cessent d'être utilisés.

Le lexique du latin vulgaire

Le latin vulgaire et le latin classique ne diffèrent pas seulement par des aspects phonologiques et phonétiques, mais aussi par le lexique ; les langues romanes, en effet, n'utilisent que dans des proportions variables le vocabulaire classique. Souvent, des termes populaires ont été retenus, évinçant ceux propres à la langue plus soutenue.

Certains termes latins ont disparu et ont été remplacés par leur équivalent populaire ; c'est le cas de celui qui désigne le cheval, equus en latin classique, mais caballus (« canasson » ; le mot est peut-être d'origine gauloise) en latin vulgaire, que l'on retrouve dans toutes les langues romanes : caballo en castillan, cavall en catalan, caval en occitan, cheval en français, cal en roumain, cavallo en italien, dj'vå en wallon, chavagl en romanche, etc. Mais la jument est appelée iapa en roumain, yegua en castillan, égua en portugais, egua en catalan, et èga en occitan, du latin equa (l'occitan emploie aussi cavala).

D'autre part, certains termes classiques disparus n'ont pas forcément été remplacés par le même mot vulgaire dans toute la Romania : le terme soutenu pour « parler » est loqui en latin classique, gardé en roumain (a locui mais avec le sens d'habiter), remplacé par :

  • parabolare (terme emprunté à la liturgie chrétienne et d'origine grecque ; proprement : « parler par parabole ») : français parler, italien parlare, catalan et occitan parlar, etc. ;
  • fabulare (proprement : « affabuler ») : castillan hablar, portugais falar, sarde faedhàre, etc.
  • verba (verbe, parole): roumain a vorbi

Enfin, certaines langues romanes continuent d'utiliser la forme classique, tandis que d'autres, que l'on dit moins « conservatrices », se servent d'une forme vulgaire ; l'exemple donné traditionnellement est celui du verbe « manger » :

  • latin classique edere : se retrouve (sous une forme composée ; cette forme est cependant sentie moins « noble » que le classique puriste edere) en castillan et portugais comer (de comedere) ;
  • latin vulgaire manducare (proprement « mâcher ») : français manger, italien mangiare, catalan menjar, occitan manjar, ou encore roumain mânca, par exemple.

Raisons de la diversité des langues romanes

Géographie des langues romanes en Europe.

L'évolution phonétique naturelle des langues, à laquelle le latin n'a pas échappé, explique en grande partie les différences importantes entre certaines des langues romanes. À ce processus s'est aussi ajouté la non-unicité lexicale de ce que l'on désigne sous le terme de latin vulgaire : la taille de l'Empire romain et l'absence d'une norme littéraire et grammaticale ont permis à cette langue vernaculaire de ne pas être figée. Ainsi, chaque zone de la Romania a utilisé une saveur particulière du latin vulgaire (il vaudrait même mieux dire « des latins vulgaires »), comme on l'a vu plus haut, telle langue préférant tel terme pour signifier « maison » (latin casa en espagnol, catalan, italien, portugais, roumain), telle autre un terme différent (mansio pour le même sens en français), par exemple.

S'est greffée à ces deux données la présence de substrats, langues parlées initialement dans une zone et recouvertes par une autre, ne laissant que des traces éparses, tant lexicales ou grammaticales que phonologiques, dans la langue d'arrivée. Ainsi, le substrat gaulois en français lui laisse quelque cent quatre-vingts mots comme braies, char ou bec, et serait à l'origine du passage du /u/ (de loup) latin à /y/ (de lune). Cette hypothèse ne fait cependant pas l'unanimité. Bien entendu, l'influence du gaulois ne s'est pas limitée à la langue française : les dialectes de l'Italie du Nord, par exemple, en possèdent quelques termes, et on a ainsi en italien standard braghe pour braies (qui a donné plus tard les mots français braguette et bretelle), carro pour char, ou becco pour bec. De même le basque pour les langues ibérico-romanes (où le mot pour « gauche », soit sinistra en latin classique, est remplacé par des dérivés du basque ezker, soient esquerra en catalan, izquierda en castillan et esquerdo en portugais)[26] et en particulier l'espagnol.

Enfin, les superstrats ont aussi joué un rôle prépondérant dans la différenciation des langues romanes : ce sont les langues de peuples s'étant installés dans un territoire sans réussir à imposer leur langue. Cette dernière a cependant laissé des traces importantes. Le superstrat francique (donc germanique) en France est important ; le vocabulaire médiéval en est émaillé, surtout dans le domaine de la guerre et de la vie rurale (ainsi heaume, adouber, flèche, hache, etc., mais aussi framboise, blé, saule, etc., ou encore garder, guerre et, plus surprenant, trop), et le français actuel compte plusieurs centaines de mots ainsi hérités du francique. C'est un superstrat arabe que l'on remarque le plus en castillan et en portugais : plus de quatre mille termes, parmi lesquels des toponymes et des composés, viennent de cette langue. Le trait le plus remarquable est le maintien quasi systématique de l'article arabe dans le mot, alors que les autres langues romanes ayant aussi emprunté le même terme s'en sont souvent débarrassées : ainsi les gloses espagnoles algodón (contre le français coton), de l'arabe أَلْقُطْن, ʾal-quṭn, algarroba (français caroube), de ʾal-harūbah ou encore aduana (français douane), de أَلدِّيوَان, ʾad-dīwān (qui donne aussi divan). Enfin, dernier superstrat remarquable, le slave, dont l'influence en roumain est notable. Le roumain devrait aux langues slaves alentour son vocatif, 20 % de termes du lexique ainsi que des processus de palatalisation différents de ceux des autres langues romanes.

L'influence des langues romanes les unes sur les autres est par ailleurs considérable. À tel point qu'un courant du mouvement interlingua, dit « latin moderne », préconise d'utiliser dès à présent cette langue comprise sans étude (cinquante mots à apprendre sur un vocabulaire basique de cinq mille termes) par tous les locuteurs romans (qui sont environ neuf cents millions dans le monde), après remplacement des mots antiques sans postérité gardés par l'interlingua, modernisation de ses formes lexicales et phonétisation de son orthographe.

On peut donner ici les résultats d'une étude menée par Mario Pei en 1949, qui a comparé le degré d'évolution de diverses langues par rapport à leur langue-mère ; pour les langues romanes les plus importantes, si l'on ne considère que les voyelles toniques, l'on obtient, par rapport au latin, les coefficients d'évolution suivants :

  • sarde : 8 % ;
  • italien : 12 % ;
  • espagnol : 20 % ;
  • roumain : 23,5 % ;
  • occitan : 25 % ;
  • portugais : 31 % ;
  • français : 44 %.

L'on voit ainsi facilement le degré variable de conservatisme des langues romanes, la plus proche du latin phonétiquement (si l'on ne considère que les voyelles toniques) étant le sarde, la plus éloignée le français.

Diffusion mondiale des langues romanes

Diffusion mondiale des langues romanes
français espagnol italien portugais roumain
Nombre de locuteurs de chaque langue romane en tant que pourcentage du total.

Du fait de la colonisation, l'aire géographique des locuteurs de langues romanes s'étend largement au-delà de l'Europe. Les plus largement diffusées sont l'espagnol (Mexique, Amérique centrale et Amérique du Sud, Philippines, etc.), le portugais (Brésil, Angola, Mozambique, etc.) et le français (Canada, Afrique, etc.).

L'espagnol (castillan) et le français figurent parmi les langues officielles de l'ONU.

Les langues romanes parlées par plus de 10 millions de personnes sont l'espagnol, le français, le portugais, l'italien, le roumain et le catalan (98 % des locuteurs).

Il est à noter que l'étendue géographique de l'espagnol, le français et le portugais sont en grande partie le résultat du passé colonial. Dans la plupart des anciennes colonies, le français est la seconde langue, au contraire de l'espagnol et du portugais. Il en résulte que le français est la seconde langue romane en nombre de locuteurs, mais la troisième, derrière le portugais, en locuteurs qui l'ont pour première langue.

Le Catalan est un cas particulier, puis qu'il n'est pas la langue principale d'un état-nation (il l'est seulement en Andorre), mais il a tout-de-même été capable de soutenir la compétence de l'espagnol, et même de gagner des locuteurs, bien que celui-ci soit non seulement la langue de l'état mais aussi l'une des plus importantes du monde. En fait, le catalan est la seule langue minoritaire d'Europe dont la survie à long terme n'est probablement[27] pas en danger. Au contraire de la plupart des langues minoritaires, le catalan n'est pas resté lié à la culture traditionnelle rurale. En effet, la société catalane a été, depuis le Moyen Âge et jusqu'à nos jours, plus dynamique et orientée vers l'Europe et la modernité que celle de Castille, et donc que celle de l'État dominant. D'autre part, une culture de haut niveau, bien qu'ayant abandonné généralement le catalan au XVIIe siècle. ne s'est pas interrompue est a pu reprendre la langue du pays vers la fin du XIXe siècle. En plus, elle a été toujours doublée d'une culture populaire (musique, théâtre, vaudeville, littérature de consommation ou pratique, presse) vivante, qui à suivi l'évolution des temps est s'est toujours produite en catalan. En conséquence, une conscience 'nationale' à survécu a l'union des royaumes, accompagnée du sentiment que la langue est une partie fondamentale de l'identité des catalans[28],[27]. Cela a permis au catalan de résister d'une part aux périodes de répression et aux importants flux immigratoires qui ont eu lieu tout au long de l'histoire, et d'autre part aux processus assimilationnistes qui sont en voie de faire disparaître la plupart des langues minoritaires, même lorsqu'elles ont un fort soutien gouvernemental (par exemple l'irlandais).

Le reste de langues romanes, avec moins de locuteurs, subsistent principalement pour les rapports informels. Historiquement, les gouvernements ont perçu (voire perçoivent encore) la diversité linguistique comme un obstacle au niveau économique, administratif ou militaire, de même qu'une source potentielle de mouvements séparatistes; ils se sont donc généralement efforcés de les combattre, moyennant la promotion de la langue officielle, des restrictions quant à leur utilisation au sein des média, leur caractérisation comme dialectes ou patois (mots devenus péjoratifs), ou même la persécution. En fait, il s'agit plus proprement de langues minorisées que de langues minoritaires. En conséquence, toutes ces langues sont considérées par l'Atlas UNESCO des langues en danger [29] comme menacées en divers degrés allant de « vulnérable » (p.ex. le Sicilien ou le Basque) à « sérieusement en danger » (p.ex. toutes celles parlées en France sauf le Basque et le Catalan).

Dès la fin du XXe siècle, une plus grande sensibilité vers les droits des minorités a permis à ces langues d'amorcer une lente récupération de leur prestige et de leurs droits perdus. Cependant, il n'est pas clair que ces processus politiques soient capables d'invertir le déclin des langues romanes minorisées.

Rang Langue Parlée (Langue maternelle) dans Nombre de locuteurs selon ethnologue.com (2009[réf. obsolète]) Gentilé
1 Espagnol (Castillan) Andorre, Argentine, Belize, Bolivie, Chili, Colombie, Costa Rica, Cuba, Équateur, Espagne, États-Unis (Nouveau-Mexique), Guinée équatoriale, Guatemala, Honduras, Mexique, Nicaragua, Panama, Paraguay, Pérou, Porto Rico, République dominicaine, Salvador, Uruguay, Venezuela 329 millions Hispanophone
2 Français Belgique, Bénin, Burundi, Burkina Faso, Canada, Cameroun, Côte d'Ivoire, Djibouti, France, Gabon, Guinée, Haïti, Italie (dans la région de Vallée d'Aoste), Luxembourg, Madagascar, Maghreb, Monaco, République démocratique du Congo, République centrafricaine, Sénégal, Suisse, Tchad, Togo, Vanuatu. 250 millions (langue première et seconde) Francophone
3 Portugais Portugal, Brésil, Angola, Mozambique, Guinée-Bissau, Guinée équatoriale, Cap-Vert, Sao Tomé-et-Principe, Timor oriental. 240 millions Lusophone
4 Italien ArgentineBuenos Aires), BrésilSanta Teresa et Vila Velha), Italie, France dans le département des Alpes-Maritimes et la Corse, Saint-Marin, Suisse (notamment Tessin et partie des Grisons), Vatican, Érythrée, Éthiopie, Libye, Slovénie, dans les villes de Koper, Izola et Piran, Croatie dans le Comitat d'Istrie et en Dalmatie, Malte, Monténégro sur la côte 61,7 millions Italophone
5 Roumain Roumanie, République de Moldavie, Ukraine, Hongrie, Serbie, Bulgarie 26 millions
6 Catalan Andorre, Espagne, France, Italie 11,5 millions
7 Créole haïtien Haïti 7,4 millions
8 Lombard Italie, Suisse ?
9 Napolitain Italie ?
10 Galicien Espagne 3,2 millions
11 Occitan Espagne, France, Italie, Monaco 2,05 millions
12 Ligure France, Italie, Monaco 1,93 million
13 Sarde Italie 1,5 million
14 Wallon Belgique 1,1 million
15 Frioulan Italie 600 000
16 Corse France, Italie 100 000
17 Aroumain Albanie, Bulgarie, Grèce, République de Macédoine, Roumanie, Serbie 150 000 - 300 000 ?
18 Francoprovençal France, Italie, Suisse 113 000
19 Judéo-espagnol Israël, Turquie 109 000
20 Romanche Suisse 60 000
21 Astur-léonais Espagne, Portugal 55 000
22 Ladin Italie 30 000
23 Llanito Espagne, Royaume-Uni 30 000
24 Mirandais Portugal 15 000
25 Aragonais Espagne 10 000
26 Méglénite Grèce, République de Macédoine, Roumanie, Turquie 10 000 ?
27 Istrien Istrie orientale, en Croatie ? moins d'une centaine

Notes et références

  1. C’est à l’utilisation par Charles de Gerville, dans une lettre adressée à son ami Arcisse de Caumont en 1818, du terme de « roman », pour qualifier ces langues que l’on doit cette expression.
  2. Charles Camproux, Les Langues romanes, PUF, Paris, 1979, ISBN 2-13-035916-7
  3. Michel Banniard, "Délimitation temporelle entre le latin et les langues romanes"', in H. M. GLESSGEN (dir.), Handbuch der Romanische Sprachgeschichte, Berlin/New York, p. 544-555.
  4. Le poitevin-saintongeais est dans la liste des langues de France, langues d'oïl, depuis début 2010, sur le site de la Délégation générale à la langue française et aux langues de France (DGLFLF), service du Ministère de la Culture, sous le libellé suivant : « poitevin-saintongeais [dans ses deux variétés : poitevin et saintongeais] ». Voir site de la DGLFLF : DGLF - Ministère de la Culture
  5. article « Gascon » rédigé par Peter V. Davies, Encyclopedia of the Languages of Europe, éd. Glanville Price, Oxford, 1998, p. 190-191.
  6. a et b Bec Pierre (1995) La Langue occitane, coll. Que sais-je? n° 1059, Paris: Presses Universitaires de France, p. 6.
  7. Domergue Sumien (Université de Toulouse-2), « La classificacion dei dialèctes occitans », Linguistica occitana 7 (2009) pp. 1-55 en ligne
  8. Présentation de la Sociedat de Lingüistica Aragonesa: "Les principaux objectifs de la SLA sont de contribuer à une meilleure connaissance de l'aire de l'aragonais, dans une étroite interaction historique avec le catalan et le gascon." ["Son finalidaz principals de la SLA contribuir a un millor conoiximiento de l'espácio aragonés, en estreita interaccion historica con los ambitos catalan i gascon."]
  9. (es) Metzeltin Miguel (2004) Las lenguas románicas estándar: historia de su formación y de su uso, Oviedo/Uviéu - Academia de la Llingua Asturiana.
  10. a et b Henriette Walter, L'Aventure des langues en Occident, Éditions Robert Laffont, 1994 (ISBN 2-221-05918-2)
  11. Henriette Walter, L'Aventure des langues en Occident, Éditions Robert Laffont, 1994 (ISBN 2-221-05918-2), pages 206 à 208
  12. Altante Linguistico d'Italia
  13. Langues et dialectes d'Italie selon une étude de l'Université de Padoue
  14. Dialectes d'Italie selon Pellegrini
  15. (de) AIS, Sprach-und Sachatlas Italiens und der Südschweiz, Zofingen 1928-1940.
  16. Pellegrini G. B., Carte des dialectes d'Italie, édition Pacini, Pisa, 1977.
  17. Geoffrey Hull, The Linguistic Unity of Northern Italy and Rhaetia, 1982. Hull va plus loin en incluant le rhéto-roman dans le même ensemble.
  18. Sergio Salvi, La lingua padana e i suoi dialetti, Libera Compania Padana
  19. Heinrich Lausberg, Romanische Sprachwissenschaft, Berlin 1969
  20. À titre d'exemples : le florentin, le siennois ou le lucquois ; respectivement parlés à Florence et le long du fleuve Arno (jusqu'à Fucecchio), à Sienne et dans sa province, et dans la Lucchesia (Lucques et ses alentours).
  21. Eduardo Blasco Ferrer, Linguistica sarda : Storia, metodi, problemi, édition Condaghes, 2003.
  22. Francesco Mameli, Il logudorese e il gallurese, Villanova Monteleone (SS): Soter, 1998.
  23. Ethnologue.com [réf. à confirmer]
  24. ASJP - World Language Tree 03
  25. Une version intégrale en latin de ce texte est disponible sur Wikisource : s:la:Appendix Probi.
  26. On avance parfois qu'un substrat étrusque aurait influencé le dialecte toscan, qui lui devrait entre autres sa gorgia toscana, c'est-à-dire la prononciation des /k/ comme des /h/ (anglais home) ou des /χ/ (allemand Bach). Cette influence de l'étrusque sur le toscan est au XXIe siècle considérée comme un mythe sans fondements : en effet, le phénomène n'est pas limité à la Toscane ; il n'est pas présent dans toutes les zones à dominante linguistique toscane (la Corse, par exemple qui ─ bien qu'éloignée ─ a été fortement toscanisée) ; il n'est pas attesté avant le XVIe siècle et ne correspond pas réellement à des caractéristiques phonétiques étrusques. Enfin et surtout, l'on s'explique mal comment une langue morte bien avant l'apparition des dialectes italiens aurait pu transmettre ce seul trait sans avoir laissé ni vocabulaire ni même coutumes.
  27. a et b (ca) Patricia Gabancho, El preu de ser catalans. : Una cultura mil•lenària en vies d'extinció, Barcelone, Editorial Meteora, (ISBN 978-8-4956-2353-9)
  28. Pierre Vilar, Catalogne dans l'Espagne Moderne : Recherches sur les fondements économiques des structures nationales, vol. 1, Paris, Flammarion, (1re éd. 1962) (ISBN 978-2-08-210649-8), chap. II
  29. [ http://www.unesco.org/culture/languages-atlas/fr/atlasmap.html Atlas UNESCO des langues en danger]

Annexes

Bibliographie

Histoire et aspects généraux

  • M. Banniard, Du latin aux langues romanes, 1997, Nathan ;
  • Jean-Marie Klinkenberg, Des langues romanes, éditions Duculot, Louvain-la-Neuve, 1994 (2e édition) ;
  • Michael Metzeltin, Las lenguas románicas estándar. Historia de su formación y de su uso. Academia de la Llingua Asturiana, Uviéu 2004.
  • Wilfried Stroh, Le latin est mort, vive le latin ! Petite histoire d'une grande langue, traduit de l'allemand, Paris, Les Belles Lettres, 2008, 302 pages.
  • Paul Teyssier, Comprendre les langues romanes, du français à l'espagnol, au portugais, à l'italien & au roumain, méthode d'intercompréhension, Paris, Chandeigne, 2004 ;

Monographies, manuels universitaires

  • Pierre Bec, Manuel pratique de philologie romane, Paris, 1970-1971, deux tomes ;
  • Édouard Bourciez, Éléments de linguistique romane, Paris, 1967 pour la 5e édition ;
  • M.-D. Glessgen, Domaines et Méthodes de la linguistique romane, Zürich, 2004-2005, RoSe, 2 vol. ;
  • Günter Holtus/Michael Metzeltin/Christian Schmitt: Lexikon der Romanistischen Linguistik (LRL). Niemeyer, Tübingen 1988-2005 (12 volumes).
  • Mireille Huchon, Histoire de la langue française, Paris, 2002 ;
  • Petrea Lindenbauer/Michael Metzeltin/Margit Thir, Die romanischen Sprachen. Eine einführende Übersicht. G. Egert, Wilhelmsfeld 1995.
  • Max Niedermann, Phonétique historique du latin, Paris, 1953 pour la 3e édition ;
  • Michèle Perret, Introduction à l'histoire de la langue française, Paris, Armand Colin, 1998 (2008, 3e édition);

Articles connexes

Liens externes