Extraction de réseaux égocentrés dans un (très grand) réseau social
Available from bms.revues.org
Page 1
Extraction de réseaux égocentrés dans un (très grand) réseau social
Bulletin de Méthodologie Sociologique (48 bd. Jourdan, F 75014 Paris), January 2009, N. 101 - p. 5
5
EXTRACTION DE RESEAUX EGOCENTRES DANS UN (TRES GRAND) RESEAU SOCIAL
par
Christophe Prieur (Liafa, Université Paris-Diderot ; prieur@liafa.jussieu.fr) Alina Stoica (Orange Labs et Liafa ; st_alina@yahoo.fr) Zbigniew Smoreda (Orange Labs ; zbigniew.smoreda@orange-ftgroup.com) Abstract – Extracting Ego-Centered Networks From Very Large Social Networks: This article presents a method at the intersection of macro and micro approaches in social networks. In examining ego-centered network, it proposes an approach to this type of study for very large networks. The calculation of several local indicators makes it possible to create aggregate statistics for each of the nodes of the network, which can then be seen as a corpus of ego-centered networks. An application is made on a network of telephone conversations between two million people, and a comparison is made with a classic ego-centered network study, based on an ethnographic research project. Social Networks, Ego-Centered Networks, Large Social Networks, Density, Communication Networks, Macro versus Micro, Qualitative Approaches [a corrected machine translation in English of this article is available on request from bms@reveus.org]. Résumé. Cet article présente une méthode à l’intersection des approches « macro » et « micro » de l’analyse des réseaux sociaux. Prenant pour objectif l’étude de réseaux égocentrés, il propose une démarche permettant ce type d’étude sur de très grands réseaux. Le calcul de plusieurs indicateurs locaux peut en effet permettre de constituer des statistiques globales sur chacun des nœuds du réseau, qui sera alors vu comme un corpus de réseaux égocentrés. Une mise en pratique est réalisée sur un réseau d’échanges téléphoniques entre deux millions d’individus et une comparaison est établie avec une étude égocentrée classique, s’appuyant sur une enquête ethnographique. Réseaux sociaux, Réseaux égocentrés, Grands réseaux, Densité, Réseaux de communication, Macro vs. micro, Approches qualitatives. On oppose parfois deux axes dans l’analyse des réseaux1 : l’un s’intéressant à la structure d’un ensemble de liens, entre des individus possiblement très nombreux, 1 Gribaudi 1998 (a), Eve, 2002.
5
EXTRACTION DE RESEAUX EGOCENTRES DANS UN (TRES GRAND) RESEAU SOCIAL
par
Christophe Prieur (Liafa, Université Paris-Diderot ; prieur@liafa.jussieu.fr) Alina Stoica (Orange Labs et Liafa ; st_alina@yahoo.fr) Zbigniew Smoreda (Orange Labs ; zbigniew.smoreda@orange-ftgroup.com) Abstract – Extracting Ego-Centered Networks From Very Large Social Networks: This article presents a method at the intersection of macro and micro approaches in social networks. In examining ego-centered network, it proposes an approach to this type of study for very large networks. The calculation of several local indicators makes it possible to create aggregate statistics for each of the nodes of the network, which can then be seen as a corpus of ego-centered networks. An application is made on a network of telephone conversations between two million people, and a comparison is made with a classic ego-centered network study, based on an ethnographic research project. Social Networks, Ego-Centered Networks, Large Social Networks, Density, Communication Networks, Macro versus Micro, Qualitative Approaches [a corrected machine translation in English of this article is available on request from bms@reveus.org]. Résumé. Cet article présente une méthode à l’intersection des approches « macro » et « micro » de l’analyse des réseaux sociaux. Prenant pour objectif l’étude de réseaux égocentrés, il propose une démarche permettant ce type d’étude sur de très grands réseaux. Le calcul de plusieurs indicateurs locaux peut en effet permettre de constituer des statistiques globales sur chacun des nœuds du réseau, qui sera alors vu comme un corpus de réseaux égocentrés. Une mise en pratique est réalisée sur un réseau d’échanges téléphoniques entre deux millions d’individus et une comparaison est établie avec une étude égocentrée classique, s’appuyant sur une enquête ethnographique. Réseaux sociaux, Réseaux égocentrés, Grands réseaux, Densité, Réseaux de communication, Macro vs. micro, Approches qualitatives. On oppose parfois deux axes dans l’analyse des réseaux1 : l’un s’intéressant à la structure d’un ensemble de liens, entre des individus possiblement très nombreux, 1 Gribaudi 1998 (a), Eve, 2002.
Page 2
p. 6 - Bulletin de Méthodologie Sociologique (48 bd. Jourdan, F 75014 Paris), January 2009, N. 101
6
pour y identifier des « rôles », des zones denses etc.2 ; l’autre s’attachant à décrire des « formes de sociabilité » au moyen de réseaux égocentrés, dont l’analyse a surtout pour objet de décrire la manière dont ego, l’individu au centre du réseau, se positionne vis-à-vis de son entourage relationnel3. Cette opposition est aujourd’hui d’autant plus marquée que les réseaux étudiés dans la première tendance peuvent atteindre des dimensions considérables allant jusqu’à des millions de nœuds sur lesquels les informations sont très pauvres, plaçant ainsi ce cadre d’analyse sur un plan difficilement conciliable avec des méthodologies où le matériau principal est l’entretien individuel avec les personnes étudiées pour apprécier la qualité des liens observés. Bien entendu, de nombreuses combinaisons existent entre ces deux extrêmes : l’analyse de rôles autant que les nombreux indicateurs, calculables pour certains d’entre eux sur de très grands réseaux, peuvent précisément être une manière de distinguer des formes de sociabilité et s’appuyer sur des enquêtes comprenant une dimension qualitative forte. Les outils techniques sont alors un moyen de simplifier le réseau pour confronter le résultat aux produits de l’enquête : les rôles rendent équivalents des nœuds du réseau, les indicateurs transforment en valeurs numériques la complexité des interrelations et les matériaux qualitatifs permettent d’illustrer, valider ou invalider les simplifications opérées. La méthode que nous proposons repousse l’étape de simplification du réseau pour tenter de transposer sur de très grands réseaux des approches par réseaux égocentrés. L’élément clef consiste à calculer, pour chacun des nœuds, un ensemble de propriétés de son « réseau égocentré » (défini à partir de ses voisins directs et leurs voisins) pour guider le choix des nœuds sur lesquels on peut souhaiter réaliser une étude plus poussée, constituant ainsi des échantillons à géométrie variable. Pour que ce calcul soit praticable, il est nécessaire de prendre en compte des considérations algorithmiques que nous exposerons brièvement. Nous décrirons ensuite les propriétés statistiques du corpus ainsi constitué avant d’illustrer par trois études de cas le travail qualitatif qui peut être mené à condition que les données initiales s’y prêtent. Pour illustrer notre démarche méthodologique, nous appliquerons les techniques décrites à une base de communications de téléphonie mobile (appels et SMS) entre deux millions d’individus sur un mois. En prenant pour modèle de l’approche égocentrée une enquête socio-ethnographique sur les modes de sociabilité en milieu populaire4, nous discuterons les éléments qui peuvent être reproduits dans le cadre d’une grande base de données anonymisée. MANIPULATION D’UN GRAND RESEAU 2 Lorrain et White 1971, Girvan et Newman 2002. 3 Gribaudi 1998 (b), Cardon et Granjon 2005. 4 Granjon et al. 2007
6
pour y identifier des « rôles », des zones denses etc.2 ; l’autre s’attachant à décrire des « formes de sociabilité » au moyen de réseaux égocentrés, dont l’analyse a surtout pour objet de décrire la manière dont ego, l’individu au centre du réseau, se positionne vis-à-vis de son entourage relationnel3. Cette opposition est aujourd’hui d’autant plus marquée que les réseaux étudiés dans la première tendance peuvent atteindre des dimensions considérables allant jusqu’à des millions de nœuds sur lesquels les informations sont très pauvres, plaçant ainsi ce cadre d’analyse sur un plan difficilement conciliable avec des méthodologies où le matériau principal est l’entretien individuel avec les personnes étudiées pour apprécier la qualité des liens observés. Bien entendu, de nombreuses combinaisons existent entre ces deux extrêmes : l’analyse de rôles autant que les nombreux indicateurs, calculables pour certains d’entre eux sur de très grands réseaux, peuvent précisément être une manière de distinguer des formes de sociabilité et s’appuyer sur des enquêtes comprenant une dimension qualitative forte. Les outils techniques sont alors un moyen de simplifier le réseau pour confronter le résultat aux produits de l’enquête : les rôles rendent équivalents des nœuds du réseau, les indicateurs transforment en valeurs numériques la complexité des interrelations et les matériaux qualitatifs permettent d’illustrer, valider ou invalider les simplifications opérées. La méthode que nous proposons repousse l’étape de simplification du réseau pour tenter de transposer sur de très grands réseaux des approches par réseaux égocentrés. L’élément clef consiste à calculer, pour chacun des nœuds, un ensemble de propriétés de son « réseau égocentré » (défini à partir de ses voisins directs et leurs voisins) pour guider le choix des nœuds sur lesquels on peut souhaiter réaliser une étude plus poussée, constituant ainsi des échantillons à géométrie variable. Pour que ce calcul soit praticable, il est nécessaire de prendre en compte des considérations algorithmiques que nous exposerons brièvement. Nous décrirons ensuite les propriétés statistiques du corpus ainsi constitué avant d’illustrer par trois études de cas le travail qualitatif qui peut être mené à condition que les données initiales s’y prêtent. Pour illustrer notre démarche méthodologique, nous appliquerons les techniques décrites à une base de communications de téléphonie mobile (appels et SMS) entre deux millions d’individus sur un mois. En prenant pour modèle de l’approche égocentrée une enquête socio-ethnographique sur les modes de sociabilité en milieu populaire4, nous discuterons les éléments qui peuvent être reproduits dans le cadre d’une grande base de données anonymisée. MANIPULATION D’UN GRAND RESEAU 2 Lorrain et White 1971, Girvan et Newman 2002. 3 Gribaudi 1998 (b), Cardon et Granjon 2005. 4 Granjon et al. 2007
Page 3
Bulletin de Méthodologie Sociologique (48 bd. Jourdan, F 75014 Paris), January 2009, N. 101 - p. 7
7
Travailler sur un réseau d’une telle taille (deux millions de nœuds) est une manière de pousser à l’extrême la démonstration qu’une approche « micro » est toujours envisageable. Ce choix nous oblige toutefois à faire un détour vers les outils techniques à mettre en œuvre. Un réseau de communications de téléphonie mobile La base de données que nous avons utilisée contient les enregistrements des communications par téléphone mobile des clients d’un opérateur que nous nommerons O, dans un pays européen pendant le mois d'octobre 2006. Avec plus de 3 millions de clients actifs, O est un des principaux opérateurs de téléphonie mobile dans le pays étudié. Chaque enregistrement contient les détails d'un échange par mobile entre un client de O du pays étudié, et une autre personne (tous opérateurs et tous pays confondus). Les enregistrements concernent deux types de communications : les appels vocaux et les SMS. Pour les personnes appartenant à l'opérateur O, nous disposons aussi de plusieurs données supplémentaires : l'année de naissance, le sexe, la région et le type de contrat (fixe ou mobile). Les numéros de téléphone ont été chiffrés de sorte qu’à chaque personne en communication a été attribué un identifiant unique qui ne permet pas de retrouver son numéro de téléphone (et a fortiori son identité). Pour chaque communication enregistrée, on connaît les identifiants des deux personnes, les opérateurs de téléphonie mobile auxquels elles appartiennent (par construction, au moins un de ces deux opérateurs est O), l’heure à laquelle la communication a commencé, la durée et le type de communication (appel vocal ou SMS). Pour chaque jour du mois étudié, il y a environ 10 millions de communications enregistrées avec plus de 3 millions de clients. La constitution d’un réseau à partir d’une telle base d’enregistrements nécessite un certain nombre de choix que nous allons détailler ici. En premier lieu, l’objectif de travailler sur un réseau « complet » nous impose de ne conserver que les clients de l’opérateur O. Ainsi, nous disposons des enregistrements de toutes les communications entre les nœuds de notre réseau (ce qui ne serait pas le cas si l’on conservait les clients d’autres opérateurs, puisqu’on ne connaît que leurs communications passées avec un client de O). Dans un deuxième temps, nous avons défini un lien (non orienté) entre deux personnes par l’existence d’au moins un appel vocal entre les deux, dans les deux sens, pendant le mois que dure l’observation. Cette procédure élimine les appels dans un seul sens, des événements singuliers dans la plupart des cas suggérant que les deux individus en communication ne se connaissent pas personnellement. Le réseau que l'on obtient a approximativement 2 millions de nœuds et 3 millions de liens et possède des caractéristiques communes aux très grands réseaux. Pour n’en citer que quelques unes, une forte proportion des nœuds (87%) et des liens (97%) forment une grande composante connexe (c'est-à-dire qu’il existe un chemin qui en relie tous les nœuds) ; son coefficient de clustering (le rapport moyen entre le nombre de liens
7
Travailler sur un réseau d’une telle taille (deux millions de nœuds) est une manière de pousser à l’extrême la démonstration qu’une approche « micro » est toujours envisageable. Ce choix nous oblige toutefois à faire un détour vers les outils techniques à mettre en œuvre. Un réseau de communications de téléphonie mobile La base de données que nous avons utilisée contient les enregistrements des communications par téléphone mobile des clients d’un opérateur que nous nommerons O, dans un pays européen pendant le mois d'octobre 2006. Avec plus de 3 millions de clients actifs, O est un des principaux opérateurs de téléphonie mobile dans le pays étudié. Chaque enregistrement contient les détails d'un échange par mobile entre un client de O du pays étudié, et une autre personne (tous opérateurs et tous pays confondus). Les enregistrements concernent deux types de communications : les appels vocaux et les SMS. Pour les personnes appartenant à l'opérateur O, nous disposons aussi de plusieurs données supplémentaires : l'année de naissance, le sexe, la région et le type de contrat (fixe ou mobile). Les numéros de téléphone ont été chiffrés de sorte qu’à chaque personne en communication a été attribué un identifiant unique qui ne permet pas de retrouver son numéro de téléphone (et a fortiori son identité). Pour chaque communication enregistrée, on connaît les identifiants des deux personnes, les opérateurs de téléphonie mobile auxquels elles appartiennent (par construction, au moins un de ces deux opérateurs est O), l’heure à laquelle la communication a commencé, la durée et le type de communication (appel vocal ou SMS). Pour chaque jour du mois étudié, il y a environ 10 millions de communications enregistrées avec plus de 3 millions de clients. La constitution d’un réseau à partir d’une telle base d’enregistrements nécessite un certain nombre de choix que nous allons détailler ici. En premier lieu, l’objectif de travailler sur un réseau « complet » nous impose de ne conserver que les clients de l’opérateur O. Ainsi, nous disposons des enregistrements de toutes les communications entre les nœuds de notre réseau (ce qui ne serait pas le cas si l’on conservait les clients d’autres opérateurs, puisqu’on ne connaît que leurs communications passées avec un client de O). Dans un deuxième temps, nous avons défini un lien (non orienté) entre deux personnes par l’existence d’au moins un appel vocal entre les deux, dans les deux sens, pendant le mois que dure l’observation. Cette procédure élimine les appels dans un seul sens, des événements singuliers dans la plupart des cas suggérant que les deux individus en communication ne se connaissent pas personnellement. Le réseau que l'on obtient a approximativement 2 millions de nœuds et 3 millions de liens et possède des caractéristiques communes aux très grands réseaux. Pour n’en citer que quelques unes, une forte proportion des nœuds (87%) et des liens (97%) forment une grande composante connexe (c'est-à-dire qu’il existe un chemin qui en relie tous les nœuds) ; son coefficient de clustering (le rapport moyen entre le nombre de liens
Page 4
p. 8 - Bulletin de Méthodologie Sociologique (48 bd. Jourdan, F 75014 Paris), January 2009, N. 101
8
observés et le nombre de liens possibles entre les voisins d’un nœud) est relativement élevé (10,0%) ; la distribution du nombre de voisins des nœuds est très hétérogène. Nous détaillerons par la suite ces deux derniers points en nous concentrant non sur les propriétés générales du réseau mais sur les propriétés locales de chacun de ses nœuds. Algorithmique L’algorithmique a pour objectif de développer des techniques de calcul (algorithmes) et de représentation des données afin d’optimiser sensiblement le nombre d’opérations effectuées, et donc le temps de traitement, ainsi que la quantité de mémoire vive utilisée pour effectuer une tâche. Ces quantités (nombre d’opérations et quantité de mémoire) sont généralement exprimées en fonction de la taille des données, de sorte que deux algorithmes pourront être comparés indépendamment de celles-ci. On parle de complexité en temps (pour le nombre d’opérations) ou en espace (pour la quantité de mémoire). Un exemple simple dans le cas des réseaux : déterminer s’il existe un lien entre deux nœuds A et B dépend de la manière dont on stocke les liens. Si l’on stocke les liens sous la forme d’une liste de voisins pour chaque nœud, déterminer si A et B sont voisins nécessite de parcourir la liste des voisins de l’un des deux pour y trouver l’autre. Plus le réseau est grand, plus cette liste de voisins est longue et donc plus ce parcours nécessitera d’opérations (notons cependant que le nombre d’opérations nécessaires pour trouver un élément dans une liste est très réduit si la liste est triée — plus précisément, ce nombre est fonction du logarithmique de la longueur de la liste). Si au contraire les liens sont stockés sous forme d’un tableau à double entrée où la case située sur la ligne correspondant à A et la colonne correspondant à B contient une valeur indiquant la présence ou l’absence du lien, cette information est accessible immédiatement, en un temps indépendant de la taille du réseau. En revanche, dans ce dernier cas la place occupée en mémoire (le tableau à double entrée) est proportionnelle au carré du nombre de nœuds du réseau. Cette solution devient donc vite problématique au-delà de quelques centaines de nœuds (de l’ordre du Méga-octet de mémoire pour mille nœuds). Dès les années 1980, la question du traitement de réseaux ayant plus d’une centaine de nœuds fut soulevée5, à une époque où les outils algorithmiques applicables étaient encore relativement sommaires. Plutôt que de manipuler les données dans leur intégralité, des techniques de modélisation et d’agrégation peuvent parfois permettre d’aboutir à des résultats satisfaisants malgré une complexité intrinsèque élevée. La problématique des rôles dans les réseaux peut répondre à cette préoccupation : plutôt que de manipuler l’ensemble du réseau, on peut ne considérer les relations qu’entre des classes d’équivalence (les nœuds occupant des 5 Klovdahl 1980, Allen 1982. À noter, dans le Bulletin de Méthodologie Sociologique, Klovdahl et al, 1992.
8
observés et le nombre de liens possibles entre les voisins d’un nœud) est relativement élevé (10,0%) ; la distribution du nombre de voisins des nœuds est très hétérogène. Nous détaillerons par la suite ces deux derniers points en nous concentrant non sur les propriétés générales du réseau mais sur les propriétés locales de chacun de ses nœuds. Algorithmique L’algorithmique a pour objectif de développer des techniques de calcul (algorithmes) et de représentation des données afin d’optimiser sensiblement le nombre d’opérations effectuées, et donc le temps de traitement, ainsi que la quantité de mémoire vive utilisée pour effectuer une tâche. Ces quantités (nombre d’opérations et quantité de mémoire) sont généralement exprimées en fonction de la taille des données, de sorte que deux algorithmes pourront être comparés indépendamment de celles-ci. On parle de complexité en temps (pour le nombre d’opérations) ou en espace (pour la quantité de mémoire). Un exemple simple dans le cas des réseaux : déterminer s’il existe un lien entre deux nœuds A et B dépend de la manière dont on stocke les liens. Si l’on stocke les liens sous la forme d’une liste de voisins pour chaque nœud, déterminer si A et B sont voisins nécessite de parcourir la liste des voisins de l’un des deux pour y trouver l’autre. Plus le réseau est grand, plus cette liste de voisins est longue et donc plus ce parcours nécessitera d’opérations (notons cependant que le nombre d’opérations nécessaires pour trouver un élément dans une liste est très réduit si la liste est triée — plus précisément, ce nombre est fonction du logarithmique de la longueur de la liste). Si au contraire les liens sont stockés sous forme d’un tableau à double entrée où la case située sur la ligne correspondant à A et la colonne correspondant à B contient une valeur indiquant la présence ou l’absence du lien, cette information est accessible immédiatement, en un temps indépendant de la taille du réseau. En revanche, dans ce dernier cas la place occupée en mémoire (le tableau à double entrée) est proportionnelle au carré du nombre de nœuds du réseau. Cette solution devient donc vite problématique au-delà de quelques centaines de nœuds (de l’ordre du Méga-octet de mémoire pour mille nœuds). Dès les années 1980, la question du traitement de réseaux ayant plus d’une centaine de nœuds fut soulevée5, à une époque où les outils algorithmiques applicables étaient encore relativement sommaires. Plutôt que de manipuler les données dans leur intégralité, des techniques de modélisation et d’agrégation peuvent parfois permettre d’aboutir à des résultats satisfaisants malgré une complexité intrinsèque élevée. La problématique des rôles dans les réseaux peut répondre à cette préoccupation : plutôt que de manipuler l’ensemble du réseau, on peut ne considérer les relations qu’entre des classes d’équivalence (les nœuds occupant des 5 Klovdahl 1980, Allen 1982. À noter, dans le Bulletin de Méthodologie Sociologique, Klovdahl et al, 1992.
Page 5
Bulletin de Méthodologie Sociologique (48 bd. Jourdan, F 75014 Paris), January 2009, N. 101 - p. 9
9
positions considérées comme équivalentes sont remplacés par un unique « représentant »). Ceci suppose que le calcul des rôles puisse se faire sur des parties du réseau, ou en tout cas avec une complexité moindre6. C’est au cours des années 1990, avec la démocratisation de l’internet, que la taille des réseaux susceptibles d’être soumis à l’analyse a explosé7. La découverte de propriétés structurelles partagées par de nombreux réseaux issus de diverses disciplines a fait naître un domaine de recherche ayant pour objets centraux les « grands réseaux » (ou complex networks, ou réseaux petits mondes), ayant des milliers voire des millions de nœuds8. Notre réseau de communications téléphoniques en est un cas particulier. Pour manipuler dans leur intégralité des réseaux de cette taille, le choix des modes de représentation des données en mémoire et des algorithmes utilisés doit être très rigoureux et des heuristiques sont souvent nécessaires pour éviter une explosion combinatoire. Pour le calcul des indicateurs de réseaux égocentrés que nous décrirons dans la section suivante, nous nous sommes inspirés des techniques de calcul du nombre de triangles dans un grand réseau9. D’apparence simple, ce calcul nécessite de parcourir, pour chacun des (plusieurs millions de) liens du réseau (entre deux nœuds qu’on notera A et B), la liste des voisins des deux extrémités du lien pour compter les nœuds qu’elles ont en commun (les nœuds voisins de A aussi bien que de B). Pour effectuer efficacement cette intersection, les listes de voisins doivent être triées, mais leur représentation en mémoire doit être suffisamment simple pour n’occuper qu’une place minimale. Par ailleurs, pour limiter le nombre parcours des listes de voisins les plus longues, les nœuds peuvent être parcourus par ordre croissant du nombre de voisins. DEUX MILLIONS DE RESEAUX EGOCENTRES Plutôt que d’étudier de manière globale des propriétés de structure du grand réseau constitué à partir des appels entre deux millions de clients de l’opérateur téléphonique O, nous faisons le choix ici de caractériser les réseaux égocentrés de chacun des nœuds de notre réseau. Nous allons donc définir des indicateurs locaux qu’il sera possible de calculer sur les voisinages de tous les nœuds et dont nous pourrons étudier la distribution sur l’ensemble des individus, pour ensuite nous focaliser sur quelques individus. 6 Faugeron et Van Meter, 1990, proposent une méthode de classification proche de cette idée bien que hors du champ des réseaux. 7 Pour une tentative de survol à visée pédagogique des études sur les réseaux de l’internet, lire Cardon et Prieur, 2007. 8 Watts et Strogatz, 1998. 9 Pour une synthèse de ces techniques, lire Latapy 2008.
9
positions considérées comme équivalentes sont remplacés par un unique « représentant »). Ceci suppose que le calcul des rôles puisse se faire sur des parties du réseau, ou en tout cas avec une complexité moindre6. C’est au cours des années 1990, avec la démocratisation de l’internet, que la taille des réseaux susceptibles d’être soumis à l’analyse a explosé7. La découverte de propriétés structurelles partagées par de nombreux réseaux issus de diverses disciplines a fait naître un domaine de recherche ayant pour objets centraux les « grands réseaux » (ou complex networks, ou réseaux petits mondes), ayant des milliers voire des millions de nœuds8. Notre réseau de communications téléphoniques en est un cas particulier. Pour manipuler dans leur intégralité des réseaux de cette taille, le choix des modes de représentation des données en mémoire et des algorithmes utilisés doit être très rigoureux et des heuristiques sont souvent nécessaires pour éviter une explosion combinatoire. Pour le calcul des indicateurs de réseaux égocentrés que nous décrirons dans la section suivante, nous nous sommes inspirés des techniques de calcul du nombre de triangles dans un grand réseau9. D’apparence simple, ce calcul nécessite de parcourir, pour chacun des (plusieurs millions de) liens du réseau (entre deux nœuds qu’on notera A et B), la liste des voisins des deux extrémités du lien pour compter les nœuds qu’elles ont en commun (les nœuds voisins de A aussi bien que de B). Pour effectuer efficacement cette intersection, les listes de voisins doivent être triées, mais leur représentation en mémoire doit être suffisamment simple pour n’occuper qu’une place minimale. Par ailleurs, pour limiter le nombre parcours des listes de voisins les plus longues, les nœuds peuvent être parcourus par ordre croissant du nombre de voisins. DEUX MILLIONS DE RESEAUX EGOCENTRES Plutôt que d’étudier de manière globale des propriétés de structure du grand réseau constitué à partir des appels entre deux millions de clients de l’opérateur téléphonique O, nous faisons le choix ici de caractériser les réseaux égocentrés de chacun des nœuds de notre réseau. Nous allons donc définir des indicateurs locaux qu’il sera possible de calculer sur les voisinages de tous les nœuds et dont nous pourrons étudier la distribution sur l’ensemble des individus, pour ensuite nous focaliser sur quelques individus. 6 Faugeron et Van Meter, 1990, proposent une méthode de classification proche de cette idée bien que hors du champ des réseaux. 7 Pour une tentative de survol à visée pédagogique des études sur les réseaux de l’internet, lire Cardon et Prieur, 2007. 8 Watts et Strogatz, 1998. 9 Pour une synthèse de ces techniques, lire Latapy 2008.
Page 6
p. 10 - Bulletin de Méthodologie Sociologique (48 bd. Jourdan, F 75014 Paris), January 2009, N. 101
10
Caractéristiques égocentrées Pour analyser un réseau égocentré, nous utiliserons plusieurs paramètres (indicateurs) qui peuvent être calculés localement. Quelques uns de ces paramètres quantifient la dimension du réseau égocentré, d'autres mesurent les connexions entre les différents nœuds du réseau. Rappelons que dans un réseau, on appelle voisin d’un nœud, les nœuds avec qui il partage des liens, donc, dans notre réseau, les personnes qu'il a appelées et qui l'ont appelé au moins une fois pendant le mois suivi. Pour chaque nœud du réseau, nous avons choisi de définir son réseau égocentré comme l'ensemble de ses voisins, les voisins de ses voisins et les liens entre tous ces nœuds. Autrement dit, on inclut dans le réseau égocentré de chaque nœud (qu'on appelle ego) tous les nœuds qui se trouvent à distance au plus deux d'ego (la distance entre deux nœuds, appelée parfois géodésique, est le plus petit nombre de liens qu'il faut parcourir pour aller de l'un à l'autre). On choisit de ne pas inclure dans le réseau égocentré les nœuds qui se trouvent à distance au moins trois d'ego parce qu'ils ne sont pas significatifs pour la manière dont ego est connecté au réseau global. En revanche, il ne suffit pas d'intégrer seulement les nœuds à distance un d'ego : il semble plus éloquent d'analyser la façon qu’a ego de se connecter à ses voisins en connaissant la manière dont ces voisins sont reliés entre eux et à leurs autres voisins. Étant donné un nœud A, nous utiliserons les notations suivantes : - n(A) est le nombre de nœuds du réseau égocentré de A (A y compris) ; - m(A) est le nombre de liens ; - t0(A) est le nombre de triangles auxquels A appartient10 ; - t(A) est le nombre total de triangles dans le réseau égocentré ; - s(A) est le nombre de carrés auxquels A appartient. Un carré est défini par A, deux de ses voisins et un quatrième nœud, voisin des deux précédents mais non voisin de A ; - vm(A) est le nombre maximal de voisins que A partage avec un autre nœud. L’élément central de la méthode que nous présentons ici consiste à calculer les valeurs de ces paramètres11 pour tous les nœuds de notre réseau afin de constituer un vaste corpus de réseaux égocentrés assortis de leurs propriétés statistiques. En utilisant les techniques algorithmiques évoquées à la section précédente, le calcul des triangles (à savoir des valeurs de t0, pour chacun des deux millions de nœuds du réseau) peut s’effectuer, sur notre réseau, en quelques secondes sur un ordinateur de 10 Par triangle on entend un ensemble de trois nœuds tous reliés les uns aux autres. 11 Bien entendu, ces paramètres sont choisis à titre indicatif. Le choix d’autres paramètres n’a pour limite que celles, algorithmiques, qui sont évoquées plus haut.
10
Caractéristiques égocentrées Pour analyser un réseau égocentré, nous utiliserons plusieurs paramètres (indicateurs) qui peuvent être calculés localement. Quelques uns de ces paramètres quantifient la dimension du réseau égocentré, d'autres mesurent les connexions entre les différents nœuds du réseau. Rappelons que dans un réseau, on appelle voisin d’un nœud, les nœuds avec qui il partage des liens, donc, dans notre réseau, les personnes qu'il a appelées et qui l'ont appelé au moins une fois pendant le mois suivi. Pour chaque nœud du réseau, nous avons choisi de définir son réseau égocentré comme l'ensemble de ses voisins, les voisins de ses voisins et les liens entre tous ces nœuds. Autrement dit, on inclut dans le réseau égocentré de chaque nœud (qu'on appelle ego) tous les nœuds qui se trouvent à distance au plus deux d'ego (la distance entre deux nœuds, appelée parfois géodésique, est le plus petit nombre de liens qu'il faut parcourir pour aller de l'un à l'autre). On choisit de ne pas inclure dans le réseau égocentré les nœuds qui se trouvent à distance au moins trois d'ego parce qu'ils ne sont pas significatifs pour la manière dont ego est connecté au réseau global. En revanche, il ne suffit pas d'intégrer seulement les nœuds à distance un d'ego : il semble plus éloquent d'analyser la façon qu’a ego de se connecter à ses voisins en connaissant la manière dont ces voisins sont reliés entre eux et à leurs autres voisins. Étant donné un nœud A, nous utiliserons les notations suivantes : - n(A) est le nombre de nœuds du réseau égocentré de A (A y compris) ; - m(A) est le nombre de liens ; - t0(A) est le nombre de triangles auxquels A appartient10 ; - t(A) est le nombre total de triangles dans le réseau égocentré ; - s(A) est le nombre de carrés auxquels A appartient. Un carré est défini par A, deux de ses voisins et un quatrième nœud, voisin des deux précédents mais non voisin de A ; - vm(A) est le nombre maximal de voisins que A partage avec un autre nœud. L’élément central de la méthode que nous présentons ici consiste à calculer les valeurs de ces paramètres11 pour tous les nœuds de notre réseau afin de constituer un vaste corpus de réseaux égocentrés assortis de leurs propriétés statistiques. En utilisant les techniques algorithmiques évoquées à la section précédente, le calcul des triangles (à savoir des valeurs de t0, pour chacun des deux millions de nœuds du réseau) peut s’effectuer, sur notre réseau, en quelques secondes sur un ordinateur de 10 Par triangle on entend un ensemble de trois nœuds tous reliés les uns aux autres. 11 Bien entendu, ces paramètres sont choisis à titre indicatif. Le choix d’autres paramètres n’a pour limite que celles, algorithmiques, qui sont évoquées plus haut.
Page 7
Bulletin de Méthodologie Sociologique (48 bd. Jourdan, F 75014 Paris), January 2009, N. 101 - p. 11
11
configuration standard, et l’ensemble des caractéristiques égocentrées se calcule en un temps avoisinant la minute. Panorama statistique du corpus Le calcul des caractéristiques égocentrées pour l’ensemble des nœuds du réseau permet d'analyser les distributions des différents indicateurs. La distribution d'un paramètre est obtenue en comptant, pour chaque valeur possible du paramètre, les nœuds qui atteignent cette valeur. Dans les grands réseaux, la distribution du nombre de voisins est généralement très hétérogène, souvent approximable par une loi de puissance. Sans détailler cette propriété, nous nous contenterons de la résumer en disant que la plupart des nœuds ont un petit degré12 et que l’on compte une petite fraction de nœuds avec un (très) fort degré. Pour être lisibles, ces distributions sont souvent représentées dans une échelle doublement logarithmique où dans certains cas, elles s’approcheront d’une ligne droite. Figure 1. La distribution de deux paramètres des réseaux égocentrés en échelle doublement logarithmique : pour chaque valeur du paramètre (axe x), le nombre de gens ayant la valeur (axe y)
12 Le degré désigne le nombre de voisins d’un nœud.
11
configuration standard, et l’ensemble des caractéristiques égocentrées se calcule en un temps avoisinant la minute. Panorama statistique du corpus Le calcul des caractéristiques égocentrées pour l’ensemble des nœuds du réseau permet d'analyser les distributions des différents indicateurs. La distribution d'un paramètre est obtenue en comptant, pour chaque valeur possible du paramètre, les nœuds qui atteignent cette valeur. Dans les grands réseaux, la distribution du nombre de voisins est généralement très hétérogène, souvent approximable par une loi de puissance. Sans détailler cette propriété, nous nous contenterons de la résumer en disant que la plupart des nœuds ont un petit degré12 et que l’on compte une petite fraction de nœuds avec un (très) fort degré. Pour être lisibles, ces distributions sont souvent représentées dans une échelle doublement logarithmique où dans certains cas, elles s’approcheront d’une ligne droite. Figure 1. La distribution de deux paramètres des réseaux égocentrés en échelle doublement logarithmique : pour chaque valeur du paramètre (axe x), le nombre de gens ayant la valeur (axe y)
12 Le degré désigne le nombre de voisins d’un nœud.
Page 8
p. 12 - Bulletin de Méthodologie Sociologique (48 bd. Jourdan, F 75014 Paris), January 2009, N. 101
12
Table 2. La moyenne, la médiane et la valeur maximale pour les différents indicateurs indicateur Moyenne médiane valeur maximale degré 3,3 2 96 nb. nœuds 18,8 10 1034 nb. liens 27,2 11 2777 nb. triangles autour d'ego 1,2 0 376 nb. total triangles 12,9 2 3734 nb. carrés 1,9 0 1534 Dans notre réseau, les distributions de tous les paramètres définis plus haut sont très hétérogènes, comme le montrent la figure 1 et la table 2. Par exemple, le plus petit degré dans le réseau est égal à 1 (il n'y a pas de nœuds de degré zéro par construction du réseau de communication) et il est atteint par un tiers des nœuds, donc un tiers des personnes ont un seul correspondant qu'elles appellent et qui les appelle au moins une fois pendant le mois suivi. Les valeurs suivantes du degré sont atteintes par des proportions de nœuds de plus en plus petites : 22% pour degré 2, 15% pour degré 3 etc. La valeur maximale, 96, est atteinte par un seul nœud. Les distributions des différents indicateurs ne sont pas directement corrélées, c'est-à-dire, si l’on fixe la valeur d’un certain paramètre, l'intervalle des valeurs des autres peut être très large. Bien entendu, les limites inférieures de ces valeurs dépendent de la valeur fixée (par exemple, il y a au moins d+1 nœuds dans le réseau d'un individu de degré d ou il y a au moins n-1 liens dans un réseau à n nœuds). La figure 2 montre la distribution du nombre de nœuds dans les réseaux égocentrés des
12
Table 2. La moyenne, la médiane et la valeur maximale pour les différents indicateurs indicateur Moyenne médiane valeur maximale degré 3,3 2 96 nb. nœuds 18,8 10 1034 nb. liens 27,2 11 2777 nb. triangles autour d'ego 1,2 0 376 nb. total triangles 12,9 2 3734 nb. carrés 1,9 0 1534 Dans notre réseau, les distributions de tous les paramètres définis plus haut sont très hétérogènes, comme le montrent la figure 1 et la table 2. Par exemple, le plus petit degré dans le réseau est égal à 1 (il n'y a pas de nœuds de degré zéro par construction du réseau de communication) et il est atteint par un tiers des nœuds, donc un tiers des personnes ont un seul correspondant qu'elles appellent et qui les appelle au moins une fois pendant le mois suivi. Les valeurs suivantes du degré sont atteintes par des proportions de nœuds de plus en plus petites : 22% pour degré 2, 15% pour degré 3 etc. La valeur maximale, 96, est atteinte par un seul nœud. Les distributions des différents indicateurs ne sont pas directement corrélées, c'est-à-dire, si l’on fixe la valeur d’un certain paramètre, l'intervalle des valeurs des autres peut être très large. Bien entendu, les limites inférieures de ces valeurs dépendent de la valeur fixée (par exemple, il y a au moins d+1 nœuds dans le réseau d'un individu de degré d ou il y a au moins n-1 liens dans un réseau à n nœuds). La figure 2 montre la distribution du nombre de nœuds dans les réseaux égocentrés des
Page 9
Bulletin de Méthodologie Sociologique (48 bd. Jourdan, F 75014 Paris), January 2009, N. 101 - p. 13
13
Figure 2. La distribution du nombre n de nœuds dans les réseaux égocentrés des nœuds de degré 2 (haut) et 10 (bas) en échelle linéaire: pour chaque valeur de n (axe x), le nombre d’individus ayant la valeur (axe y)
13
Figure 2. La distribution du nombre n de nœuds dans les réseaux égocentrés des nœuds de degré 2 (haut) et 10 (bas) en échelle linéaire: pour chaque valeur de n (axe x), le nombre d’individus ayant la valeur (axe y)
Page 10
p. 14 - Bulletin de Méthodologie Sociologique (48 bd. Jourdan, F 75014 Paris), January 2009, N. 101
14
individus de degré 2 (les valeurs vont de 3 à 110, et 6 est la valeur la plus atteinte) et des individus de degré 10 (les valeurs vont de 11 à 275, et 51 est la valeur la plus atteinte). Nous terminerons l’aperçu des caractéristiques statistiques de notre corpus par un examen des valeurs prises par le paramètre vm qui compte, pour chaque ego, le nombre maximal de voisins qu’il partage avec un autre nœud. Ce paramètre peut nous permettre de mesurer si les nœuds qui ont des voisins en commun avec ego sont eux aussi des voisins d'ego : les amis de mes amis sont-ils aussi mes amis ? Ou encore, la personne qui a plus de contacts avec mes amis que toute autre personne a-t-elle aussi des contacts avec moi ? Un premier résultat surprenant est que pour 71% des nœuds du réseau, la réponse est négative. Bien entendu, plus est grand vm, le nombre de voisins partagés avec un autre nœud, plus la probabilité que ce nœud soit un contact direct est grande. Néanmoins, on compte un nombre relativement élevé d’individus pour lesquels la valeur de vm est grande, mais la probabilité est petite. Par exemple, pour 458 nœuds, vm vaut au moins 10 et la probabilité est nulle, autrement dit ils partagent au moins 10 voisins avec des gens avec lesquels ils n’ont pas de contact direct (et réciproque, puisque c’était la condition de création d’un lien dans notre réseau). Représentativité et mesures L’intérêt principal de la constitution d’un tel corpus de réseaux égocentrés est de pouvoir établir des données de cadrage, pour la mise au point d’indicateurs de portée générale ou pour l’étude particulière d’un échantillon de ces réseaux. Dans le premier cas, la distribution des valeurs sur l’ensemble des réseaux peut permettre d’évaluer la pertinence d’un indicateur. Dans le deuxième, la comparaison des caractéristiques de deux réseaux peut ainsi se faire « toutes choses égales par ailleurs ». Le piège de la densité La densité, une des mesures les plus utilisées dans l’analyse des réseaux, car extrêmement simple à calculer, souffre précisément d’un manque de telles données de cadrage. Pour mémoire, elle désigne le rapport entre le nombre de liens observés dans un réseau et le nombre de liens possibles entre tous les nœuds. Or, ce dernier est proportionnel au carré du nombre de nœuds : parmi un ensemble de n individus, il existe exactement n (n-1)/2 possibilités d’associer deux individus par un lien non orienté. La mesure de la densité suggère donc que le nombre de liens d’un réseau est comparable au carré du nombre de nœuds. Mais si l’on compare, dans notre corpus, le nombre de liens (m) et le nombre de nœuds (n) de chacun de nos réseaux égocentrés (voir Figure 3), on constate que m et n semblent liés par relation qui semble plus proche d’être linéaire que quadratique. Ceci suggère donc que pour des réseaux de natures similaires, la densité est d’autant plus faible que le réseau est grand. Comparer deux réseaux de tailles différentes sur la base de leurs densités, comme il arrive de le voir pratiquer, risque donc fort de n’avoir pas de sens.
14
individus de degré 2 (les valeurs vont de 3 à 110, et 6 est la valeur la plus atteinte) et des individus de degré 10 (les valeurs vont de 11 à 275, et 51 est la valeur la plus atteinte). Nous terminerons l’aperçu des caractéristiques statistiques de notre corpus par un examen des valeurs prises par le paramètre vm qui compte, pour chaque ego, le nombre maximal de voisins qu’il partage avec un autre nœud. Ce paramètre peut nous permettre de mesurer si les nœuds qui ont des voisins en commun avec ego sont eux aussi des voisins d'ego : les amis de mes amis sont-ils aussi mes amis ? Ou encore, la personne qui a plus de contacts avec mes amis que toute autre personne a-t-elle aussi des contacts avec moi ? Un premier résultat surprenant est que pour 71% des nœuds du réseau, la réponse est négative. Bien entendu, plus est grand vm, le nombre de voisins partagés avec un autre nœud, plus la probabilité que ce nœud soit un contact direct est grande. Néanmoins, on compte un nombre relativement élevé d’individus pour lesquels la valeur de vm est grande, mais la probabilité est petite. Par exemple, pour 458 nœuds, vm vaut au moins 10 et la probabilité est nulle, autrement dit ils partagent au moins 10 voisins avec des gens avec lesquels ils n’ont pas de contact direct (et réciproque, puisque c’était la condition de création d’un lien dans notre réseau). Représentativité et mesures L’intérêt principal de la constitution d’un tel corpus de réseaux égocentrés est de pouvoir établir des données de cadrage, pour la mise au point d’indicateurs de portée générale ou pour l’étude particulière d’un échantillon de ces réseaux. Dans le premier cas, la distribution des valeurs sur l’ensemble des réseaux peut permettre d’évaluer la pertinence d’un indicateur. Dans le deuxième, la comparaison des caractéristiques de deux réseaux peut ainsi se faire « toutes choses égales par ailleurs ». Le piège de la densité La densité, une des mesures les plus utilisées dans l’analyse des réseaux, car extrêmement simple à calculer, souffre précisément d’un manque de telles données de cadrage. Pour mémoire, elle désigne le rapport entre le nombre de liens observés dans un réseau et le nombre de liens possibles entre tous les nœuds. Or, ce dernier est proportionnel au carré du nombre de nœuds : parmi un ensemble de n individus, il existe exactement n (n-1)/2 possibilités d’associer deux individus par un lien non orienté. La mesure de la densité suggère donc que le nombre de liens d’un réseau est comparable au carré du nombre de nœuds. Mais si l’on compare, dans notre corpus, le nombre de liens (m) et le nombre de nœuds (n) de chacun de nos réseaux égocentrés (voir Figure 3), on constate que m et n semblent liés par relation qui semble plus proche d’être linéaire que quadratique. Ceci suggère donc que pour des réseaux de natures similaires, la densité est d’autant plus faible que le réseau est grand. Comparer deux réseaux de tailles différentes sur la base de leurs densités, comme il arrive de le voir pratiquer, risque donc fort de n’avoir pas de sens.
Page 11
Bulletin de Méthodologie Sociologique (48 bd. Jourdan, F 75014 Paris), January 2009, N. 101 - p. 15
15
Figure 3. Nombre de liens (en ordonnée) par rapport au nombre de nœuds (en abscisse) pour chacun des réseaux égocentrés
Le défaut de la densité, mesure pourtant classique, vient de ce que le nombre maximum de liens possibles n’est qu’une valeur théorique, qui n’est en aucun cas réaliste pour peu que le réseau comporte au moins quelques dizaines de liens. Une des utilisations possibles des corpus de réseaux égocentrés que nous préconisons serait d’étalonner des valeurs maximales réalistes pour le nombre de liens en fonction du nombre de nœuds, pour aboutir à la définition d’une mesure de densité qui serait aussi simple à calculer mais qui ne souffrirait pas d’un biais dépendant de la taille du réseau. On pourrait ainsi comparer sur la base de cette nouvelle mesure de densité deux réseaux de tailles différentes. Échantillonnage La constitution d’échantillons représentatifs à géométrie variable pourra se faire en fixant les valeurs de quelques unes des caractéristiques égocentrées, pour analyser dans un premier temps la distribution des autres caractéristiques, et ensuite la structure des réseaux. A titre d’exemple, il est ainsi possible d’extraire de notre réseau les 46 réseaux égocentrés ayant exactement 20 nœuds, 30 liens et 10 triangles, pour étudier leurs différences de forme (l’effectif s’élève de 46 à 1062 si l’on s’autorise une marge de plus ou moins 1 pour les nombres de nœuds, liens et triangles). LA QUESTION DES SOCIABILITES Pour illustrer la manière dont on peut utiliser le corpus de réseaux égocentrés décrit précédemment, nous allons extraire deux individus du corpus pour étudier en détail leurs relations avec leurs entourages relationnels respectifs. Avant cela, nous
15
Figure 3. Nombre de liens (en ordonnée) par rapport au nombre de nœuds (en abscisse) pour chacun des réseaux égocentrés
Le défaut de la densité, mesure pourtant classique, vient de ce que le nombre maximum de liens possibles n’est qu’une valeur théorique, qui n’est en aucun cas réaliste pour peu que le réseau comporte au moins quelques dizaines de liens. Une des utilisations possibles des corpus de réseaux égocentrés que nous préconisons serait d’étalonner des valeurs maximales réalistes pour le nombre de liens en fonction du nombre de nœuds, pour aboutir à la définition d’une mesure de densité qui serait aussi simple à calculer mais qui ne souffrirait pas d’un biais dépendant de la taille du réseau. On pourrait ainsi comparer sur la base de cette nouvelle mesure de densité deux réseaux de tailles différentes. Échantillonnage La constitution d’échantillons représentatifs à géométrie variable pourra se faire en fixant les valeurs de quelques unes des caractéristiques égocentrées, pour analyser dans un premier temps la distribution des autres caractéristiques, et ensuite la structure des réseaux. A titre d’exemple, il est ainsi possible d’extraire de notre réseau les 46 réseaux égocentrés ayant exactement 20 nœuds, 30 liens et 10 triangles, pour étudier leurs différences de forme (l’effectif s’élève de 46 à 1062 si l’on s’autorise une marge de plus ou moins 1 pour les nombres de nœuds, liens et triangles). LA QUESTION DES SOCIABILITES Pour illustrer la manière dont on peut utiliser le corpus de réseaux égocentrés décrit précédemment, nous allons extraire deux individus du corpus pour étudier en détail leurs relations avec leurs entourages relationnels respectifs. Avant cela, nous
Page 12
p. 16 - Bulletin de Méthodologie Sociologique (48 bd. Jourdan, F 75014 Paris), January 2009, N. 101
16
décrirons brièvement une étude ethnographique utilisant les réseaux égocentrés, pour rappeler quels types de questionnements cette approche permet de traiter. Un modèle d’analyse égocentrée (Granjon et al. 2007) Pour la résumer très schématiquement, l’étude que nous avons choisie13 s’intéresse aux sociabilités des familles populaires. Elle se fixe pour objectif principal de croiser deux aspects de la sociabilité que sont les relations (familiales, amoureuses, amicales, etc.) qui lient les individus et les contacts qui actualisent ces relations (téléphone, messagerie, face à face, etc.) Le parti-pris de ne s’intéresser qu’à des familles populaires répond à une volonté déclarée de laisser de côté la notion de capital social14 pour montrer que la diversité des formes de sociabilité ne se réduit pas à des différences de catégories sociales. La méthode employée pour les enquêtes s’inspire des Exercices sur les réseaux sociaux de M. Gribaudi15, utilisant des carnets de contacts dans lesquels les répondants enregistrent quotidiennement, sur une période de dix jours, une série de renseignements sur leurs activités relationnelles. Ces carnets servent ensuite de support à des entretiens, l’un d’entre eux ayant pour but de faire renseigner par la personne ayant rempli le carnet les liens d’interconnaissance entre ses correspondants. A l’issue de ce processus, des réseaux égocentrés peuvent alors être construits, mesurés, comparés, et bien entendu commentés par le répondant. Dans le cas de cette étude, les enquêtes ont été réalisées par foyers, c'est-à-dire que pour chaque foyer étudié, on a distribué un carnet à chaque membre du foyer (en l’occurrence, les parents et un ou deux enfants), constituant ainsi plusieurs réseaux égocentrés qui s’intersectent. La nature de ces intersections constitue alors un élément important de l’analyse, d’autant que parmi les angles d’attaque du problème posé, les auteurs questionnent l’idée selon laquelle les outils de communication seraient un moyen de construire, au sein de la famille, une identité personnelle de ses membres entre autonomie individuelle et appartenance16. Les réseaux égocentrés pourraient alors dessiner les traces de cet individualisme relationnel dans les diverses manières d’articuler les contacts pour les membres d’un foyer. Au travers de trois études de cas (donc trois foyers), les auteurs montrent que les diverses dynamiques familialo-conjugales ont souvent pour visée la préservation d’un « Nous familial », qui se décline selon des modalités très diverses selon les foyers étudiés. Ils insistent sur la prégnance des cadres familiaux sur la manière 13 Granjon et al 2007. 14 Granjon et Lelong 2006. 15 Gribaudi 1998 (b). 16 de Singly 2005.
16
décrirons brièvement une étude ethnographique utilisant les réseaux égocentrés, pour rappeler quels types de questionnements cette approche permet de traiter. Un modèle d’analyse égocentrée (Granjon et al. 2007) Pour la résumer très schématiquement, l’étude que nous avons choisie13 s’intéresse aux sociabilités des familles populaires. Elle se fixe pour objectif principal de croiser deux aspects de la sociabilité que sont les relations (familiales, amoureuses, amicales, etc.) qui lient les individus et les contacts qui actualisent ces relations (téléphone, messagerie, face à face, etc.) Le parti-pris de ne s’intéresser qu’à des familles populaires répond à une volonté déclarée de laisser de côté la notion de capital social14 pour montrer que la diversité des formes de sociabilité ne se réduit pas à des différences de catégories sociales. La méthode employée pour les enquêtes s’inspire des Exercices sur les réseaux sociaux de M. Gribaudi15, utilisant des carnets de contacts dans lesquels les répondants enregistrent quotidiennement, sur une période de dix jours, une série de renseignements sur leurs activités relationnelles. Ces carnets servent ensuite de support à des entretiens, l’un d’entre eux ayant pour but de faire renseigner par la personne ayant rempli le carnet les liens d’interconnaissance entre ses correspondants. A l’issue de ce processus, des réseaux égocentrés peuvent alors être construits, mesurés, comparés, et bien entendu commentés par le répondant. Dans le cas de cette étude, les enquêtes ont été réalisées par foyers, c'est-à-dire que pour chaque foyer étudié, on a distribué un carnet à chaque membre du foyer (en l’occurrence, les parents et un ou deux enfants), constituant ainsi plusieurs réseaux égocentrés qui s’intersectent. La nature de ces intersections constitue alors un élément important de l’analyse, d’autant que parmi les angles d’attaque du problème posé, les auteurs questionnent l’idée selon laquelle les outils de communication seraient un moyen de construire, au sein de la famille, une identité personnelle de ses membres entre autonomie individuelle et appartenance16. Les réseaux égocentrés pourraient alors dessiner les traces de cet individualisme relationnel dans les diverses manières d’articuler les contacts pour les membres d’un foyer. Au travers de trois études de cas (donc trois foyers), les auteurs montrent que les diverses dynamiques familialo-conjugales ont souvent pour visée la préservation d’un « Nous familial », qui se décline selon des modalités très diverses selon les foyers étudiés. Ils insistent sur la prégnance des cadres familiaux sur la manière 13 Granjon et al 2007. 14 Granjon et Lelong 2006. 15 Gribaudi 1998 (b). 16 de Singly 2005.
Page 13
Bulletin de Méthodologie Sociologique (48 bd. Jourdan, F 75014 Paris), January 2009, N. 101 - p. 17
17
qu’ont les individus de construire leur sociabilité, quand bien même cette construction peut s’effectuer vers une individualisation dont on trouve la trace dans la forme des réseaux de contacts. TROIS ETUDES DE CAS A partir de la base d’échanges téléphoniques dont nous disposons, nous sommes d’emblée limités à n’envisager les formes de sociabilités que sous l’angle des contacts au détriment des relations effectives. Nous ne pourrons donc que faire des hypothèses sur la teneur affective des échanges. En revanche, le but de notre approche est précisément de faire ressortir la diversité combinatoire des formes relationnelles. Les deux personnes que nous avons initialement choisi d’étudier partagent exactement les mêmes caractéristiques égocentrées au sens défini plus haut. Elles ont des valeurs non triviales pour le degré, le nombre de nœuds et le nombre d'arêtes dans leurs réseaux égocentrées, à savoir, respectivement, 7, 40 et 55. Prises isolément, ces valeurs peuvent être considérées comme non exceptionnelles : le nombre de nœuds du réseau total ayant un degré supérieur ou égal représente 10% (pour les nombres de nœuds et d’arêtes respectivement, les proportions sont de 11% et 12%). La combinaison de ces trois valeurs exactes se retrouve sur 55 000 personnes. Donc les valeurs choisies ne sont pas des valeurs extrêmes, mais elles sont suffisamment grandes pour que la structure des réseaux égocentrés ne soit pas évidente. A part le degré, le nombre de nœuds et le nombre d'arêtes, les deux personnes choisies partagent aussi le nombre de triangles autour d'ego (égal à 3), le nombre total de triangles (13) et le nombre de carrés (55), et elles sont les seules deux personnes à avoir ces paramètres. Toutefois, il y a plus qu'une possibilité de construire un réseau égocentré avec ces valeurs, donc la structure du réseau ne peut pas être déduite à partir des paramètres. Les deux réseaux choisis montrent que même si les valeurs sont identiques, la répartition de nœuds et arêtes peut être différente. Les deux réseaux sont représentés sur la figure 4. Une première constatation est que les deux réseaux ont des formes relativement simples, en particulier le premier est planaire (c'est-à-dire qu’il est possible de placer ses nœuds de sorte que les liens ne se croisent pas) et il s’en faut de peu que le deuxième le soit aussi. Si l’on compare les structures des deux réseaux, on constate des différences sensibles malgré l’égalité de leurs caractéristiques égocentrées. Si l’on élimine ego, le premier réseau est constitué de trois composantes connexes avec quatre triangles en dehors de la composante la plus grande. Dans cette dernière, les nœuds 11 et 18 forment un pont entre deux blocs distincts. Le deuxième réseau a quatre composantes connexes avec deux triangles en dehors de la composante principale. Comme dans l’autre réseau, deux nœuds (4 et 5) occupent des positions relativement symétriques mais ici, un nœud (28) se distingue avec un fort degré, reliant de nombreux nœuds de la composante principale.
17
qu’ont les individus de construire leur sociabilité, quand bien même cette construction peut s’effectuer vers une individualisation dont on trouve la trace dans la forme des réseaux de contacts. TROIS ETUDES DE CAS A partir de la base d’échanges téléphoniques dont nous disposons, nous sommes d’emblée limités à n’envisager les formes de sociabilités que sous l’angle des contacts au détriment des relations effectives. Nous ne pourrons donc que faire des hypothèses sur la teneur affective des échanges. En revanche, le but de notre approche est précisément de faire ressortir la diversité combinatoire des formes relationnelles. Les deux personnes que nous avons initialement choisi d’étudier partagent exactement les mêmes caractéristiques égocentrées au sens défini plus haut. Elles ont des valeurs non triviales pour le degré, le nombre de nœuds et le nombre d'arêtes dans leurs réseaux égocentrées, à savoir, respectivement, 7, 40 et 55. Prises isolément, ces valeurs peuvent être considérées comme non exceptionnelles : le nombre de nœuds du réseau total ayant un degré supérieur ou égal représente 10% (pour les nombres de nœuds et d’arêtes respectivement, les proportions sont de 11% et 12%). La combinaison de ces trois valeurs exactes se retrouve sur 55 000 personnes. Donc les valeurs choisies ne sont pas des valeurs extrêmes, mais elles sont suffisamment grandes pour que la structure des réseaux égocentrés ne soit pas évidente. A part le degré, le nombre de nœuds et le nombre d'arêtes, les deux personnes choisies partagent aussi le nombre de triangles autour d'ego (égal à 3), le nombre total de triangles (13) et le nombre de carrés (55), et elles sont les seules deux personnes à avoir ces paramètres. Toutefois, il y a plus qu'une possibilité de construire un réseau égocentré avec ces valeurs, donc la structure du réseau ne peut pas être déduite à partir des paramètres. Les deux réseaux choisis montrent que même si les valeurs sont identiques, la répartition de nœuds et arêtes peut être différente. Les deux réseaux sont représentés sur la figure 4. Une première constatation est que les deux réseaux ont des formes relativement simples, en particulier le premier est planaire (c'est-à-dire qu’il est possible de placer ses nœuds de sorte que les liens ne se croisent pas) et il s’en faut de peu que le deuxième le soit aussi. Si l’on compare les structures des deux réseaux, on constate des différences sensibles malgré l’égalité de leurs caractéristiques égocentrées. Si l’on élimine ego, le premier réseau est constitué de trois composantes connexes avec quatre triangles en dehors de la composante la plus grande. Dans cette dernière, les nœuds 11 et 18 forment un pont entre deux blocs distincts. Le deuxième réseau a quatre composantes connexes avec deux triangles en dehors de la composante principale. Comme dans l’autre réseau, deux nœuds (4 et 5) occupent des positions relativement symétriques mais ici, un nœud (28) se distingue avec un fort degré, reliant de nombreux nœuds de la composante principale.
Page 14
p. 18 - Bulletin de Méthodologie Sociologique (48 bd. Jourdan, F 75014 Paris), January 2009, N. 101
18
Figure 4. Les réseaux égocentrés de A et de B. Ego est représenté par le carré rouge, ses voisins directs par les cercles bleus et les voisins de ses voisins par les cercles verts (bien entendu, les numéros attribués aux nœuds dans les deux réseaux sont indépendants).
18
Figure 4. Les réseaux égocentrés de A et de B. Ego est représenté par le carré rouge, ses voisins directs par les cercles bleus et les voisins de ses voisins par les cercles verts (bien entendu, les numéros attribués aux nœuds dans les deux réseaux sont indépendants).
Page 15
Bulletin de Méthodologie Sociologique (48 bd. Jourdan, F 75014 Paris), January 2009, N. 101 - p. 19
19
Les deux personnes sont toutes les deux des femmes et habitent la même région. L’une a 30 ans (nous l’appellerons A) et l’autre 51 (nous l’appellerons B) 17. Pendant le mois suivi, elles ont parlé approximativement le même nombre de secondes au téléphone portable. Toutefois, leurs pratiques de communication par mobile sont sensiblement différentes, comme le montre la discussion suivante. La première personne : A Pendant le mois d'octobre 2006, la personne A a eu 98 contacts par téléphone mobile : 28 SMS et 70 appels émis ou reçus, avec 11 471 secondes parlées au total. Elle a eu 3 jours sur les 31 jours du mois sans aucune communication par téléphone mobile. On peut dire que parmi les personnes que A contacte par mobile, l'individu numéro 18 a une position spéciale. Il se détache nettement en durée et nombre de contacts avec A. Ils communiquent régulièrement, tous les jours sauf samedi et dimanche, et dans la plupart des cas plusieurs fois par jour, A étant l'appelant dans deux tiers des cas. De plus, A n'a aucun contact après 21h, sauf avec 18. Avec 11, A parle régulièrement aussi, toutes les semaines, une ou deux fois le week-end et une fois dans la semaine. Les contacts sont moins nombreux qu'avec 18, mais chaque fois ce 17 Utiliser les données démographiques d’un client présente toujours le risque de prendre un adolescent pour un de ses parents qui a souscrit un abonnement pour son enfant. En l’occurrence, l’âge des correspondants de B est également autour de 50 ans.
19
Les deux personnes sont toutes les deux des femmes et habitent la même région. L’une a 30 ans (nous l’appellerons A) et l’autre 51 (nous l’appellerons B) 17. Pendant le mois suivi, elles ont parlé approximativement le même nombre de secondes au téléphone portable. Toutefois, leurs pratiques de communication par mobile sont sensiblement différentes, comme le montre la discussion suivante. La première personne : A Pendant le mois d'octobre 2006, la personne A a eu 98 contacts par téléphone mobile : 28 SMS et 70 appels émis ou reçus, avec 11 471 secondes parlées au total. Elle a eu 3 jours sur les 31 jours du mois sans aucune communication par téléphone mobile. On peut dire que parmi les personnes que A contacte par mobile, l'individu numéro 18 a une position spéciale. Il se détache nettement en durée et nombre de contacts avec A. Ils communiquent régulièrement, tous les jours sauf samedi et dimanche, et dans la plupart des cas plusieurs fois par jour, A étant l'appelant dans deux tiers des cas. De plus, A n'a aucun contact après 21h, sauf avec 18. Avec 11, A parle régulièrement aussi, toutes les semaines, une ou deux fois le week-end et une fois dans la semaine. Les contacts sont moins nombreux qu'avec 18, mais chaque fois ce 17 Utiliser les données démographiques d’un client présente toujours le risque de prendre un adolescent pour un de ses parents qui a souscrit un abonnement pour son enfant. En l’occurrence, l’âge des correspondants de B est également autour de 50 ans.
Page 16
p. 20 - Bulletin de Méthodologie Sociologique (48 bd. Jourdan, F 75014 Paris), January 2009, N. 101
20
sont des appels d'assez longue durée (environ 9-10 minutes dans la plupart des cas). En revanche, ils ne s'envoient jamais de SMS. Les personnes 18 et 11 échangent le plus de contacts avec A et les durées totales de ces contacts sont les plus grandes, fait qui peut être corrélé avec les positions centrales de ces deux nœuds dans le réseau de A : en mesurant la centralité des nœuds par le nombre de plus courts chemins auxquels ils appartiennent, on obtient que 18 est le nœud le plus central, suivi par 11. D'ailleurs, les gens avec lesquels A a le moins d'échanges sont les numéros 10 et 15, des nœuds isolés par rapport aux autres nœuds qui forment une seule composante connexe. Un résumé des communications entre A et ses contacts directs est donné dans la table 2. Table 2. Résumé des échanges téléphoniques entre A et chacun de ses voisins N° nœud Nb. commu- nications avec A Durée totale (secondes) Nb. comm. dans des jours différents Nb. comm. vers A Nb. comm. initiées par A 18 48 5787 20 19 29 11 11 2518 9 6 5 8 4 596 4 3 1 17 9 273 5 5 1 3 2 191 2 1 1 10 3 138 2 1 2 15 2 89 1 1 1 La deuxième personne : B Même si la durée totale des appels est approximativement la même que dans le cas de A (12 385 secondes par rapport à 11 471 pour A), B a beaucoup plus de communications: 238 par rapport à 98 dans le premier cas. La moitié de ces communications sont des SMS : 78 messages envoyés et 40 reçus. B reçoit et envoie des SMS d'une manière assez particulière. Un même individu qui n'est pas client de l’opérateur O envoie des messages à B toutes les semaines, plusieurs fois par semaines et même plusieurs fois dans le même jour : le 4 octobre, B reçoit de cette personne 5 messages. Cependant, B ne contacte jamais cet individu au moyen de son téléphone portable. En revanche, B envoie régulièrement des SMS à une même personne, elle non plus client de l’opérateur O. B appelle cette personne seulement deux fois mais ils ne se parlent pas, B tombant sur la boite vocale. Par rapport à la première situation où B ne recontacte jamais l'autre individu de son portable, dans ce cas-ci, les contacts ont lieu dans les deux sens : il y a plusieurs moments où la personne appelle B après avoir reçu un message d’elle. De plus, à deux semaines d’intervalle, B utilise les SMS pour contacter une même liste de 21 personnes, dans exactement le même ordre. Ces deux séries d’envoi ont lieu en fin de semaine (vendredi puis jeudi), à l’heure du déjeuner, et durent moins d’un quart d’heure. B n'a pas d’autre contact avec ces 21 personnes que l'envoi de ces deux séries de SMS, à l’exception de quatre personnes parmi les 21, avec
20
sont des appels d'assez longue durée (environ 9-10 minutes dans la plupart des cas). En revanche, ils ne s'envoient jamais de SMS. Les personnes 18 et 11 échangent le plus de contacts avec A et les durées totales de ces contacts sont les plus grandes, fait qui peut être corrélé avec les positions centrales de ces deux nœuds dans le réseau de A : en mesurant la centralité des nœuds par le nombre de plus courts chemins auxquels ils appartiennent, on obtient que 18 est le nœud le plus central, suivi par 11. D'ailleurs, les gens avec lesquels A a le moins d'échanges sont les numéros 10 et 15, des nœuds isolés par rapport aux autres nœuds qui forment une seule composante connexe. Un résumé des communications entre A et ses contacts directs est donné dans la table 2. Table 2. Résumé des échanges téléphoniques entre A et chacun de ses voisins N° nœud Nb. commu- nications avec A Durée totale (secondes) Nb. comm. dans des jours différents Nb. comm. vers A Nb. comm. initiées par A 18 48 5787 20 19 29 11 11 2518 9 6 5 8 4 596 4 3 1 17 9 273 5 5 1 3 2 191 2 1 1 10 3 138 2 1 2 15 2 89 1 1 1 La deuxième personne : B Même si la durée totale des appels est approximativement la même que dans le cas de A (12 385 secondes par rapport à 11 471 pour A), B a beaucoup plus de communications: 238 par rapport à 98 dans le premier cas. La moitié de ces communications sont des SMS : 78 messages envoyés et 40 reçus. B reçoit et envoie des SMS d'une manière assez particulière. Un même individu qui n'est pas client de l’opérateur O envoie des messages à B toutes les semaines, plusieurs fois par semaines et même plusieurs fois dans le même jour : le 4 octobre, B reçoit de cette personne 5 messages. Cependant, B ne contacte jamais cet individu au moyen de son téléphone portable. En revanche, B envoie régulièrement des SMS à une même personne, elle non plus client de l’opérateur O. B appelle cette personne seulement deux fois mais ils ne se parlent pas, B tombant sur la boite vocale. Par rapport à la première situation où B ne recontacte jamais l'autre individu de son portable, dans ce cas-ci, les contacts ont lieu dans les deux sens : il y a plusieurs moments où la personne appelle B après avoir reçu un message d’elle. De plus, à deux semaines d’intervalle, B utilise les SMS pour contacter une même liste de 21 personnes, dans exactement le même ordre. Ces deux séries d’envoi ont lieu en fin de semaine (vendredi puis jeudi), à l’heure du déjeuner, et durent moins d’un quart d’heure. B n'a pas d’autre contact avec ces 21 personnes que l'envoi de ces deux séries de SMS, à l’exception de quatre personnes parmi les 21, avec
Page 17
Bulletin de Méthodologie Sociologique (48 bd. Jourdan, F 75014 Paris), January 2009, N. 101 - p. 21
21
lesquelles B a un échange de SMS supplémentaire, quelques jours après l'envoi des SMS à toute la liste. Une hypothèse plausible serait que les deux séries de messages ont pour but l’organisation d’un événement, d’une sortie, par exemple pour le dimanche (un des deux dimanches, B a un échange de SMS avec une des personnes de la liste). La rencontre physique expliquerait dans ce cas qu’il n’y ait aucune réponse apparente aux messages. Les correspondants seraient alors des connaissances de B, qu’elle rencontre en groupe mais avec lesquelles elle n’entretient pas nécessairement de relations hors de ce groupe. Cette hypothèse pourrait être complétée en élargissant le cercle du réseau étudié pour situer ces correspondants au sein des réseaux égocentrés des correspondants réguliers de B. Par rapport au cas de A où un même individu échangeait le plus de communications avec A et dont la durée totale des appels était plus grande que pour les autres correspondants, dans le cas de B il s'agit de deux personnes différentes. Le plus souvent B communique avec 5, mais c'est avec 4 que B a les appels les plus longs, aussi bien en moyenne qu’au total. B appelle 5 plusieurs fois par semaine et, de temps en temps, 5 appelle B lui-aussi, mais c'est B qui appelle cinq fois plus souvent. D'une certaine façon, 4 a pour B le rôle que 11 avait pour A : il communique avec B régulièrement, chaque semaine, une ou deux fois le week-end et une fois dans la semaine, pour des conversations assez longues (jusqu’à 20 minutes). On retrouve ici deux schémas types de la communication interpersonnelle18, entre appels très fréquents et brefs, caractérisant souvent les personnes d’un même foyer dans une communication dite de coordination, et appels réguliers et longs pour des amis qui ne partagent pas le même toit. Dans le réseau de B, contrairement au réseau de A, la position des nœuds n'est pas corrélée à la quantité d'échanges avec B. Par exemple, B communique plus avec 25 qu'avec 28, même si 25 ne fait pas partie de la composante connexe principale. De même, 9 est la personne avec qui B communique le moins malgré ses liens vers d'autres contacts directs de B. Table 3. Résumé des échanges téléphoniques entre B et chacun de ses voisins N° nœud Nb. commu- nications avec B Durée totale (secondes) Nb. comm. dans des jours différents Nb. comm. vers B Nb. comm. initiées par B 4 13 5071 11 8 5 5 29 1470 17 5 24 25 14 958 13 12 2 28 9 788 7 6 3 17 4 462 3 1 3 22 7 186 5 3 4 9 3 98 3 2 1 18 Licoppe 2002.
21
lesquelles B a un échange de SMS supplémentaire, quelques jours après l'envoi des SMS à toute la liste. Une hypothèse plausible serait que les deux séries de messages ont pour but l’organisation d’un événement, d’une sortie, par exemple pour le dimanche (un des deux dimanches, B a un échange de SMS avec une des personnes de la liste). La rencontre physique expliquerait dans ce cas qu’il n’y ait aucune réponse apparente aux messages. Les correspondants seraient alors des connaissances de B, qu’elle rencontre en groupe mais avec lesquelles elle n’entretient pas nécessairement de relations hors de ce groupe. Cette hypothèse pourrait être complétée en élargissant le cercle du réseau étudié pour situer ces correspondants au sein des réseaux égocentrés des correspondants réguliers de B. Par rapport au cas de A où un même individu échangeait le plus de communications avec A et dont la durée totale des appels était plus grande que pour les autres correspondants, dans le cas de B il s'agit de deux personnes différentes. Le plus souvent B communique avec 5, mais c'est avec 4 que B a les appels les plus longs, aussi bien en moyenne qu’au total. B appelle 5 plusieurs fois par semaine et, de temps en temps, 5 appelle B lui-aussi, mais c'est B qui appelle cinq fois plus souvent. D'une certaine façon, 4 a pour B le rôle que 11 avait pour A : il communique avec B régulièrement, chaque semaine, une ou deux fois le week-end et une fois dans la semaine, pour des conversations assez longues (jusqu’à 20 minutes). On retrouve ici deux schémas types de la communication interpersonnelle18, entre appels très fréquents et brefs, caractérisant souvent les personnes d’un même foyer dans une communication dite de coordination, et appels réguliers et longs pour des amis qui ne partagent pas le même toit. Dans le réseau de B, contrairement au réseau de A, la position des nœuds n'est pas corrélée à la quantité d'échanges avec B. Par exemple, B communique plus avec 25 qu'avec 28, même si 25 ne fait pas partie de la composante connexe principale. De même, 9 est la personne avec qui B communique le moins malgré ses liens vers d'autres contacts directs de B. Table 3. Résumé des échanges téléphoniques entre B et chacun de ses voisins N° nœud Nb. commu- nications avec B Durée totale (secondes) Nb. comm. dans des jours différents Nb. comm. vers B Nb. comm. initiées par B 4 13 5071 11 8 5 5 29 1470 17 5 24 25 14 958 13 12 2 28 9 788 7 6 3 17 4 462 3 1 3 22 7 186 5 3 4 9 3 98 3 2 1 18 Licoppe 2002.
Page 18
p. 22 - Bulletin de Méthodologie Sociologique (48 bd. Jourdan, F 75014 Paris), January 2009, N. 101
22
Enrichissement du réseau L’observation fine des communications individuelles nous montre donc que derrière deux réseaux égocentrés formellement identiques peuvent figurer des sociabilités sensiblement différentes. On pourrait toutefois objecter qu’une nette différence entre nos deux individus réside dans l’usage des SMS, que nous avons écarté pour construire le réseau complet qui sert de base à nos calculs. Nous allons donc réitérer les mesures en prenant cette fois en compte les deux types de communication dont nous disposons. La règle de construction d’une relation sera la même : au moins un contact dans les deux sens pendant le mois, à ceci près que par contact, on entendra indifféremment appel ou SMS. La description statistique du réseau change relativement peu, qu’il s’agisse du réseau global ou du corpus de réseaux égocentrés, si ce n’est, bien entendu, que les liens sont plus nombreux (6,4 millions contre 2,7) et les distributions plus étalées. En ce qui concerne nos deux individus, comme prévu leurs caractéristiques égocentrées diffèrent ici nettement. La moitié des communications de l'individu B sont des SMS; une partie de ces messages sont échangés avec des personnes que B n'appelle pas ou qui ne l'appellent pas, donc qui ne sont pas reliées à B dans le premier réseau. Si dans le premier cas le degré de B était 7, il est de 18 dans le deuxième réseau. Ses autres indicateurs varient beaucoup aussi: le nombre de nœuds est 130 (par rapport à 40 avant), le nombre de liens est 201 (55 avant), le nombre de triangles autour d'ego et au total deviennent 13, respectivement 73 par rapport à 3 et 13 dans le premier réseau. Pour l'individu A, en revanche, les gens qu'il contacte exclusivement par SMS ne sont pas très nombreux, donc le degré de A devient seulement 9 dans le deuxième cas. Néanmoins, les autres indicateurs varient considérablement : le nombre de nœuds est 82, le nombre de liens 144, le nombre de triangles autour d'ego 9 et au total, 96. Cette augmentation des valeurs est très vraisemblablement déterminée par des voisins de A qui sont plus connectés dans le deuxième réseau que dans le premier. Etant donné le grand nombre de nœuds et de liens, la représentation graphique des réseaux égocentrés de A et de B devient maintenant difficile. On se résume alors à représenter seulement ego, ses voisins et les liens entre eux, en excluant donc les nœuds à distance deux d'ego. Les deux dessins (figure 5) diffèrent nettement. En enlevant ego dans le réseau de A, on obtient une composante connexe et trois nœuds isolés, correspondant précisément aux trois personnes avec lesquelles A a le moins d'échanges téléphoniques. De plus, la composante connexe est constituée de deux cliques qui partagent, hormis ego, un seul nœud, 18. Ego et 18 se trouvent donc à l'intersection de deux groupes de quatre et cinq personnes respectivement, où tout le monde contacte tout le monde. Dans la première version du réseau, 18 était le nœud le plus central. Il conserve ici cette position et a par ailleurs le plus fort degré, ce qui confirme son statut de la personne la plus importante du réseau de A, avec laquelle, d'ailleurs, A communique le plus.
22
Enrichissement du réseau L’observation fine des communications individuelles nous montre donc que derrière deux réseaux égocentrés formellement identiques peuvent figurer des sociabilités sensiblement différentes. On pourrait toutefois objecter qu’une nette différence entre nos deux individus réside dans l’usage des SMS, que nous avons écarté pour construire le réseau complet qui sert de base à nos calculs. Nous allons donc réitérer les mesures en prenant cette fois en compte les deux types de communication dont nous disposons. La règle de construction d’une relation sera la même : au moins un contact dans les deux sens pendant le mois, à ceci près que par contact, on entendra indifféremment appel ou SMS. La description statistique du réseau change relativement peu, qu’il s’agisse du réseau global ou du corpus de réseaux égocentrés, si ce n’est, bien entendu, que les liens sont plus nombreux (6,4 millions contre 2,7) et les distributions plus étalées. En ce qui concerne nos deux individus, comme prévu leurs caractéristiques égocentrées diffèrent ici nettement. La moitié des communications de l'individu B sont des SMS; une partie de ces messages sont échangés avec des personnes que B n'appelle pas ou qui ne l'appellent pas, donc qui ne sont pas reliées à B dans le premier réseau. Si dans le premier cas le degré de B était 7, il est de 18 dans le deuxième réseau. Ses autres indicateurs varient beaucoup aussi: le nombre de nœuds est 130 (par rapport à 40 avant), le nombre de liens est 201 (55 avant), le nombre de triangles autour d'ego et au total deviennent 13, respectivement 73 par rapport à 3 et 13 dans le premier réseau. Pour l'individu A, en revanche, les gens qu'il contacte exclusivement par SMS ne sont pas très nombreux, donc le degré de A devient seulement 9 dans le deuxième cas. Néanmoins, les autres indicateurs varient considérablement : le nombre de nœuds est 82, le nombre de liens 144, le nombre de triangles autour d'ego 9 et au total, 96. Cette augmentation des valeurs est très vraisemblablement déterminée par des voisins de A qui sont plus connectés dans le deuxième réseau que dans le premier. Etant donné le grand nombre de nœuds et de liens, la représentation graphique des réseaux égocentrés de A et de B devient maintenant difficile. On se résume alors à représenter seulement ego, ses voisins et les liens entre eux, en excluant donc les nœuds à distance deux d'ego. Les deux dessins (figure 5) diffèrent nettement. En enlevant ego dans le réseau de A, on obtient une composante connexe et trois nœuds isolés, correspondant précisément aux trois personnes avec lesquelles A a le moins d'échanges téléphoniques. De plus, la composante connexe est constituée de deux cliques qui partagent, hormis ego, un seul nœud, 18. Ego et 18 se trouvent donc à l'intersection de deux groupes de quatre et cinq personnes respectivement, où tout le monde contacte tout le monde. Dans la première version du réseau, 18 était le nœud le plus central. Il conserve ici cette position et a par ailleurs le plus fort degré, ce qui confirme son statut de la personne la plus importante du réseau de A, avec laquelle, d'ailleurs, A communique le plus.
Page 19
Bulletin de Méthodologie Sociologique (48 bd. Jourdan, F 75014 Paris), January 2009, N. 101 - p. 23
23
Dans le réseau de B, on retrouve la disparité déjà observée entre les positions des nœuds et la quantité de leurs communications avec ego. En enlevant ego, on obtient une grande composante connexe, deux nœuds reliés entre eux et encore huit nœuds isolés. Les 4 personnes (de la liste de 21 individus auxquels B envoie des SMS à deux reprises) qui recontactent B se trouvent parmi les 8 nœuds isolés. Comme dans le cas de A, la composante connexe principale contient plusieurs cliques qui se recouvrent, mais ce ne sont pas les nœuds qui se trouvent dans le plus de cliques qui communiquent le plus avec B. Par exemple, le nœud 28 apparaît dans 4 cliques, il est d’ailleurs le nœud de plus fort degré du réseau des correspondants de B, mais il est dépassé, en nombre et durée des échanges avec B, par 5 qui appartient à deux cliques et par 4 qui n'appartient à aucune (on ne prend en compte que les cliques à au moins trois nœuds, sans compter ego). Les nœuds 4 et 5, même s'ils communiquent le plus avec B, n'ont pas de position spéciale dans le réseau égocentré. En suivant la même logique qui a présidé au choix des individus A et B, nous cherchons des personnes avec des caractéristiques égocentrées similaires à celles de A et B respectivement. Parce qu'il n'y a pas d'individu caractérisé par exactement les mêmes indicateurs que A ou B, on se permet une marge de plus ou moins 1 pour le degré et de plus ou moins 2 pour les autres paramètres. Si dans le cas de A on trouve un seul nœud qui satisfait ces conditions, dans le cas de B on trouve 3 tels nœuds parmi lesquels on choisit celui dont les caractéristiques se rapprochent le plus de celles de B. Cet individu que nous nommerons C a dans le deuxième réseau les mêmes caractéristiques égocentrées que B sauf le nombre de nœuds (129 contre130 pour B), le nombre de liens (199 contre 201) et le nombre de carrés (18 contre 17). De même que pour A et B, on se restreint à la représentation de l'individu C, ses voisins et les liens entre eux (figure 6). Figure 5. A gauche, l'individu A, ses voisins et les liens entre eux dans le réseau incluant les SMS. A droite, la même construction pour l'individu B.
23
Dans le réseau de B, on retrouve la disparité déjà observée entre les positions des nœuds et la quantité de leurs communications avec ego. En enlevant ego, on obtient une grande composante connexe, deux nœuds reliés entre eux et encore huit nœuds isolés. Les 4 personnes (de la liste de 21 individus auxquels B envoie des SMS à deux reprises) qui recontactent B se trouvent parmi les 8 nœuds isolés. Comme dans le cas de A, la composante connexe principale contient plusieurs cliques qui se recouvrent, mais ce ne sont pas les nœuds qui se trouvent dans le plus de cliques qui communiquent le plus avec B. Par exemple, le nœud 28 apparaît dans 4 cliques, il est d’ailleurs le nœud de plus fort degré du réseau des correspondants de B, mais il est dépassé, en nombre et durée des échanges avec B, par 5 qui appartient à deux cliques et par 4 qui n'appartient à aucune (on ne prend en compte que les cliques à au moins trois nœuds, sans compter ego). Les nœuds 4 et 5, même s'ils communiquent le plus avec B, n'ont pas de position spéciale dans le réseau égocentré. En suivant la même logique qui a présidé au choix des individus A et B, nous cherchons des personnes avec des caractéristiques égocentrées similaires à celles de A et B respectivement. Parce qu'il n'y a pas d'individu caractérisé par exactement les mêmes indicateurs que A ou B, on se permet une marge de plus ou moins 1 pour le degré et de plus ou moins 2 pour les autres paramètres. Si dans le cas de A on trouve un seul nœud qui satisfait ces conditions, dans le cas de B on trouve 3 tels nœuds parmi lesquels on choisit celui dont les caractéristiques se rapprochent le plus de celles de B. Cet individu que nous nommerons C a dans le deuxième réseau les mêmes caractéristiques égocentrées que B sauf le nombre de nœuds (129 contre130 pour B), le nombre de liens (199 contre 201) et le nombre de carrés (18 contre 17). De même que pour A et B, on se restreint à la représentation de l'individu C, ses voisins et les liens entre eux (figure 6). Figure 5. A gauche, l'individu A, ses voisins et les liens entre eux dans le réseau incluant les SMS. A droite, la même construction pour l'individu B.
Page 20
p. 24 - Bulletin de Méthodologie Sociologique (48 bd. Jourdan, F 75014 Paris), January 2009, N. 101
24
Figure 6. L'individu C, ses voisins et les liens entre eux dans le deuxième réseau
D'une certaine manière, les rapports entre la façon qu’ont les individus de communiquer avec ego et leurs positions dans le réseau sont très similaires pour B et C : la composante connexe principale contient sept nœuds dans le cas de C et huit dans le cas de B, les cinq premières personnes (selon par la durée totale de leurs communications avec ego) appartiennent à la grande composante, sauf la troisième personne qui forme avec un autre nœud une composante isolée. Un nœud de fort degré (le nœud 23 pour C, 28 pour B) relie la plupart des nœuds de la composante
24
Figure 6. L'individu C, ses voisins et les liens entre eux dans le deuxième réseau
D'une certaine manière, les rapports entre la façon qu’ont les individus de communiquer avec ego et leurs positions dans le réseau sont très similaires pour B et C : la composante connexe principale contient sept nœuds dans le cas de C et huit dans le cas de B, les cinq premières personnes (selon par la durée totale de leurs communications avec ego) appartiennent à la grande composante, sauf la troisième personne qui forme avec un autre nœud une composante isolée. Un nœud de fort degré (le nœud 23 pour C, 28 pour B) relie la plupart des nœuds de la composante
Page 21
Bulletin de Méthodologie Sociologique (48 bd. Jourdan, F 75014 Paris), January 2009, N. 101 - p. 25
25
principale tout en ayant relativement peu de communications avec B. Aussi bien pour B que pour C, la personne qui a les plus longues conversations avec ego (en moyenne et au total) n'a pas les plus nombreux échanges et il n'y a pas de corrélation positive entre la centralité des nœuds ou l'appartenance aux cliques et la quantité de leurs échanges avec ego. Bien entendu, derrière la forme des réseaux on trouvera de nombreuses différences entre les pratiques de communication de B et de C. A titre d'exemple, C a 400 échanges avec une durée totale de 28 000 secondes, contre 240 échanges et 12 000 secondes pour B. Un résumé des communications de C est donné dans la table 4. Table 4. Résumé des échanges téléphoniques entre C et ses 10 premiers voisins (triés par la durée totale des échanges) N° nœud Nb. commu- nications avec C Durée totale (secondes) Nb. comm. dans des jours différents Nb. comm. vers C Nb. comm. initiées par C 24 32 7774 17 18 14 22 19 6104 9 9 10 30 84 4360 23 12 72 1 5 2238 3 2 3 7 6 1522 5 2 4 15 5 1055 5 2 3 16 8 767 5 3 5 18 4 362 3 1 3 9 5 268 2 3 2 23 4 247 3 1 3 On pourrait poursuivre la comparaison des réseaux de B et de C jusqu’aux voisins indirects comme nous l’avons fait pour A et B. Outre que cet exercice serait fastidieux compte tenu du nombre de nœuds, nous avons déjà montré avec A et B que la combinatoire est telle qu’il est aisé de trouver des réseaux égocentrés avec des caractéristiques statistiques identiques mais des formes différentes. Ce qui importe ici réside surtout dans les modalités de sélection des réseaux que nous a permis le calcul des indicateurs. CONCLUSION La constitution d’un vaste corpus de réseaux égocentrés caractérisés par des indicateurs de taille ou de forme nous a permis d’obtenir des éléments de choix d’individus à étudier plus en détail. Nous terminerons en comparant les observations effectuées sur les trois individus que nous avons ainsi choisis, avec l’étude socio-ethnographique mentionnée plus haut et dont on n’a décrit que les outils. Il est évident que lorsqu’on ne s’appuie que sur une collection d’échanges, si complète soit-elle (ici, un mois de communications de téléphonie mobile), la vision qu’on peut avoir des pratiques de communication individuelles est très partielle. Nous avons pu le confirmer en approchant par plusieurs angles de vue les trois
25
principale tout en ayant relativement peu de communications avec B. Aussi bien pour B que pour C, la personne qui a les plus longues conversations avec ego (en moyenne et au total) n'a pas les plus nombreux échanges et il n'y a pas de corrélation positive entre la centralité des nœuds ou l'appartenance aux cliques et la quantité de leurs échanges avec ego. Bien entendu, derrière la forme des réseaux on trouvera de nombreuses différences entre les pratiques de communication de B et de C. A titre d'exemple, C a 400 échanges avec une durée totale de 28 000 secondes, contre 240 échanges et 12 000 secondes pour B. Un résumé des communications de C est donné dans la table 4. Table 4. Résumé des échanges téléphoniques entre C et ses 10 premiers voisins (triés par la durée totale des échanges) N° nœud Nb. commu- nications avec C Durée totale (secondes) Nb. comm. dans des jours différents Nb. comm. vers C Nb. comm. initiées par C 24 32 7774 17 18 14 22 19 6104 9 9 10 30 84 4360 23 12 72 1 5 2238 3 2 3 7 6 1522 5 2 4 15 5 1055 5 2 3 16 8 767 5 3 5 18 4 362 3 1 3 9 5 268 2 3 2 23 4 247 3 1 3 On pourrait poursuivre la comparaison des réseaux de B et de C jusqu’aux voisins indirects comme nous l’avons fait pour A et B. Outre que cet exercice serait fastidieux compte tenu du nombre de nœuds, nous avons déjà montré avec A et B que la combinatoire est telle qu’il est aisé de trouver des réseaux égocentrés avec des caractéristiques statistiques identiques mais des formes différentes. Ce qui importe ici réside surtout dans les modalités de sélection des réseaux que nous a permis le calcul des indicateurs. CONCLUSION La constitution d’un vaste corpus de réseaux égocentrés caractérisés par des indicateurs de taille ou de forme nous a permis d’obtenir des éléments de choix d’individus à étudier plus en détail. Nous terminerons en comparant les observations effectuées sur les trois individus que nous avons ainsi choisis, avec l’étude socio-ethnographique mentionnée plus haut et dont on n’a décrit que les outils. Il est évident que lorsqu’on ne s’appuie que sur une collection d’échanges, si complète soit-elle (ici, un mois de communications de téléphonie mobile), la vision qu’on peut avoir des pratiques de communication individuelles est très partielle. Nous avons pu le confirmer en approchant par plusieurs angles de vue les trois
Page 22
p. 26 - Bulletin de Méthodologie Sociologique (48 bd. Jourdan, F 75014 Paris), January 2009, N. 101
26
réseaux égocentrés extraits de notre base : par le biais d’indicateurs statistiques (les caractéristiques égocentrées) calculés sur un réseau d’appels, par la forme des réseaux, puis par ces mêmes éléments recalculés en ajoutant aux liens les échanges SMS. Dans tous les cas, des informations non triviales s’ajoutent à l’analyse, et dans tous les cas cette analyse de réseau est très partielle en comparaison de l’observation minutieuse du journal d’appels des individus observés. Bien évidemment, il n’était pas nécessaire de déployer un tel dispositif pour montrer l’importance de multiplier les angles de vue. La méthode proposée ici montre cependant que l’analyse qualitative peut avoir une place non négligeable dans l’étude des très grands réseaux et que dans ce cadre, elle gagnera même en représentativité. En effet, pouvoir comparer des formes de réseaux et des modes de sociabilité dans un échantillon d’individus choisis pour la similarité de leurs caractéristiques égocentrées permet d’explorer la grande diversité combinatoire de ces réseaux. Un des apports les plus évidents de ce dispositif est donc de montrer que le réseau peut difficilement se réduire à une collection d’indicateurs, puisque sous des caractéristiques numériquement identiques peuvent se cacher des formes de réseaux sensiblement différentes. Pour résumer cette idée en bouclant une dernière fois sur l’enquête sur les familles populaires de Granjon et al, nos deux études se rejoignent sur l’objectif de dépasser les moyennes en montrant la complexité des sociabilités. Leur choix de s’intéresser aux familles populaires peut se transposer, dans le cadre que nous avons défini ici, en un choix de nœuds ayant peu de voisins, habituellement « noyés » dans une distribution en loi de puissance, voire éliminés d’emblée du réseau par une opération de seuil. Sans chercher à atteindre une sorte d’idéal méthodologique difficile à mettre en œuvre, que serait la confrontation des deux approches (grands réseaux et enquête ethnographique) sur un même échantillon d’individus, les données dont nous disposons nous permettraient déjà de faire un pas supplémentaire en tentant de reconstituer des réseaux par foyer, les communications entre individus d’un même foyer pouvant souvent être identifiées avec un bon degré de confiance à partir de leurs caractéristiques de fréquence et de durée19, comme il l’a été suggéré dans nos exemples. Plus généralement, dans chacun des trois exemples décrits se laisse entrevoir la nécessité, pour aller plus loin, d’une approche « multicentrée », comparant les réseaux de deux ou trois correspondants apparemment très proches. On peut également imaginer d’élargir encore le cercle focal en intégrant tous les nœuds d’un groupe préalablement identifié sur un réseau égocentré. D’autres perspectives sont envisageables en utilisant le cadre méthodologique décrit ici. La discussion autour de la mesure de densité en est un exemple caractéristique. D’une manière générale, des grands corpus de réseaux pourraient permettre de clarifier les modalités de comparaison de réseaux de tailles disparates. Enfin, la comparaison systématique (donc à grande échelle) de réseaux égocentrés, qu’ils soient ou non de tailles semblables, doit pouvoir intégrer une composante qualitative. C’est un réel défi, pour l’analyse de réseaux comme pour l’algorithmique des graphes, que de mettre au point des outils pour déterminer si 19 de Bailliencourt et al. 2007.
26
réseaux égocentrés extraits de notre base : par le biais d’indicateurs statistiques (les caractéristiques égocentrées) calculés sur un réseau d’appels, par la forme des réseaux, puis par ces mêmes éléments recalculés en ajoutant aux liens les échanges SMS. Dans tous les cas, des informations non triviales s’ajoutent à l’analyse, et dans tous les cas cette analyse de réseau est très partielle en comparaison de l’observation minutieuse du journal d’appels des individus observés. Bien évidemment, il n’était pas nécessaire de déployer un tel dispositif pour montrer l’importance de multiplier les angles de vue. La méthode proposée ici montre cependant que l’analyse qualitative peut avoir une place non négligeable dans l’étude des très grands réseaux et que dans ce cadre, elle gagnera même en représentativité. En effet, pouvoir comparer des formes de réseaux et des modes de sociabilité dans un échantillon d’individus choisis pour la similarité de leurs caractéristiques égocentrées permet d’explorer la grande diversité combinatoire de ces réseaux. Un des apports les plus évidents de ce dispositif est donc de montrer que le réseau peut difficilement se réduire à une collection d’indicateurs, puisque sous des caractéristiques numériquement identiques peuvent se cacher des formes de réseaux sensiblement différentes. Pour résumer cette idée en bouclant une dernière fois sur l’enquête sur les familles populaires de Granjon et al, nos deux études se rejoignent sur l’objectif de dépasser les moyennes en montrant la complexité des sociabilités. Leur choix de s’intéresser aux familles populaires peut se transposer, dans le cadre que nous avons défini ici, en un choix de nœuds ayant peu de voisins, habituellement « noyés » dans une distribution en loi de puissance, voire éliminés d’emblée du réseau par une opération de seuil. Sans chercher à atteindre une sorte d’idéal méthodologique difficile à mettre en œuvre, que serait la confrontation des deux approches (grands réseaux et enquête ethnographique) sur un même échantillon d’individus, les données dont nous disposons nous permettraient déjà de faire un pas supplémentaire en tentant de reconstituer des réseaux par foyer, les communications entre individus d’un même foyer pouvant souvent être identifiées avec un bon degré de confiance à partir de leurs caractéristiques de fréquence et de durée19, comme il l’a été suggéré dans nos exemples. Plus généralement, dans chacun des trois exemples décrits se laisse entrevoir la nécessité, pour aller plus loin, d’une approche « multicentrée », comparant les réseaux de deux ou trois correspondants apparemment très proches. On peut également imaginer d’élargir encore le cercle focal en intégrant tous les nœuds d’un groupe préalablement identifié sur un réseau égocentré. D’autres perspectives sont envisageables en utilisant le cadre méthodologique décrit ici. La discussion autour de la mesure de densité en est un exemple caractéristique. D’une manière générale, des grands corpus de réseaux pourraient permettre de clarifier les modalités de comparaison de réseaux de tailles disparates. Enfin, la comparaison systématique (donc à grande échelle) de réseaux égocentrés, qu’ils soient ou non de tailles semblables, doit pouvoir intégrer une composante qualitative. C’est un réel défi, pour l’analyse de réseaux comme pour l’algorithmique des graphes, que de mettre au point des outils pour déterminer si 19 de Bailliencourt et al. 2007.
Page 23
Bulletin de Méthodologie Sociologique (48 bd. Jourdan, F 75014 Paris), January 2009, N. 101 - p. 27
27
deux réseaux « se ressemblent », non au sens de leurs propriétés statistiques (nous avons vu que ce n’est pas suffisant), plutôt au sens d’une similarité qualitative appréciable « à l’œil nu » par le chercheur mais dont la définition resterait à inventer. BIBLIOGRAPHIE M. Allen, « The identification of interlock groups in large corporate networks: convergent validation using divergent techniques, Social Networks, 4, 1982. T. de Bailliencourt, T. Beauvisage, Z. Smoreda, « La communication interpersonnelle face a la multiplication des technologies de contact », Réseaux, vol. 25, n.°145-146, 2007. D. Cardon et C. Prieur, « Les réseaux de relations sur Internet : un objet de recherche pour l’informatique et les sciences sociales » in C. Brossaud, B. Reber, dir., Humanités numériques 1. Nouvelles technologie cognitives et épistémologie, Paris, Lavoisier, 2007. D. Cardon et F. Granjon, « Social networks and cultural practices. A case study of young avid screen users in France », Social Networks, 27(4), 2005. M. Eve, « Deux traditions dans l’analyse des réseaux », Réseaux, n° 115, 2002. C. Faugeron et K. Van Meter, « Analysis of deviance and of social classes — The impact of methodological research », Quality and Quantity, Volume 24, Number 3, pp. 297-322, 1990. M. Girvan et M. Newman, « Community structure in social and biological networks », Proceedings of Natl. Acad. Sci. USA 99, 2002. F. Granjon, C. Blanco, G. Le Saulnier, G. Mercier, « Sociabilités et familles populaires. Une socio-ethnographie de la mise en contact », Réseaux, vol. 25, n° 145-146, 2007. F. Granjon et B. Lelong, « Capital social, stratifications et technologies de l’information et de la communication. Une revue des travaux français et anglo-saxons », Réseaux, vol. 24, n° 139, 2006. A. S. Klovdahl, J. Potterat, D. Woodhouse, J. Muth, S. Muth, W. W. Darrow, « HIV infection in an urban social network : a progress report », Bulletin de Méthodologie Sociologique, N. 36, 1992. M. Gribaudi, « Avant-propos » in M. Gribaudi, dir., Espaces, temporalités, stratifications : Exercices sur les réseaux sociaux, éditions de l’EHESS, 1998 (a).
27
deux réseaux « se ressemblent », non au sens de leurs propriétés statistiques (nous avons vu que ce n’est pas suffisant), plutôt au sens d’une similarité qualitative appréciable « à l’œil nu » par le chercheur mais dont la définition resterait à inventer. BIBLIOGRAPHIE M. Allen, « The identification of interlock groups in large corporate networks: convergent validation using divergent techniques, Social Networks, 4, 1982. T. de Bailliencourt, T. Beauvisage, Z. Smoreda, « La communication interpersonnelle face a la multiplication des technologies de contact », Réseaux, vol. 25, n.°145-146, 2007. D. Cardon et C. Prieur, « Les réseaux de relations sur Internet : un objet de recherche pour l’informatique et les sciences sociales » in C. Brossaud, B. Reber, dir., Humanités numériques 1. Nouvelles technologie cognitives et épistémologie, Paris, Lavoisier, 2007. D. Cardon et F. Granjon, « Social networks and cultural practices. A case study of young avid screen users in France », Social Networks, 27(4), 2005. M. Eve, « Deux traditions dans l’analyse des réseaux », Réseaux, n° 115, 2002. C. Faugeron et K. Van Meter, « Analysis of deviance and of social classes — The impact of methodological research », Quality and Quantity, Volume 24, Number 3, pp. 297-322, 1990. M. Girvan et M. Newman, « Community structure in social and biological networks », Proceedings of Natl. Acad. Sci. USA 99, 2002. F. Granjon, C. Blanco, G. Le Saulnier, G. Mercier, « Sociabilités et familles populaires. Une socio-ethnographie de la mise en contact », Réseaux, vol. 25, n° 145-146, 2007. F. Granjon et B. Lelong, « Capital social, stratifications et technologies de l’information et de la communication. Une revue des travaux français et anglo-saxons », Réseaux, vol. 24, n° 139, 2006. A. S. Klovdahl, J. Potterat, D. Woodhouse, J. Muth, S. Muth, W. W. Darrow, « HIV infection in an urban social network : a progress report », Bulletin de Méthodologie Sociologique, N. 36, 1992. M. Gribaudi, « Avant-propos » in M. Gribaudi, dir., Espaces, temporalités, stratifications : Exercices sur les réseaux sociaux, éditions de l’EHESS, 1998 (a).
Page 24
p. 28 - Bulletin de Méthodologie Sociologique (48 bd. Jourdan, F 75014 Paris), January 2009, N. 101
28
M. Gribaudi, « Réseaux égocentrés et inscriptions sociales. Continuités et discontinuités dans les formes de structuration de l’espace parisien » in M. Gribaudi, dir., Espaces, temporalités, stratifications : Exercices sur les réseaux sociaux, éditions de l’EHESS, 1998 (b). A. Klovdahl, « Large-scale social networks: Theory, observation and inférence », Summer Meetings of the American Mathematical Society, 1980. M. Latapy, « Theory and Practice of Triangle Problems in Very Large (Sparse (Power-Law)) Graphs », Theoretical Computer Science, à paraître, 2008. C. Licoppe, « Sociabilité et technologies de communication : deux modalités d'entretien des liens interpersonnels dans le contexte du déploiement des dispositifs de communications », Réseaux, n° 112-113, 2002. F. Lorrain et H. White, « Structural Equivalence of Individuals in Social Networks », Journal of Mathematical Sociology, vol. 1, 1971. F. de Singly, Le Soi, le couple et la famille, Paris, Armand Colin, 2005. D. J. Watts et S. H. Strogatz. « Collective dynamics of small-world networks », Nature, 393 :440–442, 1998.
----------------------------------------
28
M. Gribaudi, « Réseaux égocentrés et inscriptions sociales. Continuités et discontinuités dans les formes de structuration de l’espace parisien » in M. Gribaudi, dir., Espaces, temporalités, stratifications : Exercices sur les réseaux sociaux, éditions de l’EHESS, 1998 (b). A. Klovdahl, « Large-scale social networks: Theory, observation and inférence », Summer Meetings of the American Mathematical Society, 1980. M. Latapy, « Theory and Practice of Triangle Problems in Very Large (Sparse (Power-Law)) Graphs », Theoretical Computer Science, à paraître, 2008. C. Licoppe, « Sociabilité et technologies de communication : deux modalités d'entretien des liens interpersonnels dans le contexte du déploiement des dispositifs de communications », Réseaux, n° 112-113, 2002. F. Lorrain et H. White, « Structural Equivalence of Individuals in Social Networks », Journal of Mathematical Sociology, vol. 1, 1971. F. de Singly, Le Soi, le couple et la famille, Paris, Armand Colin, 2005. D. J. Watts et S. H. Strogatz. « Collective dynamics of small-world networks », Nature, 393 :440–442, 1998.
----------------------------------------
Sign up today - FREE
Mendeley saves you time finding and organizing research. Learn more
- All your research in one place
- Add and import papers easily
- Access it anywhere, anytime
Start using Mendeley in seconds!
Readership Statistics
2 Readers on Mendeley
by Discipline
50% Social Sciences
by Academic Status
50% Lecturer
50% Researcher (at a non-Academic Institution)
by Country
100% France


