Intelligences Journal revue en intelligence économique
[English version]

La méthode du centroïde du réseau tecno-scientifique et le paramètre de la centralité des nœuds : application en veille stratégique cientifique

José Pino-Díaz, Chiadmi-Garcia Laila, Ruíz-Baños Rosario et Bailón-Moreno Rafael

Résumé

On présente la méthode du centroïde d'application en cartographie des connaissances stratégiques. Les ensembles documentaires scientifiques d'un domaine de recherche sont visualisés comme réseaux tecno-scientifiques dans lesquels les liaisons indiquent les relations d'association existantes entre les nœuds. L'algorithme de Kamada Kaway (KK) modélise les graphes des réseaux tel qui si ceux-ci étaient des systèmes physiques formés par des objets lient par des forces. L’algorihtme KK agit sur ces systèmes pour obtenir son état d'énergie minimale. En cet état la distance euclidienne entre les nœuds est proportionnelle à sa distance géodésique. La distance euclidienne de chaque nœud au centroïde du graphe KK est mesure de sa centralité (le paramètre qui mesure le degré de similitude du nœud avec le réseau tecno-scientifique). En éliminant dans le graphe KK les liaisons faibles on obtient les subréseaux stratégiques. Les nœuds des subréseaux stratégiques sont caractérisés par deux paramètres : la centralité régularisée et la densité moyenne régularisée (le paramètre qui mesure la forteresse moyenne des liaisons du subréseau). Ces deux paramètres sont employés dans l'analyse et la cartographie stratégiques du réseau tecno-scientifique. On présente les résultats d’application de la méthode a la veille scientifique du domaine de la recherche espagnole sur les espaces naturels protégés pendant 1981-2005 dans les bases de données IEDCYT (ICYT, ISOC et IME). Ce type d'études a une grande utilité pour la prise de décisions en Politique Scientifique et en Évaluation de la Science et de la Technologie.

Abstract

This paper explains the centroid method of techno-scientific networks. The algorithm KK shapes techno-scientific networks in order to obtain its state of minimun energy. In this state the Euclidean distance between the actors (ANT theory) is proportional to its geodetic distance. Two parameters are employed at the strategic cartography of the techno-scientific network: The Euclidean distance from each actor to the centroid, which measures his affinity with the study topics; and the average density of the sub-network, which measures the strength of the internal edges. We show the results (ranking and maps of strategic actors) of application of the centroid method to the Spanish research on the protected areas during 1981-2005. These maps are of great utility for decision making in Scientific Policy and Evaluation of Science and Technology.

strategic scientific and technological scouting, KDD, information mapping, knowledge mapping, information visualisation, scientific and technological networks, strategic knowledge maps, strategic importance maps, SK maps, SI maps, decision-making

Mots-clés

vigilancia estratégica científica y tecnológica, ingeniería del conocimiento, cartografía de la información, cartografía de los conocimientos, visualización de la información, toma de decisiones, redes tecno-científicas, mapas de conocimiento estratégico de redes tecno-científicas, mapas CERT, mapas de importancia estratégica, mapas IVECT, veille stratégique scientifique et technologique, ingénierie des connaissances, cartographie de l’information, cartographie des connaissances, visualisation de l’information, prise de décisions, réseaux tecno-scientifiques, cartes des connaissances stratégiques de réseaux tecno-scientifiques, cartes CSRT, cartes d’importance stratégique, cartes IVSST

Texte intégral

Introduction

Le développement durant les années quatre-vingt de la Sociologie des Sciences et des Techniques, Sociologie de la Traduction ou Sociologie des Associations par Michel Callon (1989) et Bruno Latour (1983) (Centre de Sociologie de l'Innovation de Paris) à partir de ressources conceptuelles, entre autres, de Michel Serres (Philosophie des Sciences) et de David Bloor (Sociologie de la Connaissance), a son exposant dans la Théorie Acteur-Réseau (ANT en anglais), selon lequel dans la construction sociale d'un fait scientifique interviennent des organismes humains et non humains et le processus continu de transformation ou traduction des relations établies entre de tels organismes il donne comme résultat un réseau dans changement continu ; comprise celle-ci comme une maille formée par des nœuds (acteurs) reliés entre eux (relations qui établissent entre eux).

Dans la veille stratégique de réseaux tecno-scientifiques on unit différentes disciplines : la création de connaissance à partir des documents des bases de données (Knowledge Discovery in Databases-KDD) (Han et Kamber, 2001 ; He, 1999), l’ingénierie de la connaissance (Callon, Courtial, et Turner, 1991 ; Polanco, 1997) et la visualisation de l'information (Old, 2002).

En veille stratégique les groupements des nœuds ou des subréseaux se caractérisent avec les paramètres centralité et densité. Le paramètre centralité ou indice de cohésion externe est une mesure indicative de la position du subréseau dans l'ensemble du réseau, et représente le degré de relation du subréseau avec les autres. On peut aussi interpréter comme mesure de la proximité moyenne du subréseau avec le centroïde du réseau ; ainsi, un subréseau avec une haute centralité moyenne est un subréseau dans laquelle ses nœuds sont proches au centroïde, c'est-à-dire ont une grande affinité avec ce qui est la thématique du réseau. Le paramètre densité ou indice de cohésion interne est une mesure de l'intensité des relations internes dans le subréseau, et représente le degré de développement qu'il possède. Une haute densité est indicative de relations intenses ou durables, qui sont répétées et prolongées dans le temps.

La veille stratégique de réseaux de connaissance on profite de l'existence de systèmes de connaissance (Polanco, 2008). Les systèmes de connaissance sont d'une grande utilité pour les équipements d'intelligence compétitive et de veille technologique puisqu'ils fournissent des rapports, diagrammes, graphiques et cartes de grand appui dans la Prise de décisions (Pino-Díaz et al, 2011).

Objectif

L'objectif de cette recherche est de développer un référentiel d’application dans des cartes stratégiques de réseaux d'acteurs de domaines textuels scientifiques en utilisant la technologie et la méthodologie de l’analyse des graphes et des systèmes d'information géographique, SIG. On construira des cartes stratégiques de réseaux scientifiques, préalablement obtenus de systèmes de connaissance, avec la conviction que la visualisation des cartes 2D et images 3D favorisera la veille scientifique et la prise de décisions.

Matériels et Méthodologie

On a étudié le dominion documentaire formé par les articles sur les espaces naturels protégés des bases de données de l'IEDCYT (ICYT, ISOC et IME), publiés entre 1981 et de 2005 et qui viennent de l'Espagne. Cet ensemble documentaire est composé de : 942 documents, 3595 mots-clés, 1542 auteurs et 223 revues. On a créé l’attribut MCAR, qui associe pour chaque enregistrement ses mots-clés, ses auteurs et sa revue de publication et on a effectué l'analyse avec le système de connaissance Copalred© (Bailón-Moreno, 2003) qui emploie l’analyse des mots associés (Michelet, 1988 ; Law, Bauin, Courtial, et Whittaker, 1988 ; Law et Whittaker, 1992) : on a choisi les nœuds avec présence 5 minimale et les liaisons avec coprésence 3 minimale, ainsi que la taille des subréseaux, entre un minimum de 2 nœuds et d'un maximum de 10 nœuds.

Avec les archives de présences, de coprésences et d'indices d'équivalence obtenus de Copalred, on a tracé le graphe du réseau tecno-scientifique avec le software Pajek (Batagelj & Mrvar, 2010). Pour visualiser le graphe on a employé l'algorithme de Kamada Kaway (1989), en prenant comme options de visualisation : « les valeurs des lignes sont des similitudes » et « lignes de différentes grosseurs ». La valeur de chaque liaison est la valeur de l'indice d’équivalence ou indice d'association des deux nœuds reliés. Les coordonnées (x, y) des nœuds sont obtenues après avoir tracé le graphe du réseau. Celles-ci seront utilisées dans la réalisation de la carte cartographique avec le système d'information géographique.

On a défini le centroïde du réseau (Pino-Díaz et al, in-press) comme le nœud qui se correspond avec le sommet dont ses coordonnées sont les coordonnées moyennes de l'ensemble de sommets du graphe d’énergie minimale ou graphe KK. Le centroïde du réseau équivaut à l'isobarycentre du graphe KK.

Coordonnées du centroíde C :

Image1

On a défini la centralité d'un nœud du réseau comme : a) le paramètre qui mesure le caractère central du nœud en ce qui concerne l'ensemble des nœuds du réseau ; b) le paramètre qui mesure la proximité au centroïde du nœud ; c) le paramètre qui mesure la similitude du nœud avec le centroïde ; et d) le paramètre qui mesure la similitude du nœud avec le objet d’étude du réseau. Sa valeur est obtenue en soustrayant de l'unité la distance euclidienne du nœud au centroïde.

Distance euclidienne du nœud a au centroïde C :

Image2

Centralité du nœud a :

Image3

Pour détecter les groupes ou subréseaux plus importants ou significatifs du réseau tecno-scientifique on a séparé des composants et on a effectué des éliminations successives des liaisons faibles en ordre croissant de l'indice d'équivalence jusqu'à obtenir des groupes ou des subréseaux avec un nombre de nœuds égal ou inférieur à 10 (taille maximale des groupes ou des subréseaux fixée dans ce travail) ; ainsi la valeur minimale des liaisons présentes dans les subréseaux stratégiques a été fixée en 1819, (l'indice d'équivalence acquiert des valeurs entre 0 et 10.000). Les groupements de subréseaux stratégiques constituent des secteurs stratégiques de recherche.

Avec la méthode du centroïde du réseau on a obtenu la centralité régularisée d’un nœud a en ce qui concerne la valeur maximale de la centralité obtenue pour l'ensemble de nœuds du composant (on l’a nonmé CVSST) ; ainsi la centralité moyenne régularisé à prise valeurs entre 0 et 100, (0 ≤ CVSST ≤ 100).

Image4

On a calculé la centralité moyenne régularisé d’un subréseau A comme la moyenne de la centralité régularisé de ses nœuds.

Image5

Avec la méthode du centroïde on a obtenu la densité moyenne régularisée d’un subréseau comme la moyenne des valeurs des liaisons dans le subréseau, régularisée pour la valeur maximale de densité des subréseaux du composant, on l’a nonmé DVSST ; comme résultat, la densité prend des valeurs entre 0 et 100 (0 ≤ DVSST ≤ 100).

Image6

On a calculé la densité régularisé d’un nœud a du subréseau A comme la valeur de la densité moyenne régularisé du subréseau A.

Avec les valeurs de la centralité moyenne régularisée et de la densité moyenne regularisée des subréseaux on a calculé les rangs ( %) de centralité et de densité et on a dessiné le diagramme stratégique du réseau.

L'indice d'importance stratégique d'un subréseau (IVSST) est le produit d'un constant par la somme des rangs de la centralité et la densité du subréseau. Le valeur du constant est C = 1.00 pour les subréseaux situés dans le quart 1 du diagramme stratégique ; C = 0.75 pour les subréseaux situés dans le quart 2 du diagramme stratégique ; C = 0.50 pour les subréseaux situés dans le quart 3 du diagramme stratégique et C = 0.25 pour les subréseaux situés dans le quart 4 du diagramme stratégique.

Les résultats IVSST obtenus pour les subréseaux stratégiques sont assignés aux nœuds qui les forment, ainsi on a effectué trois classifications ou rankings : Mots-clés IVSST ; Chercheurs IVSST et Revues IVSST.

Pour mesurer l’importance absolue d’un nœud dans le réseau on a calculé le paramètre zVSST ; sa valeur maximale est 200. Il est obtenu en ajoutant les paramètres CVSST et DVSST. Il est employé comme mesure d'altimétrie dans les cartes de connaissance stratégique des réseaux tecno-scientifiques (Cartes CSRT).

La Carte CSRT on l’a construit à partir des coordonnées des nœuds dans le graphe et des paramètres zVSST et IVSST. Les cartes cartographiques de la connaissance stratégique ont été effectuées en employant le système d'information géographique Arcview© 3.2. L'application des concepts de centroïde et de centralité a permis d'obtenir des cartes cartographiques stratégiques dans lesquelles les nœuds et les subréseaux sont faits référence en ce qui concerne le centroïde du réseau. Le centroïde est l'élément central de référence des cartes CSRT. La coordonnée z (paramètre zVSST) des nœuds a permis de visualiser le relief des réseaux en 3D et en réalité virtuelle. Finalement, la position des subréseaux dans le diagramme stratégique du réseau est visualisée dans la carte CSRT au moyen de symboles de différente couleur et forme sur les nœuds. On appelle la carte ainsi obtenue, carte d'importance stratégique du réseau tecno-scientifique, Carte IVSST.

La figure 1 illustre le processus de construction de Cartes stratégiques : Cartes CSRT et Cartes IVSST.

Agrandir metodologia_corregido

Figure 1 : Processus de construction de cartes stratégiques

Résultats

La figure 2 illustre le groupement des subréseaux du composant principal du réseau tecno-scientifique étudié comme exemple dans secteurs stratégiques de recherche.

Agrandir areas

Figure 2 : Secteurs stratégiques de recherche

Avec les valeurs de la centralité moyenne régularisée et de la densité moyenne regularisée des subréseaux on a calculé les rangs ( %) de centralité et de densité et on a dessiné le diagramme stratégique du réseau (Fig. 3).

Agrandir diagrama

Figure 3 : Diagramme stratégiques du réseau de recherche

Les résultats du índice IVSST des subréseaux permettenet de faire un ranking de subréseaux stratégiques (Fig. 4). Une fois que les valeurs IVSST des subréseaux sont assignés aux nœuds qui les forment, on obtient trois classifications ou rankings : Mots-clés IVSST ; Chercheurs IVSST et Revues IVSST.

Agrandir ranking subredes

Figure 4 : Ranking IVSST d’importance stratégique des subréseaux

La figure 5 illustre comme la position des subréseaux dans le diagramme stratégique du réseau est visualisée dans la carte CSRT au moyen de symboles situés sur les nœuds des différents subréseaux (Fig. 5). On apelle la carte ainsi obtenue, carte d'importance stratégique du réseau tecno-scientifique, Carte IVSST.

Agrandir mapa ivect

Figure 5 : Carte IVSST, carte d’importance stratégique du réseau de recherche

Finalement on peut obtenir des images 3D des cartes stratégiques (Fig. 6).

Agrandir image3D

Figure 6 : Image 3D, on peut voir la centralité des subréseaux en ce qui concerne le centroïde et son altitude ou importance absolue (zVSST = CVSST + DVSST)

Conclusions

Pour cartographier la connaissance stratégique on a développé la méthode du centroïde de réseau techno-scientifique et le paramètre de la centralité des nœuds. On a développé la méthode du centroïde d’application dans des cartes stratégiques de réseaux d'acteurs de domaines textuels scientifiques. On a appliqué à l'analyse de données : l’analyse de mots associés, l’analyse de réseaux, l’analyse stratégique et la construction des graphes au moyen de l'algorithme KK et les indices d'équivalence (comme mesure de similitude entre les nœuds).

On a construit des cartes stratégiques de réseaux scientifiques en utilisant la technologie et la méthodologie de l’analyse des graphes et des systèmes d'information géographique, SIG. Les Cartes CSRT et des Cartes IVSST emploient la métaphore visuelle du paysage. Des cartes 2D et images 3D favorisent la veille scientifique et la prise de décisions. On visualise l'information suivante : l'affinité entre les nœuds (mots-clés, chercheurs et revues), les subréseaux et les secteurs stratégiques ; la centralité des nœuds (la proximité au centroïde est une mesure de son degré d’affinité avec le thème général à l'étude), des subréseaux et des secteurs de recherche ; l'importance absolue des nœuds (elle vient indiquée dans les cartes par son l'altitude) et l'importance stratégique des nœuds (elle vient indiquée par symboles qui indiquent leur position dans le diagramme stratégique).

Bibliographie

Bailón-Moreno, R. (2003). Ingeniería del conocimiento y vigilancia tecnológica aplicada a la investigación en el campo de los tensioactivos. Desarrollo de un modelo ciencimétrico unificado. Unpublished Ph. D. thesis, Universidad de Granada, Granada. Spain

Batagelj, V. & Mrvar, A. (2010). Networks/Pajek. Pajek Program for Large Network Analysis.Récupéré 4/avril/2010, [en ligne] http://vlado.fmf.uni-lj.si/pub/networks/pajek/

Callon, M. (1989). La science et ses réseaux : gènese et circulation des faits scientifiques. Paris : Découverte.

Callon, M., Courtial, J. y Turner, W. (1991). La méthode Leximappe : un outil pour l'analyse stratégique du développement scientifique et technique. En B. Vinck, Gestion de la recherche : nouveaux problèmes, nouveaux outils. (207-277). Editions Bruxelles.

Han, J. & Kamber, M. (2001). Data Mining : Concepts and Techniques. (2º ed.) San Francisco ; Morgan Kaufmann Publishers, p. 550.

He, Q., (1999). Knowledge discovery through co-word analysis. Library Trends, 48 (1), 133-159.

Kamada, K. & Kawai, S. (1989). An algorithm for drawing general undirected graphs. Information Processing Letters 31(1), 7-15

Latour, B. (1983). Give me a Laboratory and I Will Raise the World. En K. Knorr-Cetina, & M. Mulkay, Science observed : Perspectives on the Social Study of Science. Londres : Sage.

Law, J., Bauin, S., Courtial, J. P., & Whittaker, J. (1988). Policy and the mapping of scientific change : a co-word analysis of research into enviromental acidification. Scientometrics, 14 (3-4), 251-264.

Law, J. & Whittaker, J. (1992). Mapping acidification research : a test of the co-word method. Scientometrics, 23 (3), 417-461.

Michelet, B. (1988). L'analyse des associations. PhD Thesis. Paris : Université de Paris 7.

Old, L. J. (2002). Information Cartography : Using Your GIS for Non-spatial Data Analysis.Proceedings, GIS 2002 Conference, Indianapolis, IN, Feb. 2002.

Polanco, X. (2008). Transformer l’information en connaissance avec STANALYST. Cadre conceptuel et Modèle. Encontros Bibli : Revista Eletrônica Biblioteconomia y Ciência de la Informaçao, n. esp., 76-91

Polanco, X. (1997). Infometría e Ingeniería del Conocimiento : Exploración de Datos y Análisis de la Información en vista del Descubrimiento de Conocimientos. En Jaramillo, H. ; Albornoz, M. (ed.) El universo de la medición : La perspectiva de la Ciencia y la Tecnología. COLCIENCIAS, CYTED, RICYT. Tercer Mundo Editores. Bogotá, Colombia.

Pino-Díaz, J. (2011). Análisis estratégico de la investigación sobre áreas protegidas en España : ingeniería y cartografía del conocimiento. Unpublished Ph. D. thesis, Universidad de Granada, Granada. Spain. [en ligne] http://hdl.handle.net/10760/15995

Pino-Díaz, J., Jiménez-Contreras, E., Ruíz-Baños, R. et Bailón-Moreno, R., (2011). Evaluación de redes tecnocientíficas : la red española sobre áreas protegidas, según la Web of Science. Revista Española de Documentación Científica. CSIC. 34 (3), 301-333

Pino-Díaz, J., Jiménez-Contreras, E., Ruíz-Baños, R. et Bailón-Moreno, R., (2012). Strategic knowledge maps of the techno-scientific network (SK maps).J. Am. Soc. Inf. Sci., 63 : 796–804. doi : 10.1002/asi.21712

Pour citer ce document

José Pino-Díaz, Chiadmi-Garcia Laila, Ruíz-Baños Rosario et Bailón-Moreno Rafael, «La méthode du centroïde du réseau tecno-scientifique et le paramètre de la centralité des nœuds : application en veille stratégique cientifique », Intelligences Journal [En ligne], Numéro 3 , Numéros en texte intégral , URL : http://lodel.irevues.inist.fr/isj/index.php?id=337

Auteurs

José Pino-Díaz
Departamento de Griego, Estudios Árabes, Lingüística y Documentación. Facultad de Filosofía y Letras. Universidad de Málaga. Campus de Teatinos. 29071 – Málaga (Espagne)
Chiadmi-Garcia Laila
Departamento de Ingeniería Química. Facultad de Ciencias. Universidad de Granada. 18071 – Granada (Espagne)
Ruíz-Baños Rosario
Departamento de Biblioteconomía. Facultad de Comunicación y Documentación. Universidad de Granada. Colegio Máximo de Cartuja. 18071 – Granada (Espagne)
Bailón-Moreno Rafael
Departamento de Ingeniería Química. Facultad de Ciencias. Universidad de Granada. 18071 – Granada (Espagne)