Détections de groupes d’amis dans des réseaux sociaux ou le spectral clustering

Le prochain séminaire Aromaths aura lieu le mercredi 21 mars à 18h10 en salle 15-25-104 et sera présenté par Tabea Rebafka.

Sujets abordés : Algèbre linéaire • Décomposition spectrale • Graphe • Tableau de données

Résumé.

Un réseau social comme facebook est un très grand graphe. Pour l’analyser et comprendre les intéractions entre les individus, il est utile de regrouper les individus en des groupes d’amis. On appelle clustering la recherche d’un partitionnement des individus en des groupes dont les membres sont très connectés entre eux, appelés des communautés ou des clusters. Différentes méthodes de clustering existent dans la littérature, et nous en présenterons une des plus utilisées en pratique : le spectral clustering. Cette méthode repose sur une décomposition spectrale de la matrice d’adjacence du graphe (ou plus exactement de sa matrice laplacienne). L’idée est de projeter les données dans un espace de plus petite dimension dans lequel les différents clusters sont plus facile à détecter. Les résultats et propriétés principaux sur lesquels repose l’algorithme se démontrent avec des outils de base de l’algèbre linéaire. Plus généralement, on peut utiliser le spectral clustering pour partitionner les points d’un tableau de données classique en des groupes de points similaires. Ainsi, le spectral clustering se prête à l’utilisation sur des données de grande dimension de nature assez variée, issues d’internet ou d’autres domaines comme la médecine, l’économie, la sécurité.

 

Publicités

Le poids des preuves: réseaux bayésiens dans le contexte judiciaire

Le prochain séminaire Aromaths aura lieu le mercredi 21 février à 18h10 en salle 15-25-104 et sera présenté par Leila Schneps.

Sujets abordés : probabilités, réseaux bayésiens, erreurs judiciaires

Résumé.

Lors d’un procès, les avocats des deux parties présentent de multiples preuves de tous types,  dont certaines de nature objective, purement scientifique, comme par exemple l’analyse d’une trace chimique ou biologique laissée sur la scène du crime. Le jury est confronté à la tâche d’évaluer le poids de chaque preuve, pour parvenir à une estimation finale du poids de la totalité des preuves, qui doit être extrêmement convaincant pour justifier une condamnation. Mais de nombreuses études, étayées par des cas d’erreurs judiciaires reconnues, ont montré qu’il est très difficile d’estimer correctement le poids d’une preuve scientifique, et encore plus d’en combiner plusieurs, qui peuvent éventuellement être dépendantes les unes des autres.
Les réseaux bayésiens peuvent aider à structurer les preuves et permettre de donner une évaluation fiable de leur poids réel. Le théorème de Bayes permet de recalculer la probabilité d’un événement quand un nouveau renseignement est acquis. Les réseaux bayésiens permettent d’appliquer le théorème de Bayes plusieurs fois simultanément, dans le but de recalculer une probabilité donnée (en général celle de la culpabilité de l’accusé) après l’acquisition du plusieurs preuves, en particulier des résultats d’analyses scientifiques. Nous
montrerons sur des exemples tirés de vrais cas combien les résultats fournis par notre intuition peuvent être loin de la vérité mathématique.

 

L’isomorphisme Curry Howard, une révolution mathématique dans le langage mathématique

Le prochain séminaire Aromaths aura lieu le mercredi 24 janvier à 18h10 en salle 15-25-104 et sera présenté par Antonio Mosca.

Sujets abordés : logique, calcul, langage mathématique, preuves, programmes, linguistique, rhétorique, biais cognitifs, pseudo-sciences 

Résumé.

Les histoires de la logique (cf. la bande dessinée Logicomix) , ainsi que les cours universitaires de logique, écrivent le plus souvent leur fin mot avec le théorème d’incomplétude de Gödel. Ce dernier marque en vérité le début d’une toute autre histoire, car il met en avant le clivage (fondamental, car caractérisant en linguistique tout vrai langage) entre ce qu’on fait – les constructions – et ce qu’on dit qu’on fait – les démonstrations -dans et par les formalismes mathématiques. Les théoriciens de la démonstration et les théoriciens du calcul, après avoir vu leurs chemins se séparer ainsi, découvrent toutefois, et établissent, dans les années 1960, une stricte identité entre les preuves et les programmes, et jettent par là un pont tout à fait inattendu entre le « niveau logique » et le « niveau algorithmique » du langage mathématique. Cette correspondance assez spectaculaire, connue comme isomorphisme Curry-Howard, représente un véritable coup de théâtre épistémologique, permettant de relire de façon critique le récit de l’histoire de la logique telle qu’il est souvent fait par et pour les « logiciens philosophes », ainsi que la révolution informatique dont nous faisons aujourd’hui l’expérience.

On verra aussi comment l’isomorphisme Curry-Howard permet d’établir des ponts entre linguistique et mathématique, et comment ce nouveau regard sur la logique peut nous aider à analyser de façon critique les dérives causées par les dynamiques discursives collectives pseudo-logiques (fake news, conspirationnismes, pseudo-sciences, etc).

Géométrie Arithmétique

Le prochain séminaire Aromaths aura lieu le mercredi 20 décembre à 18h10 en salle 15-25-104 et sera présenté par Ariane Mézard.

Sujets abordés : arithmétique, convexité et connexité, intégrale, théorème chinois

Résumé.

L’arithmétique, c’est compter, résoudre des problèmes avec des entiers. La géométrie consiste à étudier, représenter des objets de l’espace. La géométrie permet de résoudre des équations arithmétiques et d’en formuler de nouvelles. De l’arithmétique émergent des structures géométriques aux propriétés contre-intuitives.

Mathémusique

Le prochain séminaire Aromaths aura lieu le mercredi 29 novembre octobre à 18h10 en salle 15-25-104 et sera présenté par Pierre Monmarché.

Sujets abordés : équation différentielles, équations des ondes, transformée de Fourier, valeurs propres

Résumé.

En partant uniquement de l’équation de Newton (masse fois accélération égal somme des forces), et avec un peu d’équations différentielles, on peut comprendre pourquoi il y a très exactement 12 notes de musique, et pourquoi certaines d’entre elles sont regroupées dans une même gamme, ou dans un même accord (et pourquoi les musiques militaires, le chant grégorien et les chansons de Patrick Sébastien sont ce qu’ils sont). On voit aussi que les fréquences sonores auxquelles la Castafiore peut faire éclater un verre sont données par les valeurs propres d’une grande matrice.

La géométrie intégrale ou comment mesurer sans toucher

Le prochain séminaire Aromaths aura lieu le mercredi 25 octobre à 18h10 en salle 15-25-104 et sera présenté par Julien Marché.

Sujets abordés : géométrie, intégrales multiples, théorème de Fubini

Résumé.

Si on se donne une courbe dans le plan, quel est, parmi toutes les droites du plan, le nombre moyen de points d’intersections de cette droite avec la courbe? Crofton a répondu à cette question à la fin du 19ème siècle, parmi bien d’autres qui forment ce qu’on appelle la géométrie intégrale, riche d’applications en mathématiques pures comme appliquées (tomographie). Mathématiquement, il nous faudra comprendre comment intégrer des fonctions non plus sur des intervalles ou des ouverts de l’espace euclidien mais sur l’ensemble des droites (ou pire, des isométries). Au menu, théorème de Fubini et changements de variables pour de jolis théorèmes de géométrie.

Le processus du restaurant chinois

Aromaths fait sa rentrée ! Le mercredi 20 septembre à 10h45 dans l’Amphi 15 et sera présenté par Amaury Lambert.

Sujets abordés : probabilités, combinatoire, théorie des nombres.

Résumé.

Dans un restaurant très vaste déjà occupé par n convives, un nouveau client entre et choisit de s’asseoir à une table inoccupée avec probabilité a/(a+n) et sinon sélectionne un voisin uniformément au hasard. Que se passe-t-il lorsque n est grand, par exemple pour le nombre de tables occupées ? Pour le nombre de convives assis à la table qui en accueille le plus grand nombre ? Pour le nombre de convives assis à celle où s’est attablé le premier client ? Nous verrons apparaître à la limite un objet aléatoire appelé distribution de Poisson-Dirichlet et en détaillerons quelques applications, notamment en génétique des populations (distribution des fréquences alléliques), en combinatoire (distribution des tailles des cycles d’une grande permutation aléatoire), en théorie des nombres (distribution des facteurs premiers de grands nombres aléatoires) et en statistique (inférence bayésienne non paramétrique).