The objective of this workshop is to bring together people from industry and academia for presenting and discussing the most recent learning techniques based on graphs, from both theoretical and practical perspectives.
Fabian Suchanek, Professor at Télécom ParisTech, Gjergji Kasneci (SCHUFA Holding AG), and Gerhard Weikum (Max Planck Institute for Informatics) have been granted the 2018 Seoul Test of Time Award by the 27th International World Wide Web Conference (also known as The Web Conference 2018) for their article entitled “YAGO: A Core of Semantic Knowledge Unifying WordNet and Wikipedia”, that was first published and presented in May 2007 at the 16th Web Conference . This award recognizes the authors for their seminal work in creating the knowledge base, YAGO (Yet Another Great Ontology). Their awarded paper accounts for more than 2,468 cites to date. The Seoul Test of Time Award has been annually granted since 2014 to the author/authors of a paper presented at a previous World Wide Web conference that has, as the name suggests, stood the test of time.
YAGO, which is the result of a joint work with the Max Planck Institute, is nowadays one of the largest public knowledge bases created from Wikipedia, with more than 17 million entities and 150 million facts about these entities. Its source code was unveiled in 2017 (see our interview – in French). “YAGO was among the first projects to extract semantic knowledge at large scale from Wikipedia and is one of the pioneering contributors of the web of data, together with DBpedia”, Dame Wendy Hall, Professor at the Web Science Institute at the University of Southampton and Chair of the International World Wide Web Conference Committee (IW3C2), which supervises the Web Conference, said. “YAGO made available a large body of knowledge, samples of which were manually evaluated to show their very high accuracy. In addition to its contribution to knowledge content on the web, YAGO also played a seminal role in weaving a web of linked data by linking to other vocabularies including the DBpedia ontology and WordNet.”
The Web Conference is a prestigious yearly international conference, that was first organized in 1994, on the topic of the future directions of the world wide web. Three awards, in addition to the Seoul Test of Time, are granted. In 2018, Sergey Brin and Larry Page, who both founded Google, won the First Award for their paper entitled “The Anatomy of a Large-Scale Hypertextual Web Search Engine”, that was first presented at the 2015 Web Conference.
Fabian Suchanek est professeur à Télécom ParisTech. Il a rejoint l’école en 2013. Au sein du LTCI, le travail du chercheur porte sur les graphes et plus particulièrement sur les bases de connaissance. Il s’occupe à la fois de la construction automatique des bases de connaissance mais aussi de la fouille de données dans ces bases. Cette fouille de données trouve des motifs ; par exemple, si une personne est mariée et réside dans une certaine ville, il est fort probable que son époux/se y vive également etc. La fouille de données peut également trouver quels sont les attributs obligatoires d’une classe d’entités (tel que l’âge pour une personne) et quels sont les attributs optionnels (tel que l’époux d’une personne). Et un travail de recherche, mené avec ParisSud, le centre Inra de Montpellier et Inria Rennes, porte sur la fouille de clés, à savoir une clé est une combinaison d’attributs qui identifie une entité de manière unique (pour une personne, cela va être son prénom, son nom et sa date de naissance par exemple). Pour le chercheur, il s’agit à chaque fois d’établir des « contraintes » qui vont servir à nettoyer les bases de données. Fabian Suchanek travaille également sur les trends historiques, en collaboration avec l’Université de Stockholm : ces travaux permettent notamment de tracer l’évolution de l’espérance de vie à travers les âges.
En parallèle, depuis 2013, Fabian Suchanek a principalement continué à développer la base de connaissance dont il est le fondateur, Yago. Fruit d’une collaboration avec l’Institut Max Planck, celle-ci est aujourd’hui l’une des plus grandes bases publiques de connaissance créée à partir de Wikipédia, et son code source a été dévoilé en 2017, année du dixième anniversaire de sa création (voir notre interview). Le chercheur et son équipe ont par ailleurs été distingués en 2017 par le “Prominent Paper Award”, qui récompense chaque année une publication exceptionnelle en termes de contenu et d’impact de la revue The Artificial Intelligence Journal. Ils travaillent à présent à une nouvelle version de Yago, toujours aux côtés de l’Institut Max Planck.
En 2016, le chercheur a travaillé avec l’Université de Montpellier et la start-up Stim, incubée à ParisTech Entrepreneurs, à améliorer la créativité des ordinateurs, afin que ces derniers inventent des concepts et proposent automatiquement de nouvelles idées.
Ses travaux récents incluent également une collaboration avec Inria et Paris-Saclay sur le concept des bases de connaissance privées. Fabian Suchaneck a ainsi participé à l’élaboration d’un système permettant de rapatrier toutes les données des réseaux sociaux sur une base de données privée.
Antoine Amarilli was the Director of SWERC 2017 (South-Western Europe Regional Contest), a prestigious international programming contest organised with the support of the scientific organisation ACM (Association for Computing Machinery) by researchers from Télécom ParisTech and from École Normale Supérieure.
The 2017 edition of the ACM-ICPC-SWERC programming contest ended with the victory of a team from ENS Ulm Paris, followed closely by a team from ETH Zürich. These two teams will represent Southwestern Europe at the World Finals, to be held in Beijing next April. With 76 teams registered and 228 students from 48 universities, the 2017 edition broke participation records. The contestants competed on eleven problems and received one balloon for each solved exercise. More than 300 balloons were distributed.
SWERC 2017 was organized on Nov. 25-26 by Télécom ParisTech and Ecole normale supérieure. The contest was supported by the ICPC Foundation, Criteo Labs, Palantir, Société Générale (Gold sponsors), Télécom ParisTech and Almerys (Silver sponsors), Google and Inria (Bronze sponsors).
Enseignant-chercheur à Télécom ParisTech depuis 2009, Thomas Bonald mène ses activités de recherche au sein des laboratoires LTCI et LINCS. Ses travaux portent sur la fouille de graphes, sur les techniques d’apprentissage et sur l’analyse de performance des réseaux et des centres de données.
Les graphes, qui servent à représenter des relations entre tous types d’objets physiques ou virtuels, sont devenus incontournables dans l’analyse des grandes masses de données. Par exemple, l’encyclopédie Wikipedia peut être représentée par un graphe correspondant aux liens hypertextes entre les millions de pages qui la composent ; les ventes réalisées par une entreprise forment un graphe liant produits et clients ; un corpus de textes peut être représenté par un graphe de similarité entre les textes. Pour faciliter diverses tâches de détection, de prédiction et de recommandation sur ces données, il est important d’avoir des représentations compactes des graphes, en associant par exemple à chaque nœud du graphe un point dans un espace métrique de faible dimension. Le chercheur s’intéresse à ce type de représentations, dans le cadre de collaborations avec Inria et Thalès notamment.
Un autre axe de recherche de Thomas Bonald concerne l’apprentissage automatique de données multi-variées, comme celles issues de capteurs d’un moteur d’avion ou d’hélicoptère. Comment détecter un état d’usure anormal du moteur et prédire le besoin d’une opération de maintenance ? Diverses techniques sont explorées, comme les réseaux de neurones récurrents. Ces travaux sont menés dans le cadre d’une collaboration avec Safran.
Enfin, l’enseignant-chercheur s’intéresse à la performance des réseaux et des centres de données. Il s’agit ici de concevoir des modèles simples mais réalistes du partage dynamique des ressources (bande passante, CPU, RAM, etc.) entre les utilisateurs, afin de proposer des règles de dimensionnement efficaces et de nouveaux algorithmes d’allocation de ressources. Thomas Bonald a publié avec Mathieu Feuillet un livre sur les principales techniques d’analyse de performance des réseaux et a reçu en 2013 la médaille Blondel pour ses travaux sur le sujet, développés notamment dans les laboratoires d’Orange. Ses travaux actuels sont menés dans le cadre de collaborations avec Nokia et Cisco.