Seoul Test of Time Award of The Web Conference 2018

Our 2007 paper about the YAGO knowledge base has won the Test of Time Award of the World Wide Web Conference (WWW) 2018.

LTCI News Post

Fabian Suchanek, Professor at Télécom ParisTech, Gjergji Kasneci (SCHUFA Holding AG), and Gerhard Weikum (Max Planck Institute for Informatics) have been granted the 2018 Seoul Test of Time Award by the 27th International World Wide Web Conference (also known as The Web Conference 2018) for their article entitled “YAGO: A Core of Semantic Knowledge Unifying WordNet and Wikipedia”, that was first published and presented in May 2007 at the 16th Web Conference . This award recognizes the authors for their seminal work in creating the knowledge base, YAGO (Yet Another Great Ontology). Their awarded paper accounts for more than 2,468 cites to date. The Seoul Test of Time Award has been annually granted since 2014 to the author/authors of a paper presented at a previous World Wide Web conference that has, as the name suggests, stood the test of time.

YAGO, which is the result of a joint work with the Max Planck Institute, is nowadays one of the largest public knowledge bases created from Wikipedia, with more than 17 million entities and 150 million facts about these entities. Its source code was unveiled in 2017 (see our interview – in French). “YAGO was among the first projects to extract semantic knowledge at large scale from Wikipedia and is one of the pioneering contributors of the web of data, together with DBpedia”, Dame Wendy Hall, Professor at the Web Science Institute at the University of Southampton and Chair of the International World Wide Web Conference Committee (IW3C2), which supervises the Web Conference, said. “YAGO made available a large body of knowledge, samples of which were manually evaluated to show their very high accuracy. In addition to its contribution to knowledge content on the web, YAGO also played a seminal role in weaving a web of linked data by linking to other vocabularies including the DBpedia ontology and WordNet.”

The Web Conference is a prestigious yearly international conference, that was first organized in 1994, on the topic of the future directions of the world wide web. Three awards, in addition to the Seoul Test of Time, are granted. In 2018, Sergey Brin and Larry Page, who both founded Google, won the First Award for their paper entitled “The Anatomy of a Large-Scale Hypertextual Web Search Engine”, that was first presented at the 2015 Web Conference.

LTCI Chercheur en vue : Fabian Suchanek

Article appeared at LTCI Chercheur en vue on 

Fabian Suchanek

Fabian Suchanek est professeur à Télécom ParisTech. Il a rejoint l’école en 2013. Au sein du LTCI, le travail du chercheur porte sur les graphes et plus particulièrement sur les bases de connaissance. Il s’occupe à la fois de la construction automatique des bases de connaissance mais aussi de la fouille de données dans ces bases. Cette fouille de données trouve des motifs ; par exemple, si une personne est mariée et réside dans une certaine ville, il est fort probable que son époux/se y vive également etc. La fouille de données peut également trouver quels sont les attributs obligatoires d’une classe d’entités (tel que l’âge pour une personne) et quels sont les attributs optionnels (tel que l’époux d’une personne). Et un travail de recherche, mené avec ParisSud, le centre Inra de Montpellier et Inria Rennes, porte sur la fouille de clés, à savoir une clé est une combinaison d’attributs qui identifie une entité de manière unique (pour une personne, cela va être son prénom, son nom et sa date de naissance par exemple). Pour le chercheur, il s’agit à chaque fois d’établir des « contraintes » qui vont servir à nettoyer les bases de données. Fabian Suchanek travaille également sur les trends historiques, en collaboration avec l’Université de Stockholm : ces travaux permettent notamment de tracer l’évolution de l’espérance de vie à travers les âges.

 

Elvis Presley dans la base de connaissance Yago

En parallèle, depuis 2013, Fabian Suchanek a principalement continué à développer la base de connaissance dont il est le fondateur, Yago. Fruit d’une collaboration avec l’Institut Max Planck, celle-ci est aujourd’hui l’une des plus grandes bases publiques de connaissance créée à partir de Wikipédia, et son code source a été dévoilé en 2017, année du dixième anniversaire de sa création (voir notre interview). Le chercheur et son équipe ont par ailleurs été distingués en 2017 par le “Prominent Paper Award”, qui récompense chaque année une publication exceptionnelle en termes de contenu et d’impact de la revue The Artificial Intelligence Journal. Ils travaillent à présent à une nouvelle version de Yago, toujours aux côtés de l’Institut Max Planck.

 

Un extrait de base de connaissance

 

En 2016, le chercheur a travaillé avec l’Université de Montpellier et la start-up Stim, incubée à ParisTech Entrepreneurs, à améliorer la créativité des ordinateurs, afin que ces derniers inventent des concepts et proposent automatiquement de nouvelles idées.

Ses travaux récents incluent également une collaboration avec Inria et Paris-Saclay sur le concept des bases de connaissance privées. Fabian Suchaneck a ainsi participé à l’élaboration d’un système permettant de rapatrier toutes les données des réseaux sociaux sur une base de données privée.

SWERC 2017 (South-Western Europe Regional Contest)

Antoine Amarilli was the Director of SWERC 2017 (South-Western Europe Regional Contest), a prestigious international programming contest organised with the support of the scientific organisation ACM (Association for Computing Machinery) by researchers from Télécom ParisTech and from École Normale Supérieure.

The 2017 edition of the ACM-ICPC-SWERC programming contest ended with the victory of a team from ENS Ulm Paris, followed closely by a team from ETH Zürich. These two teams will represent Southwestern Europe at the World Finals, to be held in Beijing next April. With 76 teams registered and 228 students from 48 universities, the 2017 edition broke participation records. The contestants competed on eleven problems and received one balloon for each solved exercise. More than 300 balloons were distributed.

SWERC 2017 was organized on Nov. 25-26 by Télécom ParisTech and Ecole normale supérieure. The contest was supported by the ICPC Foundation, Criteo Labs, Palantir, Société Générale (Gold sponsors), Télécom ParisTech and Almerys (Silver sponsors), Google and Inria (Bronze sponsors).

LTCI Chercheur en vue : Thomas Bonald

Article appeared at LTCI Chercheur en vue on 

Thomas Bonald

Enseignant-chercheur à Télécom ParisTech depuis 2009, Thomas Bonald  mène ses activités de recherche au sein des laboratoires LTCI et LINCS. Ses travaux portent sur la fouille de graphes, sur les techniques d’apprentissage et sur l’analyse de performance des réseaux et des centres de données.

Les graphes, qui servent à représenter des relations entre tous types d’objets physiques ou virtuels, sont devenus incontournables dans l’analyse des grandes masses de données. Par exemple, l’encyclopédie Wikipedia peut être représentée par un graphe correspondant aux liens hypertextes entre les millions de pages qui la composent ; les ventes réalisées par une entreprise forment un graphe liant produits et clients ; un corpus de textes peut être représenté par un graphe de similarité entre les textes. Pour faciliter diverses tâches de détection, de prédiction et de recommandation sur ces données, il est important d’avoir des représentations compactes des graphes, en associant par exemple à chaque nœud du graphe un point dans un espace métrique de faible dimension. Le chercheur s’intéresse à ce type de représentations, dans le cadre de collaborations avec Inria et Thalès notamment.

Clustering hiérarchique des principaux aéroports internationaux basé sur une représentation spectrale du graphe openflight

 

Un autre axe de recherche de Thomas Bonald concerne l’apprentissage automatique de données multi-variées, comme celles issues de capteurs d’un moteur d’avion ou d’hélicoptère. Comment détecter un état d’usure anormal du moteur et prédire le besoin d’une opération de maintenance ? Diverses techniques sont explorées, comme les réseaux de neurones récurrents. Ces travaux sont menés dans le cadre d’une collaboration avec Safran.

 

Extrait des données d’un vol d’hélicoptère (source : Safran)

Enfin, l’enseignant-chercheur s’intéresse à la performance des réseaux et des centres de données. Il s’agit ici de concevoir des modèles simples mais réalistes du partage dynamique des ressources (bande passante, CPU, RAM, etc.) entre les utilisateurs, afin de proposer des règles de dimensionnement efficaces et de nouveaux algorithmes d’allocation de ressources. Thomas Bonald a publié avec Mathieu Feuillet un livre sur les principales techniques d’analyse de performance des réseaux et a reçu en 2013 la médaille Blondel pour ses travaux sur le sujet, développés notamment dans les laboratoires d’Orange. Ses travaux actuels sont menés dans le cadre de collaborations avec Nokia et Cisco.