Nous saurons ce que nous nœuds, nous allons grok ce que nous avons représenté graphiquement: Neo4j cloue l’apprentissage automatique de graphes à l’atelier de science des données

par L'équipe de Comparaland · 20 octobre 2020

Neo4j a ajouté des représentations graphiques à son atelier d’apprentissage automatique dans l’espoir que les scientifiques des données utilisant sa base de données de graphiques gagneront en productivité.

La version 1.4 de l’atelier Graph Data Science (GDS) a été déployée aujourd’hui. Il est similaire à des outils tels que H2O.ai, mais spécifiquement pour les bases de données de graphes, et prend désormais en charge les «plongements», notamment node2Vec, FastRP et GraphSAGE, pour aider les data scientists à construire plus rapidement des modèles prédictifs.

Emil Eifrem, fondateur et PDG de Neo4j, a déclaré Le registre: “Vous pouviez faire ça avant, c’était juste beaucoup de travail manuel. Dans la version 1.4, nous venons de le rendre super simple, il a ce support natif pour ce qu’on appelle les ‘graph embeddings’.”

«Embeddings» est un concept utilisé dans le traitement du langage naturel, où la relation d’un mot avec d’autres mots dans un corpus de texte est exprimée sous la forme d’un vecteur multidimensionnel. Ils sont à la base de word2vec, l’algorithme utilisé dans la traduction automatique et le texte prédictif. Dans les bases de données de graphes, la technique d’incorporation est appliquée aux nœuds de données et aux relations entre eux, plutôt qu’aux mots.

Eifrem a déclaré que cette fonctionnalité aiderait les scientifiques des données à créer des modèles prédictifs dans les moteurs de recommandation et permettrait une détection plus rapide des fraudes.

Il a déclaré que l’objectif de Neo4j n’était pas de remplacer les bases de données relationnelles les plus courantes par une base de données de graphiques, mais d’aider les utilisateurs à réfléchir à ce qu’ils pourraient obtenir d’autre des données dont ils disposent. “Pensez à la forme des données, pensez à ce que vous voulez en faire, puis faites un choix, et ce choix, parfois est une base de données juste pour ce projet particulier, mais très souvent, il s’agit de deux bases de données ou plus pour un projet particulier projet, mais ce ne sera jamais une seule base de données pour tous vos projets », a-t-il déclaré.

Eifrem a déclaré qu’il ne disait pas aux utilisateurs que ce serait “des licornes, des arcs-en-ciel et de la crème glacée” s’ils achetaient GDS dans l’espoir que cela changera toute leur chaîne d’outils. Au lieu de cela, il pourrait être utilisé en plus des outils existants.

En plus des nouveaux algorithmes de «graph embeddings», GDS est livré avec plus de 50 algorithmes de graphes couramment utilisés préinstallés.

D’autres nouvelles fonctionnalités de Graph Data Science 1.4 incluent un outil pour aider les data scientists à créer leurs propres algorithmes à l’aide de l’API Pregel utilisée dans le PageRank de la recherche Google.

«C’est la même API que vous utilisez localement lorsque vous développez sur vos propres données, au sein de votre entreprise», a déclaré Eifrem.

Carl Olofson, vice-président de la recherche d’IDC, a déclaré que l’inclusion des intégrations dans l’atelier de science des données de Neo4j était «un développement intéressant».

«Bien que d’autres sociétés de bases de données graphiques telles que TigerGraph offrent une prise en charge de l’IA / ML, le processus de mise en place d’un processus d’apprentissage automatique et de génération de graphiques utilisables reste une tâche délicate.

“IDC considère l’IA / ML comme un vaste domaine de développement pour toutes sortes d’applications, et les bases de données doivent jouer un rôle important dans cette adoption. Nous constatons un intérêt croissant pour l’utilisation de bases de données graphiques à cette fin, en raison de leur capacité unique à capturer et représentent dynamiquement toute structure de relation trouvée dans les données », a déclaré Olofson.

Mais les bases de données graphiques n’ont toujours pas de langage de requête standard. GraphQL était le principal candidat, mais Neo4j a développé son propre langage de requête appelé Cypher, a-t-il déclaré.

Un autre facteur qui freine l’adoption est que “certaines personnes ont du mal à comprendre le concept de graphique”, a ajouté Olofson. ®

Nous saurons ce que nous nœuds, nous allons grok ce que nous avons représenté graphiquement: Neo4j cloue l’apprentissage automatique de graphes à l’atelier de science des données

Laisser un commentaire Annuler la réponse

Statistiques du site

Logiciels