Neo4j:图数据库的革命性力量

news/2024/11/15 11:45:12/文章来源:https://www.cnblogs.com/JavaEdge/p/18300851

Neo4j 首席技术官 @prathle 撰写了一篇出色的博文,总结最近围绕 GraphRAG 的热议、我们从一年来帮助用户使用知识图谱 + LLM 构建系统中学到的东西,以及我们认为该领域的发展方向。Neo4j一时间又大火起来,本文将带你快速入门这神奇的数据库。

前言

Neo4j是一款符合ACID标准的图数据库,能处理当今世界中极为复杂的关系数据。由Emil Ifram于2007年创建,使用Java编写,并开创了属性图模型。

传统的关系数据库使用表格模型,但将规范化的表连接在一起并不是人类自然思考关系的方式。我们自然会想到实体之间的连接,比如Bob在Stack Overflow上提出了一个问题,然后Alice和Chad给它点了反对票,所以Bob放弃了他的编程梦想。

一个图可以像你在白板上可视化它一样建模这些数据。节点代表实体,边表示实体之间的关系,属性是存储在这些对象上的键值对。

在底层,Neo4j是真正的原生图数据库,将这个模型应用到存储层。

查询

用一种叫Cypher的声明性语言编写,类似SQL,只不过节点用括号括起来,通过箭头连接到其他节点,关系用括号括起来。

要开始使用Neo4j,可以用Docker自托管,但最简单的方法是注册Aura,它提供免费的全托管云数据库。从这里,我们可以用Cypher查询来构建下一个Twitter。

使用CREATE后跟括号来创建一个新的实体或节点,这个节点有一个用户标签,用于将相似的节点分组。在大括号中,我们可以添加键值对来表示该节点上的数据。现在,一个用户可能想要关注另一个用户,这可以用括号内的关系来表示,然后注意箭头指向另一个带有用户标签的节点。创建关系数据就这么简单,不需要外键或连接表,尽管我们可以向模式添加约束,比如这里的约束确保每个用户名都是唯一的。此外,我们可以在这个查询中定义局部变量,然后从语句中返回它们以获取结果数据。特别棒的是,我们可以将其可视化为交互式图形,甚至是表格。

为继续构建Twitter,我们可以将多个推文节点连接到一个用户。我们还需要一个查询来返回所有被关注用户的所有推文,这可以很容易地用节点和关系表示出来,但我们也可以用WHERE子句过滤这个查询,只返回最近发布的推文。此外,我们可以匹配字符串模式和正则表达式,或者基于图形本身过滤复杂模式,比如只返回没有被静音的用户的推文。因此,它不仅对开发人员直观,而且还允许你的数据模式自然地显现出来,这在数据分析和机器学习方面是一个巨大的优势。

核心概念

属性图模型

Neo4j的属性图模型由以下三个主要元素组成:

  1. 节点(Nodes): 代表实体,如用户、产品或位置。
  2. 关系(Relationships): 连接节点,表示节点间的关联。
  3. 属性(Properties): 存储在节点和关系上的键值对,用于描述它们的特征。

这种模型允许我们以一种非常接近人类思维方式的形式来建模数据,使得复杂的关系数据变得直观和易于理解。

标签和类型

  • 节点标签: 用于对节点进行分类和分组。例如,:Person:Product
  • 关系类型: 描述两个节点之间关系的性质。例如,:FOLLOWS:PURCHASED

Cypher查询语言

Cypher是Neo4j的声明式图形查询语言,设计灵感来自SQL,但针对图数据结构进行了优化。

基本语法

MATCH (n:Person)-[:FOLLOWS]->(m:Person)
WHERE n.name = 'Alice'
RETURN m.name

这个查询匹配所有Alice关注的人,并返回他们的名字。

创建和更新

CREATE (n:Person {name: 'Bob', age: 30})
SET n.job = 'Developer'

这个查询创建一个新的Person节点,并设置其属性。

复杂关系查询

MATCH (a:Person)-[:POSTED]->(t:Tweet)<-[:LIKED]-(b:Person)
WHERE a.name = 'Charlie' AND t.timestamp > timestamp() - 86400000
RETURN b.name, COUNT(t) AS likes
ORDER BY likes DESC
LIMIT 5

这个查询找出过去24小时内点赞Charlie推文最多的5个用户。

性能优化

索引

为了提高查询性能,Neo4j允许在节点属性上创建索引:

CREATE INDEX ON :Person(email)

查询计划

使用EXPLAINPROFILE关键字来分析和优化复杂查询的执行计划。

高级特性

全文搜索

Neo4j可以集成全文搜索引擎,如Apache Lucene:

CALL db.index.fulltext.createNodeIndex("tweetContent", ["Tweet"], ["text"])

图算法

Neo4j图数据科学库提供了许多内置的图算法,如PageRank、社区检测等:

CALL gds.pageRank.stream('myGraph')
YIELD nodeId, score

实际应用案例

适用场景

今天,Neo4j被用于推荐引擎(推荐系统: 基于用户行为和项目特征构建个性化推荐)

社交媒体平台:

人工智能的知识图谱,构建和查询复杂的知识网络,支持智能问答系统:

欺诈检测: 通过分析交易网络中的异常模式

技术集成

  • Spring Data Neo4j: 为Java开发者提供了简单的Neo4j集成方案。
  • Neo4j-GraphQL: 允许开发者使用GraphQL语法来查询Neo4j数据库。

总结

Neo4j作为领先的图数据库,不仅提供强大的数据建模和查询能力,还具有卓越的性能和可扩展性。随数据关系日益复杂,Neo4j在各个领域的应用前景将更加广阔。无论是构建下一代社交网络、优化供应链管理,还是推动AI和机器学习的发展,Neo4j都将扮演重要角色。

关注我,紧跟本系列专栏文章,咱们下篇再续!

作者简介:魔都架构师,多家大厂后端一线研发经验,在分布式系统设计、数据平台架构和AI应用开发等领域都有丰富实践经验。

各大技术社区头部专家博主。具有丰富的引领团队经验,深厚业务架构和解决方案的积累。

负责:

  • 中央/分销预订系统性能优化
  • 活动&券等营销中台建设
  • 交易平台及数据中台等架构和开发设计
  • 车联网核心平台-物联网连接平台、大数据平台架构设计及优化
  • LLM Agent应用开发
  • 区块链应用开发

目前主攻市级软件项目设计、构建服务全社会的应用系统。

参考:

  • 编程严选网

本文由博客一文多发平台 OpenWrite 发布!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/743297.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Linux常用文件操作命令

本章将和大家分享Linux常用的文件操作命令。本章将和大家分享Linux常用的文件操作命令。废话不多说,下面我们直接进入主题。 一、目录切换(cd命令) 在Linux系统中,cd 是一个用于切换当前工作目录的命令,它是 "change directory" 的缩写。基本用法如下所示: 1、…

Windows10下的docker容器启动命令docker -v相对路径的挂载目录位置

今天研究docker容器时,启动命令使用到了docker -v test:/app/backend/data 有个从宿主机写入文件到容器这个目录的需求,于是就尝试在宿主机上找到这个test目录 找了一圈都没找到,于是四处搜索,终于在stackoverflow上面找到了 https://stackoverflow.com/questions/61083772…

基于GA遗传优化算法的Okumura-Hata信道参数估计算法matlab仿真

1.算法仿真效果 matlab2022a仿真结果如下(完整代码运行后无水印):2.算法涉及理论知识概要遗传算法(Genetic Algorithm, GA)是一种模拟自然界生物进化过程的全局优化搜索算法,由John Holland于1975年提出。它利用达尔文的自然选择和遗传学原理,通过选择、交叉、变异等操作…

LTPSICE 小知识

1、初值设置:

软件工程进度报告——第二周

本周总结: 本周学习了Java语言的开发软件jdk的下载安装和使用方法,java代码的简单编写 1.下载安装jdk jdk需要在Oracle官网下载,下载地址:www.oracle.com下载时只需选择对应系统的安装包安装即可 2.jdk的安装目录 bin:该路径下存放了各种工具命令,其中比较重要的有:javac…

2024.07.13hadoop总结

hadoop基础概念学习在这之前并不了解hadoop,甚至没怎么听人提起过,直到学习大数据技术需要hadoop和python才开始学习。 hadoop的概念还没有完全了解完全,但是它的核心是处理和存储大数据,需要在虚拟机上面进行系统的测试

2024暑假第二周总结

运算符总结 对字面量或者变量进行操作的符号 算数运算符 加 减 乘 除 取模 取余 加减乘 public class yunsuanfu {public static void main(String[] args) {//+System.out.println(3+2);//5//-System.out.println(3-2);//1//*System.out.println(2*2);//4//如果计算的时候有小…

周总结

这周主要练习springboot3+vue3,开发大事件系统,Hadoop还未开始学,计划完成大事件开发后冲击Hadoop,在这里主要说一下我后端的开发心里路程吧。 Spring Boot 是一种基于 Spring 框架的开发工具,它旨在简化 Spring 应用程序的开发和部署过程。作为一名后端开发人员,我对 Sp…

Linux 中sed命令输出匹配字符的行号

001、[root@PC1 test]# ls a.txt [root@PC1 test]# cat a.txt ## 测试数 aa bbb dd ff 77 dd 22 44 77 88 cc dd ee ff [root@PC1 test]# sed -n /dd/p a.txt ## 输出匹配dd的行 dd ff 77 dd cc dd [root@PC1 test]# sed -n /dd/= a.txt ## 输出匹配字符的行号 2 3…

西华大学代做

目录西华大学代做拓扑图配置步骤PC配置接入交换机配置汇聚交换机配置核心交换机配置上联区配置公共服务区配置服务器区配置远程登录配置Internet区域配置B网 西华大学代做 拓扑图配置步骤 PC配置 vlan10和vlan20,对应192.168.10.0/24和192.168.20.0/24接入交换机配置 创建vlan…