Graphrag: Hello World !

news/2025/1/17 0:53:11/文章来源:https://www.cnblogs.com/gaocong/p/18299221

这两天抽空玩了一把 Graphrag, 记录一下测试步骤。

  先决条件: 

     Python 3.10-3.12

   备注: 以下所有脚本都在 PowerShell环境下运行

1. 首先安装一下  graphrag python包 

pip install --trusted-host https://mirrors.huaweicloud.com -i https://mirrors.huaweicloud.com/repository/pypi/simple graphrag

 

2.  创建测试数据集目录

mkdir -p ./ragtest/input

  

3. 生成测试数据 (需要手动删除一下最后的空行)

echo "我叫小小高,我儿子叫高1,我女儿叫高3,我还有一个80岁的奶奶" > ./ragtest/input/hello_world.txt

 

4. 初始化 Graphrag 配置

python -m graphrag.index --init --root ./ragtest

 

5.  修改大模型配置

   

1. 编辑 ragtest目录下的 .env 文件

 

    GRAPHRAG_API_KEY=你的大模型 key,如 open ai sk-api,Azure open ai key 2. 编辑  ragtest目录下的 settings.yaml 文件

 我用的  azure open ai

   聊天模型类型改成 azure 的

     type: azure_openai_chat  (注释下面的model , azure的model用的  deployment_name 字段,这个不注释会报错,如果用azure的话)  

     # model: gpt-35-turbo-16k
    # model_supports_json: true  我的azure 模型不支持这个
    api_base: 用你的 azure endpoint
    api_version: 2024-02-15-preview
    deployment_name: gpt-35-turbo-16k (用你在azure部署的模型)

 

  向量模型改成 azure 的

    type: azure_openai_embedding # or azure_openai_embedding

    # model: text-embedding-3-small
     api_base: 用你的 azure endpoint
     api_version: 2024-02-15-preview
     deployment_name: text-embedding-3-small  (用你在azure部署的模型)

  

6. 生成索引

python -m graphrag.index --root ./ragtest

 

7. 查询

-- 问高级别问题, --method global
python -m graphrag.query --root ./ragtest --method global "总结一下"

 

-- 问细节 --method local
python -m graphrag.query --root ./ragtest --method local  "我的儿子叫啥名字"

 

talk is cheap

 

 

参考链接:

https://microsoft.github.io/graphrag/posts/get_started/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/742643.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

R语言软件套保期限GARCH、VAR、OLS回归模型对沪深300金融数据可视化分析

全文链接:https://tecdat.cn/?p=34670 原文出处:拓端数据部落公众号 金融市场的波动性一直是投资者和决策者关注的焦点之一。为了应对市场波动的风险,套保成为了一种重要的金融手段。在这个背景下,使用R语言软件中的GARCH VAR模型对沪深300金融数据进行分析,可以帮助我们更…

【视频讲解】Python比赛LightGBM、XGBoost+GPU和CatBoost预测学生在游戏学习过程表现|数据代码分享

全文链接:https://tecdat.cn/?p=36990原文出处:拓端数据部落公众号分析师:Qi Zhang背景基于游戏进行学习能让学校变得有趣,这种教育方法能让学生在游戏中学习,使其变得有趣和充满活力。尽管基于游戏的学习正在越来越多的教育环境中使用,但能用应用数据科学和学习分析原理…

excel单元格设置为文本为何还要双击

excel单元格设置为文本时为何还要双击才有效? 我选定一行,用右键设置为文本,为何还要单个逐一双击才有效,否则选定求和时(包含其中一个单元格),仍视为数值。而逐一双击太麻烦,怎么解决? 因为这是excel默认设置,如想要不单个操作,可使用分列的方式来批量处理。 具体操…

Interceptor 拦截器

1、拦截器的介绍拦截器使用场景:登录验证:对于需要登录才能访问的网址,使用拦截器可以判断用户是否已登录,如果未登录则跳转到登录页面。 权限校验:根据用户权限对部分网址进行访问控制,拒绝未经授权的用户访问。 请求日志:记录请求信息,例如请求地址、请求参数、请求时…

bootstrap-datetimepicker 项目

项目 此项目是bootstrap-datetimepicker 项目 的一个分支,原项目不支持 Time 选择。其它部分也进行了改进、增强,例如load 过程增加了对 ISO-8601 日期格式的支持。文档是拷贝/粘贴字原项目的文档,并且加入了更多细节说明。 别犹豫了,下载下来试试吧 ! 下载 ZIP 包此地址可…

TLScanary:Pwn中的利器

TLScanary:Pwn中的利器 引言:什么是TLScanary?在二进制漏洞利用(Pwn)领域,攻击者面临着层层防护措施的挑战。在安全竞赛(如CTF)和实际漏洞利用中,TLS(线程本地存储)和堆栈保护(stack canary)是常见的防护技术。TLScanary应运而生,它结合了TLS协议与堆栈保护技术,…

JS组件系列——BootstrapTable 行内编辑解决方案:x-editable

转载:http://www.cnblogs.com/landeanfen/p/5821192.html#_label2阅读目录一、x-editable组件介绍 二、bootstrapTable行内编辑初始方案 三、bootstrapTable行内编辑最终方案1、文本框 2、时间选择框 3、下拉框 4、复选框 5、“阴魂不散”的select2四、总结 正文 前言:之前介…

Iceberg metrics导致的问题

一、问题描述 在iceberg rewrite时报错:org.apache.iceberg.exceptions.ValidationException: Cannot commit, found new delete for replaced data file 看信息像是对于要删除的DataFile,有新的DeleteFile作用于它,不应该直接删除DataFile。但是我们很明确并没有DeleteFile…

6. DRF 版本

目录Django DRF 版本1. 使用1.1 URL 传递version参数 Django DRF 版本 1. 使用 rest_framework 的 versioning.py中定义了多种方法,支持不同方式携带version信息, 比如支持url/hostname/namespace中携带并传递version信息1.1 URL 传递version参数 https://127.0.0.1:8000/use…

spark-submit提交任务时执行流程(简单版)

yarn cluster模式提交spark任务 (1)执行脚本提交任务,实际是启动一个SparkSubmit的JVM进程。 (2)SparkSubmit类中的main方法反射调用YarnClusterApplication的main方法。 (3)YarnClusterApplication创建Yarn客户端,然后向yarn服务器发送执行指令:bin/java Application…

回溯-子集型

参考:回溯算法套路①子集型回溯【基础算法精讲 14】 ps:0-1背包也是一种子集型回溯 注意:递归参数中的 i 不是第 i 个, 而是下标大于等于 i 的这部分例题: class Solution: def f1(self, nums):n = len(nums)if n==0:return []ans = []path = []def dfs(i):if i == n…