Graphrag: Hello World !-编程知识

Graphrag: Hello World !

news/2025/1/17 0:53:11/文章来源:https://www.cnblogs.com/gaocong/p/18299221

这两天抽空玩了一把 Graphrag, 记录一下测试步骤。

先决条件:

Python 3.10-3.12

备注: 以下所有脚本都在 PowerShell环境下运行

1. 首先安装一下 graphrag python包

pip install --trusted-host https://mirrors.huaweicloud.com -i https://mirrors.huaweicloud.com/repository/pypi/simple graphrag

2. 创建测试数据集目录

mkdir -p ./ragtest/input

3. 生成测试数据 (需要手动删除一下最后的空行)

echo "我叫小小高，我儿子叫高1，我女儿叫高3，我还有一个80岁的奶奶" > ./ragtest/input/hello_world.txt

4. 初始化 Graphrag 配置

python -m graphrag.index --init --root ./ragtest

5. 修改大模型配置

1. 编辑 ragtest目录下的 .env 文件

    GRAPHRAG_API_KEY=你的大模型 key,如 open ai sk-api,Azure open ai key 2. 编辑  ragtest目录下的 settings.yaml 文件

我用的 azure open ai

聊天模型类型改成 azure 的

type: azure_openai_chat (注释下面的model , azure的model用的 deployment_name 字段，这个不注释会报错,如果用azure的话)

# model: gpt-35-turbo-16k

# model_supports_json: true 我的azure 模型不支持这个

api_base: 用你的 azure endpoint

api_version: 2024-02-15-preview

deployment_name: gpt-35-turbo-16k (用你在azure部署的模型)

向量模型改成 azure 的

type: azure_openai_embedding # or azure_openai_embedding

# model: text-embedding-3-small

api_base: 用你的 azure endpoint

api_version: 2024-02-15-preview

deployment_name: text-embedding-3-small (用你在azure部署的模型)

6. 生成索引

python -m graphrag.index --root ./ragtest

7. 查询

-- 问高级别问题， --method global
python -m graphrag.query --root ./ragtest --method global "总结一下"

-- 问细节 --method local
python -m graphrag.query --root ./ragtest --method local  "我的儿子叫啥名字"

talk is cheap

参考链接：

https://microsoft.github.io/graphrag/posts/get_started/

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/742643.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

R语言软件套保期限GARCH、VAR、OLS回归模型对沪深300金融数据可视化分析

全文链接:https://tecdat.cn/?p=34670 原文出处：拓端数据部落公众号金融市场的波动性一直是投资者和决策者关注的焦点之一。为了应对市场波动的风险，套保成为了一种重要的金融手段。在这个背景下，使用R语言软件中的GARCH VAR模型对沪深300金融数据进行分析，可以帮助我们更…

【视频讲解】Python比赛LightGBM、XGBoost+GPU和CatBoost预测学生在游戏学习过程表现|数据代码分享

全文链接：https://tecdat.cn/?p=36990原文出处：拓端数据部落公众号分析师：Qi Zhang背景基于游戏进行学习能让学校变得有趣，这种教育方法能让学生在游戏中学习，使其变得有趣和充满活力。尽管基于游戏的学习正在越来越多的教育环境中使用，但能用应用数据科学和学习分析原理…

excel单元格设置为文本为何还要双击

excel单元格设置为文本时为何还要双击才有效？我选定一行，用右键设置为文本，为何还要单个逐一双击才有效，否则选定求和时（包含其中一个单元格），仍视为数值。而逐一双击太麻烦，怎么解决？因为这是excel默认设置，如想要不单个操作，可使用分列的方式来批量处理。具体操…

Interceptor 拦截器

1、拦截器的介绍拦截器使用场景：登录验证：对于需要登录才能访问的网址，使用拦截器可以判断用户是否已登录，如果未登录则跳转到登录页面。权限校验：根据用户权限对部分网址进行访问控制，拒绝未经授权的用户访问。请求日志：记录请求信息，例如请求地址、请求参数、请求时…

bootstrap-datetimepicker 项目

项目此项目是bootstrap-datetimepicker 项目的一个分支，原项目不支持 Time 选择。其它部分也进行了改进、增强，例如load 过程增加了对 ISO-8601 日期格式的支持。文档是拷贝/粘贴字原项目的文档，并且加入了更多细节说明。别犹豫了，下载下来试试吧 ! 下载 ZIP 包此地址可…

TLScanary：Pwn中的利器

TLScanary：Pwn中的利器引言：什么是TLScanary？在二进制漏洞利用（Pwn）领域，攻击者面临着层层防护措施的挑战。在安全竞赛（如CTF）和实际漏洞利用中，TLS（线程本地存储）和堆栈保护（stack canary）是常见的防护技术。TLScanary应运而生，它结合了TLS协议与堆栈保护技术，…

JS组件系列——BootstrapTable 行内编辑解决方案：x-editable

转载：http://www.cnblogs.com/landeanfen/p/5821192.html#_label2阅读目录一、x-editable组件介绍二、bootstrapTable行内编辑初始方案三、bootstrapTable行内编辑最终方案1、文本框 2、时间选择框 3、下拉框 4、复选框 5、“阴魂不散”的select2四、总结正文前言：之前介…

一、问题描述在iceberg rewrite时报错：org.apache.iceberg.exceptions.ValidationException: Cannot commit, found new delete for replaced data file 看信息像是对于要删除的DataFile，有新的DeleteFile作用于它，不应该直接删除DataFile。但是我们很明确并没有DeleteFile…

6. DRF 版本

目录Django DRF 版本1. 使用1.1 URL 传递version参数 Django DRF 版本 1. 使用 rest_framework 的 versioning.py中定义了多种方法，支持不同方式携带version信息，比如支持url/hostname/namespace中携带并传递version信息1.1 URL 传递version参数 https://127.0.0.1:8000/use…

spark-submit提交任务时执行流程（简单版）

yarn cluster模式提交spark任务（1）执行脚本提交任务，实际是启动一个SparkSubmit的JVM进程。（2）SparkSubmit类中的main方法反射调用YarnClusterApplication的main方法。（3）YarnClusterApplication创建Yarn客户端，然后向yarn服务器发送执行指令：bin/java Application…

回溯-子集型

参考：回溯算法套路①子集型回溯【基础算法精讲 14】 ps：0-1背包也是一种子集型回溯注意：递归参数中的 i 不是第 i 个，而是下标大于等于 i 的这部分例题： class Solution: def f1(self, nums):n = len(nums)if n==0:return []ans = []path = []def dfs(i):if i == n…