DataFrame RHS语法查询语句

news/2024/9/20 13:34:46/文章来源:https://www.cnblogs.com/yimeimanong/p/18325764

RHS:
https://github.com/acoboh/query-filter-jpa/blob/main/README.md

规则:
查询字段名:查询条件(条件值) 关系符 查询字段名:查询条件(条件值) ...

查询条件有:
‒ eq: 等于
‒ gt: 大于
‒ gte: 大于等于
‒ lt: 小于
‒ lte: 小于等于
‒ ne: 不等于
‒ cn: 包含
‒ ncn: 不包含
‒ re: 正则
‒ sw: 以xxx开头
‒ ew: 以xxx结尾

关系符有:
‒ and: 与
‒ or: 或

排序:
在最后边使用 sort 关键字排序,如果逆序排序,就在字段前加个负号(-)。如:sort(a) 或者 sort(-a)

例:
有如下一个表:
id gene mid e10
1 abc1 23 12
2 test1 35 32
3 abc2 16 21

// 查询 gene = abc1
query = gene:eq(abc1)
得到:
abc1 23 12
虽然这样也能查出来,但是最好用下面这样的命令:
query = id:eq(1)
这样可以提高查询效率

// 查询 mid > 10 且 小于 20
query = mid:gt(10) and mid:lt(20)
得到:
abc2 16 21

// 查询 gene 包含 abc 并按 gene 顺序排序
query = gene:cn(abc) sort(gene)
得到:
abc1 23 12
abc2 16 21

// 查询 gene 包含 abc 并按 gene 逆序排序
query = gene:cn(abc) sort(-gene)
得到:
abc2 16 21
abc1 23 12

【注】不能任意使用空格 只能在两个元素之间使用空格。支持用括号()来表示优先级。

代码

点击查看代码
import re
import pandas as pd
from functools import lru_cacheclass QueryManage:"""Convert the query statement to pandas syntax"""# operate mapOPR_MAP = {"eq": lambda x, y: f"['{x}']=={y}","gt": lambda x, y: f"['{x}']>{y}","gte": lambda x, y: f"['{x}']>={y}","lt": lambda x, y: f"['{x}']<{y}","lte": lambda x, y: f"['{x}']<={y}","ne": lambda x, y: f"['{x}']!={y}","cn": lambda x, y: f"['{x}'].str.contains('{y}')","ncn": ("~", lambda x, y: f"['{x}'].str.contains('{y}')"),"sw": lambda x, y: f"['{x}'].str.contains(r'^{y}')","ew": lambda x, y: f"['{x}'].str.contains(r'{y}$')",# 're': '',}# relationship mapRLP_MAP = {"and": "&", "or": "|"}# sortSORT = lambda x: (f"sort_values('{x.replace('-', '')}',ascending=False)"if "-" in xelse f"sort_values('{x}')")# pattern filter field# PFF = re.compile(f"(?P<field>(\w+)):(?P<operate>(\w+))\((?P<value>(\w+))\)")PFF = re.compile(f"(?P<leftParen>(^\(*))(?P<field>(\w+)):(?P<operate>(\w+))\((?P<value>(\w+))\)(?P<rightParen>(\)*$))")# pattern filter sortPFS = re.compile(r"sort\((-*\w+)\)")def __init__(self, resource: pd.DataFrame):self.resource = resourcedef _validCheck(self, condition: list):assert condition[-1] not in self.__class__.RLP_MAP, ValueError("query invalid")def _parse(self, condition: list):cond = ""sort = ""switch = Falsefor elem in condition:switch = not switchif switch:patRes = self.__class__.PFF.match(elem)assert patRes, ValueError("query invalid")if patRes.group("leftParen"):cond += "("opr = self.__class__.OPR_MAP.get(patRes.group("operate"))assert opr, ValueError(f"invalid operate {patRes.group('operate')}")if isinstance(opr, tuple):sign, opr_ = oprcond += f"({sign}self.resource{opr_(patRes.group('field'), patRes.group('value'))})"else:cond += f"(self.resource{opr(patRes.group('field'), patRes.group('value'))})"if patRes.group("rightParen"):cond += ")"else:rlp = self.__class__.RLP_MAP.get(elem.lower())if rlp:cond += rlpelse:# sort fieldfs = self.__class__.PFS.findall(elem)assert fs, ValueError("query invalid")sort = self.__class__.SORT(fs[0])return cond, sort@lru_cache(maxsize=10)def query(self, condition: str):cond = condition.strip().split(" ")self._validCheck(cond)cond, sort = self._parse(cond)print("cond: ", cond, sort)return (eval(f"self.resource[{cond}].{sort}")if sortelse eval(f"self.resource[{cond}]"))if __name__ == "__main__":df = pd.DataFrame({"a": [1, 2, 3, 4, 5], "b": ["abc", "bcd", "cfg", "adv", "ecf"]})qm = QueryManage(df)# a==2res = qm.query("a:eq(2)")print("a==2 :\n", res)# a==2 or a==4res = qm.query("a:eq(2) or a:eq(4)")print("a==2 or a==4 :\n", res)# b.contains('b') and a==1res = qm.query("b:cn(b) and a:eq(1)")print("b.contains('b') and a==1 :\n", res)# ~b.contains('a')res = qm.query("b:ncn(a)")print("~b.contains('a') :\n", res)# a>1 sort(-a)res = qm.query("a:gt(1) sort(-a)")print("a>1 sort(-a) :\n", res)# (a ==1 or a==3) and b.contains('f')res = qm.query("(a:eq(1) or a:eq(3)) and b:cn(f)")print("(a ==1 or a==3) and b.contains('f') :\n", res)# a ==1 or a==3 and b.contains('f')res = qm.query("a:eq(1) or a:eq(3) and b:cn(f)")print("a ==1 or a==3 and b.contains('f') :\n", res)

执行结果
image

image

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/772055.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Minirobot 双足舞蹈机器人

MF-17ST机器人产品介绍 MF-17ST机器人是一款高度灵活的仿人机器人,它拥有17个自由度,能够精确地模仿人类的基本动作,如行走、转身、弯腰、单腿站立、前后滚翻和俯卧撑等。这款机器人的设计不仅局限于模仿单一动作,还能通过集体编排,创造出令人印象深刻的大型舞蹈表演,例如…

DIDCTF-流量分析

wireshark0 某日接到客户应急需求,客户连接工业控制系统的核心网络设备遭到入侵,初步推测可能是网络设备的远程登录密码被破解,请通过对给出的流量包分析,得到黑客登录网络设备后窃取的机密数据key1。 flag为8位长度字符串flag:HYDw29eP wireshark0.5 下列抓包⽂件中包含了…

Android 内存分析(java native heap内存、虚拟内存、处理器内存.

1.jvm 堆内存(dalvik 堆内存)每个Java应用程序在运行时都会拥有自己的JVM实例,这个实例会为其分配独立的堆内存空间。这意味着不同的应用程序之间不会共享堆内存。不同手机中app进程的 jvm 堆内存是不同的,因厂商在出厂设备时会自定义设置其峰值。比如,在Android Studio 创建…

[二、状态管理]3管理应用拥有的状态(2)LocalStorage:页面级UI状态存储

LocalStorage是页面级的UI状态存储,通过@Entry装饰器接收的参数可以在页面内共享同一个LocalStorage实例。LocalStorage也可以在UIAbility实例内,在页面间共享状态。 本文仅介绍LocalStorage使用场景和相关的装饰器:@LocalStorageProp和@LocalStorageLink。说明本模块从API …

数据结构 二叉树 前 中 后 序列

简单二叉树的 遍历 如果看完还是不太懂 就观看速成视频 https://www.bilibili.com/video/BV1Ub4y147Zv/?spm_id_from=333.337.search-card.all.click&vd_source=e5f8765d50fb89ef04eb150bd76075b5 引用资料文献链接放到篇尾 简单术语解释节点 (Node):二叉树中的一个元素,…

【YOLOv8改进- 多模块融合改进】GhostConv + ContextAggregation 幽灵卷积与上下文聚合模块融合改进,助力小目标高效涨点

YOLOv8目标检测创新改进与实战案例专栏专栏目录: YOLOv8有效改进系列及项目实战目录 包含卷积,主干 注意力,检测头等创新机制 以及 各种目标检测分割项目实战案例专栏链接: YOLOv8基础解析+创新改进+实战案例ContextAggregation介绍摘要 卷积神经网络(CNNs)在计算机视觉中…

小型团队缺陷管理系统指南:如何选型

国内外主流的10款小型团队使用的缺陷管理系统对比:PingCode、Worktile、禅道(ZenTao)、Tapd、Teambition、Tower、Jira、DoneDone、Bugzilla、MantisBT。在小型团队中,选择合适的缺陷管理系统似乎总是一个头痛的问题。你可能已经发现,一个有效的系统不仅可以帮助你追踪和修…

SIEM是什么?企业安全

随着信息技术的不断发展,企业面临的安全威胁也在迅速增加,为了有效应对这些挑战,越来越多的企业开始关注安全信息与事件管理即SIEM:Security Information and Event Management技术。那么SIEM究竟是什么,它对企业安全有何作用呢? SIEM技术是一种综合性的安全解决方案,通…

「代码随想录算法训练营」第二十一天 | 回溯算法 part3

93. 复原 IP 地址题目链接:https://leetcode.cn/problems/restore-ip-addresses/ 题目难度:中等 文章讲解:https://programmercarl.com/0093.复原IP地址.html 视频讲解:https://www.bilibili.com/video/BV1XP4y1U73i/ 题目状态:好难,看题解通过思路: 和分割回文串一样,…

Jetpack Compose学习(12)——Material Theme的主题色切换

原文:Jetpack Compose学习(12)——Material Theme的主题色切换-Stars-One的杂货小窝闲着无事研究了下Jetpack Compose M3 主题切换效果本系列以往文章请查看此分类链接Jetpack compose学习如何生成主题 首先,我们需要知道的是,M3有提供个在线网站供开发者进行快速生成主题,详情…

UG二次开发NXOpen-Python(十四)自定义特征(CustomFeature)

可以通过二次开发建立自定义特征,实现和长方体、圆柱等一样的特征插入和特征编辑操作。如下图所示:   点击确定后,即可在指定点生成一个指定长度的正四面体,并且双击该特征即可进行编辑并更新。 未完待续

Telegram纸飞机统计机器人源码,TG群记账群发机器源码人,TG自动记账全开源版本

Telegram纸飞机统计机器人源码,TG群记账群发机器源码人,TG自动记账全开源版本 一.thinkphp6框架开发 按thinkphp6部署+伪静态+php7.4 数据库连接信息在config文件夹database.php文件修改 后台账号:admin 密码 123321. (有个小数点) 二.机器人部署 1.去tg官方申请机器人获取到t…