图神经网络X项目|基于图神经网络的电商行为的预测(5%)

文章目录

  • Jupyter Notebook 学习人工智能的好帮手
  • 数据集
    • 数据集下载
    • 数据集调用
      • 数据集应用技巧——获取不重复的编号
      • 数据集应用技巧——随机采样
      • 数据集应用技巧——抽取前N项进行模拟测试
    • 数据集构建
      • 技巧一——查看数据集构建进度

Jupyter Notebook 学习人工智能的好帮手

【Jupyter Notebook】快速上手 轻松玩明白

数据集

数据集下载

数据集下载地址

数据集调用

from sklearn.preprocessing import LabelEncoder
import pandas as pddf = pd.read_csv("yoochoose-clicks.dat",header=None)
df.columns = ['session_id','timestamp','item_id','category']print(df)

在这里插入图片描述
在这里插入图片描述
其中,session_id表示的是某次会话的编号,而item_id表示的是某次会话下的某个操作,category代表购买情况,其中0代表未购入,1代表购入。

数据集应用技巧——获取不重复的编号

可以对某一个关键字采用unique()
在这里插入图片描述

数据集应用技巧——随机采样

应用场景:数据集过多,抽取部分数据进行观察。
工具:采用random中的choice进行提取(numpy库也有random包,也有choice方法)。

在这里插入图片描述
choice可以选取出列表/集合中的其中一项

数据集应用技巧——抽取前N项进行模拟测试

应用场景:可用于熟悉操作。
工具:使用分片进行操作。
分片的具体操作可见于分片链接
在这里插入图片描述

数据集构建

在这里插入图片描述
第二步,刚开始这些点并没有图的编号(有session_id,但并不是一个方便建图的编号),于是可以采取按某一个关键字进行排序的方法,按大小给图上的节点进行重新编号。
在这里插入图片描述
后几步,开始制作边集。
在这里插入图片描述
考虑复用性的话,记得将构造出来的数据集进行保存。

技巧一——查看数据集构建进度

应用场景:可以可视化进度

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/424336.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

自动化测试总结

🍅 视频学习:文末有免费的配套视频可观看 🍅 关注公众号【互联网杂货铺】,回复 1 ,免费获取软件测试全套资料,资料在手,涨薪更快 软件测试作为软件生命周期中不可缺少的组成部分,对提…

Final Cut Pro v10.7.1中文版 专业级视频剪辑软件 兼容M

Final Cut Pro 是 macOS平台上最好的视频剪辑软件,基于Cocoa编写,支持多路多核心处理器,支持GPU加速,支持后台渲染,可编辑从标清到4K的各种分辨率视频,ColorSync管理的色彩流水线则可保证全片色彩的一致性。…

【QT+QGIS跨平台编译】之六:【LZMA+Qt跨平台编译】(一套代码、一套框架,跨平台编译)

文章目录 一、lzma介绍二、文件下载三、文件分析四、pro文件五、编译实践一、lzma介绍 LZMA(Lempel-Ziv-Markov chain-Algorithm的缩写),是一个Deflate和LZ77算法改良和优化后的压缩算法。 libLzma是基于LZMA压缩算法封装的开源库。2001年被首次应用于7-Zip压缩工具中,是 …

架构篇09:架构设计原则案例

文章目录 淘宝案例手机QQ案例小结 我们先复习一下架构设计的三条核心原则:合适原则、简单原则和演化原则。 我们在架构设计实践中,应该时刻谨记这三条设计原则,指导我们设计出合适的架构,即使是代表中国互联网技术最顶尖水平的 BA…

【易经】-- 风水基础

目录 一、基础概念 1、五行 2、十天干 3、十二地支 4、八卦 4.1 伏羲八卦次序图 4.2 八卦对应自然界的基本事物 4.3 八卦及所代表的意像 ​编辑 5、生辰八字 5.1 定义 5.2 换算方法 5.3 举例 5.4 八字排盘示例 5.5 算法实现 二、举例 1、计算某年的生肖和年的属…

CSS之边框样式

让我为大家介绍一下边框样式吧!如果大家想更进一步了解边框的使用,可以阅读这一篇文章:CSS边框border 属性描述none没有边框,即忽略所有边框的宽度(默认值)solid边框为单实线dashed边框为虚线dotted边框为点线double边框为双实线 代码演示&…

医疗器械的条码二维码读取难点的应对措施

医疗器械作为医学应用的主要使用工具,对其追踪和管理尤为重要,条码二维码技术作为一种通用的数据捕捉工具,在医疗器械管理应用中发挥着关键作用,然而在实际工作中,医疗器械的条码二维码读取往往会遇到一些难点。本文由…

moon‘s 博客网站部署维护项目说明

项目概述 背景 博客系统致力为广大用户提供优质的互动交流平台,实现对博客发表文章、评论、图片、好友等数据的管理,同时实现了博客内容及时、快速更新的功能,系统不仅保留了传统博客系统的功能,还加上了一些人性化的界面设计,使…

了解云工作负载保护:技术和最佳实践

云工作负载是指云环境中的应用程序或存储元素,无论是公共云、私有云还是混合云。每个云工作负载都使用云的资源,包括计算、网络和存储。 云工作负载可以多种多样,例如运行应用程序、数据库或托管网站。它们可以是静态的或动态的,…

企业为什么需要WMS仓储管理系统,终于有人说明白了

随着科技的飞速发展和市场竞争的加剧,仓储企业面临着越来越多的挑战和机遇。为了提高产品的性能和质量,同时节约成本、提高运营效率,数字化建设成为了仓储企业的核心需求。而WMS仓储管理系统的应用,更是企业数字化建设的重中之重。…

HCIA——23DNS层次域名空间、域名服务器、域名解析的原理的选择、解答

学习目标: 计算机网络 1.掌握计算机网络的基本概念、基本原理和基本方法。 2.掌握计算机网络的体系结构和典型网络协议,了解典型网络设备的组成和特点,理解典型网络设备的工作原理。 3.能够运用计算机网络的基本概念、基本原理和基本方法进行…

matlab appdesigner系列-常用15-滑块、微调器

滑块,以左右拖动的方式在一定范围内改变数值 此示例,滑块显示微调器的数值,微调器也可以显示滑块的数值 操作步骤为: 1)将滑块和微调器拖拽到画布上 2)分别设置这两个组件的回调函数 回调函数有两个选项…