数据集笔记:Pems 自行下载数据+python处理

以下载District 4的各station每5分钟的车速为例

1 PEMS网站下载数据

点击红色的

选择需要的station和区域,点击search,就是对应的数据,点击数据即可下载 (这个是station每5分钟的速度数据)

 2 pems 速度数据

2.1 每一列的意义

Timestamp

间隔开始的日期和时间。例如,08:00:00的时间表明聚合包含在08:00:00到08:04:59之间收集的测量数据。

请注意,五分钟聚合的秒值总是0。格式为MM/DD/YYYY HH24:MI:SS。

Station独特的车站标识符。
District区号
Freeway高速公路号
Direction

行驶方向

东南西北 ESWN

车道类型

表示车道类型的字符串。

可能的值(及其含义)为:

  • CD(收集/分配)
  • CH(传统公路)
  • FF(高速公路-高速公路连接)
  • FR(下匝道)
  • HV(高占用车道)
  • ML(主线)
  • OR(上匝道)
Station Length车站覆盖的路段长度,单位为英里/公里。
Samples所有车道接收的样本总数
% Observed在这个位置有observation的车道的百分比
Total Flow所有车道5分钟内流量总和。
Avg Occupancy5分钟内所有车道的平均占用率,以0到1之间的小数表示
Avg Speed所有车道5分钟内的流量加权平均速度。如果流量为0,则为5分钟车速的数学平均值
Lane N Samples车道N收到的良好样本数。
Lane N Flow5分钟内车道N的总流量。
Lane N Avg Occ5分钟内车道N的平均占有率
Lane N
Avg Speed
5分钟内车道N的平均速度
Lane N
Observed
车道N是否有观测值(1代表有,0代表没有)

2.2 python 读取PEMS

import numpy as np
import pandas as pd#设置header
new_headers = ['Timestamp', 'Station', 'District', 'Freeway', 'Direction','Lane Type', 'Station Length', 'Samples', '%Observed','Total Flow', 'Avg Occupancy', 'Avg Speed']
for i in range(1, (pems04.shape[1]-12)//5+1):new_headers.extend([f'Lane {i} Samples', f'Lane {i} Flow', f'Lane {i} Avg Occ',f'Lane {i} Avg Speed', f'Lane {i} Observed'])pems04=pd.read_csv('d04_text_station_5min_2023_01_02.txt',names=new_headers)
pems04

 3 pems station 元数据

3.1 每一列的意义

IDstation 的标识
Freeway高速公路编号
Freeway Direction表示高速公路方向的字符串
County Identifier县id
City城市
State Postmile州公里标
Absolute Postmile绝对公里标
Latitude,Longitude经纬度
Length长度
Type

类型

可能的值(及其含义)为:

  • CD(收集/分配)
  • CH(传统公路)
  • FF(高速公路-高速公路连接)
  • FR(下匝道)
  • HV(高占用车道)
  • ML(主线)
  • OR(上匝道)
Lanes车道数
Name名字
User IDs用户输入的字符串标识符

3.2 python读取

import numpy as np
import pandas as pdpems04=pd.read_csv('d04_text_meta_2022_12_13.txt',delimiter='\t')
pems04

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/205750.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Linux系统管理与服务器安全:构建稳健云数据中心

💂 个人网站:【 海拥】【神级代码资源网站】【办公神器】🤟 基于Web端打造的:👉轻量化工具创作平台💅 想寻找共同学习交流的小伙伴,请点击【全栈技术交流群】 在当今数字化时代,云数据中心已经成…

今日定音,博通以610亿美元成功收购VMware | 百能云芯

博通(Broadcom)日前宣布,已获得中国监管机构的批准,将于今日完成对云计算公司VMware的收购交易。这意味着,610亿美元的收购案正式收关。 据悉,中国市场监管总局在11月21日晚发布了有关附加限制性条件批准博…

HT513 I2S输入的音频功放的应用场景

HT513 I2S输入的音频功放的应用场景于:・智N家居 ・智N玩具 ・IoT设备 ・游戏设备・智N音箱 ・其他锂电/5V设备等等。 HT513内部集成了DA转换器,其I2S输入支持32-bit字节,并且可自动监测采样频率,支持192kHz。 HT513集成的D类音…

小雪来袭,安全无忧

今日#小雪# 智安网络提前为你的云保驾护航 让安全成为你的最佳伙伴#智安网络# ​​​

Java继承和多态

文章目录 继承成员继承构造方法super和this的区别代码块构造顺序 限定修饰符final继承和组合 多态向上转型重写动态绑定重写注意事项 向下转型多态优点注意 继承 成员继承 class Animal{public String name;public int age;public int a10;public void doSomething(){System.…

[Python人工智能] 四十.命名实体识别 (1)基于BiLSTM-CRF的威胁情报实体识别万字详解

从本专栏开始,作者正式研究Python深度学习、神经网络及人工智能相关知识。前一篇文章普及VS Code配置Keras深度学习环境,并对比常用的深度学习框架,最后普及手写数字识别案例。这篇文章将讲解如何实现威胁情报实体识别,利用BiLSTM-CRF算法实现对ATT&CK相关的技战术实体…

获取当前用户信息的几种方式

说明:在开发中,我们经常需要获取当前操作的用户信息,如创建用户、创建订单时,我们需要记录下创建人,本文介绍获取当前用户信息的三种方式。 方式一:使用ThreadLocal ThreadLocal本质上是一个Map&#xff…

2023年中国感应电炉产业链、产量、销量及市场规模分析[图]

感应电炉行业定义是指使用电磁感应原理,通过感应电流使金属工件在短时间内达到预定温度的工业设备。广泛应用于冶金、机械、汽车、航空、航天、船舶、电子、医疗器械等领域。 感应电炉行业产业链 资料来源:共研产业咨询(共研网) …

简于外 强于内,联想全新ThinkCentre M90a Pro Gen4以强劲性能开启商用新体验

近日,联想发布了最新一代商用台式一体机联想ThinkCentre M90a Pro Gen4。作为联想ThinkCentre M大师系列的旗舰产品,其配备了优质的显示屏,拥有强大的性能和稳定安全的特性,能够满足多样的工作场合,为商用一体机的行业…

MAX/MSP SDK学习06:内存管理

提供两种内存分配方式:①简单指针,②句柄(二级指针);官方文档建议使用前者。 // 简单指针 char *ptr; ptr sysmem_newptr(2000); post("I have a pointer %lx and it is %ld bytes in size",ptr, sysmem_p…

git merge 和 git rebase

一、是什么 在使用 git 进行版本管理的项目中,当完成一个特性的开发并将其合并到 master 分支时,会有两种方式: git merge git rebasegit rebase 与 git merge都有相同的作用,都是将一个分支的提交合并到另一分支上,…

代码随想录算法训练营第四十二天【动态规划part04】 | 01背包、416. 分割等和子集

01背包问题 题目链接: 题目页面 求解思路: 确定dp数组及其下标含义:dp[i][j] 表示从下标为 [0] 到 [i] 的物品里任意选取,放进容量为j的背包,此时的价值总和最大值确定递推公式: 不放物品i,…