Python爬虫-爬取当日中药材价格数据

🎈 博主:一只程序猿子

🎈 博客主页:一只程序猿子 博客主页

🎈 个人介绍:爱好(bushi)编程!

🎈 创作不易:喜欢的话麻烦您点个👍和

🎈 欢迎访问我的主页(点我直达)

🎈 除此之外您还可以通过个人名片联系我

额滴名片儿

 

目录

1.介绍

2.分析

(1)数据来源

(2)找到对应的数据包

(3)查看请求信息

3.爬取流程

4.源码

5.效果展示


1.介绍

        本文将介绍如何编写python爬虫,爬取药通网的中药材市场价格!数据集结合pandas,echarts进行处理分析和可视化,用作学年设计太合适不过了!

2.分析

(1)数据来源

(2)找到对应的数据包

(3)查看请求信息

 

 请求的参数中,只需要修改pageIndex的值,即可实现换页!

3.爬取流程

逐页发送请求,获取服务器返回的数据,然后把数据稍加处理后保存到CSV表格中.

注意:需控制爬取到速度,爬取过快会导致服务器连接超时!

4.源码

import csv
import timeimport requests
from yaotongwang_zhongyao_price.settings import cookies, headers
from lxml import etree
import pandas as pd# 1.获取当前页面中的所有中药材价格
def get_zhongyao_price(page):# 定义请求参数global dataparams = {'random': '0.35934104418089574','ycnam': '','market': '1','leibie': '','istoday': '0','spices': '','tea': '','logo_flg': '','paramName': '','paramValue': '','pageIndex': page,'pageSize': '20',}response = requests.get('https://www.yt1998.com/price/nowDayPriceQ!getPriceList.do',params=params,cookies=cookies,headers=headers,)if response.json()['msg'] == '获取成功':items = response.json()['data']# 定义空列表存放中药材信息data = []zhongyao_info_dict['月对比'] = item['yueduibi']zhongyao_info_dict['市场'] = item['shichang']zhongyao_info_dict['统计时间'] = item['dtm']data.append(zhongyao_info_dict)else:print('暂未获取到当前页面的内容!')return datadef save_to_csv(data):# 定义文件路径file_path = './data/今日中药材价格1.csv'with open(file_path, 'a', encoding='utf-8', newline='') as csvfile:fieldnames = ['名称', '规格', '产地', '价格(元/kg)', '走势', '月对比', '市场', '统计时间']  # 列名writer = csv.DictWriter(csvfile, fieldnames=fieldnames)# 写入数据writer.writerows(data)# 主程序
def main():for i in range(4):save_to_csv(get_zhongyao_price(i))if i < 3:print(f'第 {i} 页已保存, 休息2秒后继续...')time.sleep(2)else:print(f'第 {i} 页已保存, 爬虫运行完成...')# 主控制程序
if __name__ == '__main__':main()

setting.py:

# 定义cookie
cookies = {'换成你自己的'
}# 定义请求头
headers = {'authority': 'www.yt1998.com','accept': 'application/json, text/javascript, */*; q=0.01','accept-language': 'zh-CN,zh;q=0.9,en;q=0.8,en-GB;q=0.7,en-US;q=0.6','content-type': 'application/Json','referer': 'https://www.yt1998.com/priceInfo.html','sec-ch-ua': '"Not_A Brand";v="8", "Chromium";v="120", "Microsoft Edge";v="120"','sec-ch-ua-mobile': '?0','sec-ch-ua-platform': '"Windows"','sec-fetch-dest': 'empty','sec-fetch-mode': 'cors','sec-fetch-site': 'same-origin','user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36 Edg/120.0.0.0','x-requested-with': 'XMLHttpRequest',
}

        篇幅有限,仅提供部分源码,完整源码请通过我的个人名片联系我获取!

5.效果展示

         这么一套操作下来,数据就被保存到本地了!打完收工!

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/315845.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Pix2Seq 算法阅读记录

目录 前向传播过程 训练过程&#xff1a; 网络结构 前向传播过程 batch_preds--> tgt-->tgtcat(tgt, padding)-->tgt_embedding-->tgt_mask,tgt_padding_mask 以NLP的角度&#xff0c;tgt 代表了 词汇表的长度&#xff0c;encoder部分直接对图像进行处理&#…

Spring Cloud Gateway + Nacos 灰度发布

前言 本文将会使用 SpringCloud Gateway 网关组件配合 Nacos 实现灰度发布&#xff08;金丝雀发布&#xff09; 环境搭建 创建子模块服务提供者 provider&#xff0c;网关模块 gateway 父项目 pom.xml 配置 <?xml version"1.0" encoding"UTF-8"?…

Redis:原理+项目实战——Redis实战3(Redis缓存最佳实践(问题解析+高级实现))

&#x1f468;‍&#x1f393;作者简介&#xff1a;一位大四、研0学生&#xff0c;正在努力准备大四暑假的实习 &#x1f30c;上期文章&#xff1a;Redis&#xff1a;原理项目实战——Redis实战2&#xff08;Redis实现短信登录&#xff08;原理剖析代码优化&#xff09;&#x…

Spring Boot快速搭建一个简易商城项目【四,优化购物车篇】

在之前的基础上继续将购物车进行完善&#xff1a;全选&#xff0c;删除&#xff0c;加减购物车数量 效果&#xff1a; 全选&#xff1a; 计算价格&#xff1a; //计算总价function jisuan(){let total 0;$(".th").each((i,el)>{//each遍历 i下标 el指的是当前的…

跟着动感音乐一起运动起来,健身房的动感单车中文教学

一、教程描述 目前流行的动感单车教程&#xff0c;大多数都是来自国外的&#xff0c;可能听不懂在讲些什么&#xff0c;本套教程是国内的中文教程&#xff0c;现场教学的感觉很好&#xff0c;配上健身房专用的动感单车音乐&#xff0c;很快就会唤醒全身的运动细胞&#xff0c;…

Filezilla使用

服务端 点击安装包 点击我接受 点击下一步 点击下一步 点击下一步 点击安装即可 配置用户组&#xff0c;点击编辑&#xff0c;出现组点击 点击添加&#xff0c;点击确定即可 配置用户&#xff0c;点击编辑点击用户 点击添加&#xff0c;设置用户名&#xff…

linux中最常用的帮助命令

文章目录 linux中最常用的帮助命令此man非man的意思man 的格式man的操作类似于whatis命令类似于apropos命令使用man的小技巧 你是干什么的 whatis拓展 指定目录的定位 whereis使用语法实例单独查找文件 刚刚好合适的 apropos 命令更多信息 linux中最常用的帮助命令 仅个人想法&…

2023-12-27 LeetCode每日一题(保龄球游戏的获胜者)

2023-12-27每日一题 一、题目编号 2660. 保龄球游戏的获胜者二、题目链接 点击跳转到题目位置 三、题目描述 给你两个下标从 0 开始的整数数组 player1 和 player2 &#xff0c;分别表示玩家 1 和玩家 2 击中的瓶数。 保龄球比赛由 n 轮组成&#xff0c;每轮的瓶数恰好为…

IO作业2.0

思维导图 1> 使用fread、fwrite完成两个文件的拷贝 #include <stdio.h> #include <string.h> #include <stdlib.h> int main(int argc, const char *argv[]) {if(argc ! 3) //判断外部参数 {printf("The terminal format is incorrect\n");r…

k8s-yaml格式

三种常见的项目发布方式&#xff1a; 蓝绿发布&#xff1a; 金丝雀发布&#xff08;灰度发布&#xff09;&#xff1a; 滚动发布&#xff1a; 应用程序升级&#xff0c;面临的最大的问题&#xff0c;就是新旧业务的更换&#xff0c;立项--定稿--需求发布--开发--测试--发布&…

纠删码ReedSolomon

随着大数据技术的发展&#xff0c;HDFS作为Hadoop的核心模块之一得到了广泛的应用。为了数据的可靠性&#xff0c;HDFS通过多副本机制来保证。在HDFS中的每一份数据都有两个副本&#xff0c;1TB的原始数据需要占用3TB的磁盘空间&#xff0c;存储利用率只有1/3。而且系统中大部分…

NGUI基础-图集制作(保姆级教程)

目录 图集是什么 如何打开图集制作工具 制作步骤 图集的三个关键配置 相关参数介绍 Atlas Material Texture Padding Tim Alpha PMA shader Unity Packer TrueColor Auto-upgrade Force Square Pre-processor 图集是什么 Unity图集&#xff08;Sprite Atlas&…