python爬虫进阶篇:利用Scrapy爬取同花顺个股行情并发送邮件通知

一、前言

上篇笔记我记录了scrapy的环境搭建和项目创建和第一次demo测试。本篇我们来结合现实场景利用scrapy给我们带来便利。
有炒股或者其它理财产品的朋友经常会关心每日的个股走势,如果结合爬虫进行实时通知自己,并根据自己预想的行情进行邮件通知(比如某个股票如果到达100块钱就发邮件通知自己),这样会大大提高我们的炒股收益。

二、需求分析

  • 目标网站:同花顺A股市场行情
  • 目标数据:
    • 股票代码
    • 股票名称
    • 股票价格
    • 股票涨跌
      在这里插入图片描述

三、代码实现

  • 设置爬取的目标网页
    def start_requests(self):urls = ["http://q.10jqka.com.cn/"]for url in urls:yield scrapy.Request(url=url, callback=self.parse)
  • 解析目标信息的网页结构
    def parse(self, response):# 股票代码列表stock_id_list = response.css("div#maincont table.m-table.m-pager-table td:nth-child(2) a::text").extract()# 股票名称列表stock_name_list = response.css("div#maincont table.m-table.m-pager-table td:nth-child(3) a::text").extract()# 股票价格列表price_list = response.css("div#maincont table.m-table.m-pager-table td:nth-child(4)::text").extract()# 股票涨跌列表speed_up_list = response.css("div#maincont table.m-table.m-pager-table td:nth-child(6)::text").extract()for i in range(len(stock_id_list)):stock_id = stock_id_list[i]stock_name = stock_name_list[i]price = price_list[i]speed_up = speed_up_list[i]# 存到item,用来持久化item = ScrapyDemoItem()item["stock_id"] = stock_iditem["stock_name"] = stock_nameitem["price"] = priceitem["speed_up"] = speed_upyield item
  • 处理爬取的目标信息
    • 将目标信息存储为html形式
   def __init__(self):self.html = '<html><head><meta charset="utf-8"></head><body><table>'def process_item(self, item, spider):self.html = self.html + '<tr>'self.html = self.html + '<td>%s</td>' % item["stock_id"]self.html = self.html + '<td>%s</td>' % item["stock_name"]self.html = self.html + '<td>%s</td>' % item["price"]self.html = self.html + '<td>%s</td>' % item["speed_up"]self.html = self.html + '</tr>'return itemdef close_spider(self, spider):self.html = self.html + '</table></body></html>'self.send_email(self.html)print()
  • 发送邮件
    结合之前写的python发邮件的知识点《Python:发送qq邮箱只需几行代码轻松搞定》,将html内容发送到邮箱中
    def send_email(self, html):# 设置邮箱账号account = "xxx@qq.com"# 设置邮箱授权码token = "xxx"# 实例化smtp对象,设置邮箱服务器,端口smtp = smtplib.SMTP_SSL('smtp.qq.com', 465)# 登录qq邮箱smtp.login(account, token)# 添加正文,创建简单邮件对象email_content = MIMEText(html, 'html', 'utf-8')# 设置发送者信息email_content['From'] = 'xxx@qq.com'# 设置接受者信息email_content['To'] = '技术总是日积月累的'# 设置邮件标题email_content['Subject'] = '来自code_space的一封信'# 发送邮件smtp.sendmail(account, 'xxx@qq.com', email_content.as_string())# 关闭邮箱服务smtp.quit()

在这里插入图片描述

四、拓展

Scrapy是个很好用的框架,结合日常生活中的需求,我们可以写很多给我们带来便利的工具,以后会补上各种我多年来使用过的工具代码,都是基于Scrapy的使用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/288818.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

文件操作入门指南

目录 一、为什么使用文件 二、什么是文件 2.1 程序文件 2.2 数据文件 2.3 文件名 三、文件的打开和关闭 3.1 文件指针 3.2 文件的打开和关闭 四、文件的顺序读写 ​编辑 &#x1f33b;深入理解 “流”&#xff1a; &#x1f342;文件的顺序读写函数介绍&#xff1a; …

每日分享,以圣诞节为题的诗词

圣诞节即将来临&#xff0c;相信大家都会在朋友圈表达一下自己的情感&#xff0c;不管大家以前是怎么表达的&#xff0c;今天小编给你分享几首以圣诞节为题的几首诗&#xff0c;喜欢的朋友可以自取&#xff0c;想要更多免费的诗词&#xff0c;请自行百度或小程序搜索&#xff1…

java并发-ConcurrentHashMap 在Java7 和 8 的区别

文章目录 1.Java 7 版本的 ConcurrentHashMap2.Java 8 版本的 ConcurrentHashMap3.分析 Java 8 版本的 ConcurrentHashMap 的重要源码3.1.Node 节点3.2.put 方法源码分析3.3.get 方法源码分析 4.对比 Java7 和 Java8 的异同和优缺点4.1.并发度4.2.保证并发安全的原理4.3.遇到 H…

HarmonyOS ArkTS 中DatePicker先择时间 路由跳转并传值到其它页

效果 代码 代码里有TextTimerController 这一种例用方法较怪&#xff0c;Text ,Button Datepicker 的使用。 import router from ohos.router’则是引入路由模块。 import router from ohos.router Entry Component struct TextnewClock {textTimerController: TextTimerContr…

鸿蒙Harmony4.0开发-ArkTS基础知识运用

概念 1.渲染控制语法&#xff1a; 条件渲染&#xff1a;使用if/else进行条件渲染。 Column() {if (this.count > 0) {Text(count is positive)} }循环渲染&#xff1a;开发框架提供循环渲染&#xff08;ForEach组件&#xff09;来迭代数组&#xff0c;并为每个数组项创建…

京东一面:post为什么会发送两次请求?

在前段时间的一次面试中&#xff0c;被问到了一个如标题这样的问题。要想好好地去回答这个问题&#xff0c;这里牵扯到的知识点也是比较多的。 那么接下来这篇文章我们就一点一点开始引出这个问题。 同源策略 在浏览器中&#xff0c;内容是很开放的&#xff0c;任何资源都可…

Python数据处理必备:Pandas DataFrame中行迭代技巧大曝光!

更多资料获取 &#x1f4da; 个人网站&#xff1a;ipengtao.com 在数据分析和处理中&#xff0c;Pandas是Python中最常用的库之一&#xff0c;而DataFrame是Pandas的核心数据结构之一。迭代DataFrame中的行是一种常见的操作&#xff0c;本文将详细介绍几种迭代DataFrame行的方…

致深空中最遥远的你

"旅行者1号" 的在11月14日飞行数据系统陷入了自动重复的状态&#xff0c;飞行数据系统的电信单元开始重复发回1和0模式就像陷入循环一样&#xff0c;旅行者1号目前离地球约240亿公里发回的消息需要大约22.5小时的传播时间。NASA分析故障来官探测器上的两台计算机&…

如何将图片转为PDF

问题描述&#xff1a;如何将图片转为PDF&#xff0c;有时需要将纸质文档扫描成PDF&#xff0c;然后上传到网上。 解决办法&#xff1a;平时使用的方法是将图片插入到word文件中&#xff0c;然后将图片设置为浮于文字下方&#xff0c;然后调整图片的大小&#xff0c;铺满整个wo…

Postman使用总结--生成测试报告

1.执行生成的命令格式 newman run 用例集文件 .json -e 环境文件 .json -d 数据文件 .json/.csv -r htmlextra --reporter- htmlextra-export 测试报告名 .html -e 和 -d 是 非必须的。 如果没有使用 环境&#xff0c;不需要指定 -e 如果没有使用 数据…

【六大排序详解】开篇 :插入排序 与 希尔排序

插入排序 与 希尔排序 六大排序之二 插入排序 与 希尔排序1 排序1.1排序的概念 2 插入排序2.1 插入排序原理2.2 排序步骤2.3 代码实现 3 希尔排序3.1 希尔排序原理3.2 排序步骤3.3 代码实现 4 时间复杂度分析 Thanks♪(&#xff65;ω&#xff65;)&#xff89;下一篇文章见&am…

【Python动漫系列】小香香(完整代码)

文章目录 环境需求完整代码程序分析系列文章环境需求 python3.11.4及以上版本PyCharm Community Edition 2023.2.5pyinstaller6.2.0(可选,这个库用于打包,使程序没有python环境也可以运行,如果想发给好朋友的话需要这个库哦~)【注】 python环境搭建请见:https://want595.…