python爬虫—使用xpath方法进行数据解析

1. 背景信息

爬取安居客二手房源信息
URL地址:https://wuhan.anjuke.com/sale/?from=navigation
在这里插入图片描述

2. 代码实现

import requests
from lxml import etreeif __name__ == '__main__':# 1.指定URLurl = "https://wuhan.anjuke.com/sale/?from=navigation"# 2.UA伪装(模拟浏览器)headers = {'User-Agent' : 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/116.0.0.0 Safari/537.36'}# 3.发起请求并获取响应内容page_text = requests.get(url=url,headers=headers).text# print(page_text)# 4.使用etree进行数据解析tree = etree.HTML(page_text)# 5.存储div标签的对象div_list = tree.xpath('//section[@class="list"]/div')# print(div_list)fp = open('58.txt','w',encoding='utf-8')for div in div_list:# 局部解析title = div.xpath('./a/div[2]/div[1]/div[1]/h3/text()')[0]print(title)fp.write(title+'\n')

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/156204.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Vue 项目中如何使用Bootstrap5(简单易懂)

Vue 项目中如何使用Bootstrap5(简单易懂) 安装在 src/main.js 文件下引入包在vue文件中使用 Bootstrap官网(中文):https://www.bootcss.com/ Bootstrap5文档:https://v5.bootcss.com/docs/getting-started/…

40 深度学习(四):卷积神经网络|深度可分离卷积|colab和kaggle的基础使用

文章目录 卷积神经网络为什么要卷积卷积的具体流程池化tensorflow代码 深度可分离卷积原理介绍计算量对比代码参数计算例子 colab 和 kagglecolabkaggle如何在colab上使用kaggle的数据 卷积神经网络 卷积神经网络的基本结构 1: (卷积层(可选)池化层) * N全连接层 *…

java版直播商城平台规划及常见的营销模式 电商源码/小程序/三级分销+商城免费搭建

营销模式 通用版本(标准多商户入驻二级分销体系满减、满送、优惠券、组合销售、平台礼包等营销活动) 直播、短视频带货版本(标准多商户入驻直播、短视频带货二级分销体系满减、满送、优惠券、组合销售、平台礼包等营销活动) 特殊营…

跨境电商大作战:2023黑色星期五准备指南

黑色星期五,作为全球购物狂欢的象征,已经成为了电商业务的一年一度的重要节点。尤其对于跨境电商来说,这一天意味着巨大的商机和挑战。为了在这个竞争激烈的时刻脱颖而出,跨境电商必须做好充分的准备。Nox聚星在这里给大家分享几个…

Vue elemen ui 移除上次校验与部分清除上次校验

场景: 可以切换类型,下面的输入框参数也会随着改变。 如果不清除上次的校验就会出现,之前的大陆企业的校验还会出现在香港企业的校验中 方法: watch:{ruleForm.paymentSubjectType:{ 通过监听表单的类型来调用 clearValidate方…

耳朵小戴什么耳机合适,2023年适合小耳道的蓝牙无线耳机分享

你们是否曾为了追求音乐的同时,担心自己的听力健康呢?尤其是耳朵小的群体,佩戴入耳式时间一长,就会感觉耳道存在一定的疼痛感,不过别担心,现在有了一种完美的解决方案——骨传导耳机!这种炫酷的…

windows版本redis如何设置后踢启动和重启计算机之后自动重启redis

1. 进入redis安装目录 D:\softwarePackage\redis\Redis-x64-3.2.100 2. 打开dos窗口 使用以下命令来启动 Redis 服务器,并使其在后台运行 redis-server --service-start 3. 设置重启自启动 打开服务界面 (windowsr 输入 services.msc) 找…

英飞凌TC3xx-Overlay

目录 1.数据访问重定向 2.寄存器说明 3.Overlay功能配置 3.1 确认用于重定向的CPU 3.2 配置重定向Block大小 3.3 配置目标地址和重定向地址 4.结果验证 5.小结 今天说要开个专栏讲讲XCP标定,但在将标定之前,先把英飞凌专门为标定功能设计overlay…

redis基础语法

redis数据特性与常用数据类型 redis的数据都是以字符串形式存储,以键值对形式存在的。其数据为二进制安全的,所以默认不支持中文。且注意,其键是区分大小写的。 Redis存储的是key-value结构的数据,其中key是字符串类型&#xff…

pycharm更改远程服务器地址

一、问题描述 在运行一些项目时,我们常需要在pycharm中连接远程服务器,但万一远程服务器的ip发生了变化,该如何修改呢?我们在file-settings-python interpreter中找到远程服务器,但是发现ip是灰色的,没有办…

食品企业数字孪生可视化管理平台,实现智慧轻工业高质量发展

如今,数字技术正在打破传统食品产业的边界,随着食品加工产业链不断进化为智慧体,数字孪生技术已经成了食品行业数字进阶的重要抓手。食品加工数字孪生工厂,通过应用数字孪生技术,将食品加工工厂的自动化生产线全过程进…

Oracle(10)Managing Undo Data

目录 一、基础知识 1、AUM :Init Parameters AUM:初始化参数 2、AUM:Other Parameters AUM:其他参数 3、AUM:Sizing an UNDO TS AUM:调整UNDOTS的大小 4、AUM :Undo Quota AUM:撤消配额 5、Get Undo Segment Info 获取撤消段信息 二、基础操作 1、AUM:UNDO Tablespace …