演示代码:
responce = requests.get(url = url_web,headers=head) url_obj = re.compile(r'<a class="media-content" target="_blank" href="(?P<url>.*?)" title=".*?" ',re.S) list_url = url_obj.finditer(responce.text)
通过AI分析代码内容:
可以了解到这一串代码的逻辑:
1、先获取网页数据
2、定义一个正则表达式,用来提取网页内想要的数据
3、使用finditer方法在给定的文本内通过步骤2定义的逻辑筛选数据,同时把数据存储到数列中
解决场景:
主要用于解决数据存储在有相同结构的返回数据中