1 赛题
问题C 我国新能源电动汽车的发展趋势
新能源汽车是指以先进技术原理、新技术、新结构的非常规汽车燃料为动力来源( 非常规汽车燃料指汽油、柴油以外的燃料),将先进技术进行汽车动力控制和驱动相结 合的汽车。新能源汽车主要包括四种类型:混合动力汽车、纯电动汽车、燃料电池电动 汽车和其他新能源汽车。新能源电动汽车作为一种新型汽车,由于其低污染、低能耗、 能够调节峰值用电量的特点,近年来取得了快速的发展。新能源电动汽车,包括电动公交车和少于7座的家庭电动汽车,已经受到了世界各地的消费者和政府的欢迎。
2011年以来,中国政府积极推动新能源电动汽车的发展,制定了一系列优惠政策 。新能源电动汽车产业取得了巨大的发展,逐渐成为“ 中国高铁 ”之后的另一个中国标志。现在,我们邀请您的团队来完成以下问题。 ”
问题1:
分析影响中国新能源电动汽车发展的主要因素,建立数学模型,描述这些因素对中国新能源电动汽车发展的影响。
问题2:
收集中国新能源电动汽车的行业发展数据,建立一个数学模型,以描述和预测未来10年中国新能源电动汽车的发展情况。
问题3:
收集数据,建立数学模型,分析新能源电动汽车对全球传统能源汽车产业的影响。
问题4:
一些国家制定了一系列针对中国抵制新能源电动汽车发展的政策。建立数学模型,分析这些政策对我国新能源电动汽车发展的影响。
问题5:
分析城市新能源电动汽车(包括电动公交车)电气化对生态环境的影响。假设城市人口为100万,则提供该模型的计算结果。
问题6:
根据问题5的结论,给公民写一封公开信,宣传世界各地对新能源电动汽车的好处和电动汽车行业的贡献。
2 赛题分析
A题属于图像目标检测与图像特征提取分类问题,需要用到深度学习算法,题目开放性不高,但需要找到合适的网络进行训练,训练阶段会比较麻烦!
B题属于经典的物理建模与目标优化问题,往往计算量较大,会有一定难度!
C题属于自由性数据分析题型,需要自己找到数据,做传统的数据挖掘即可!
本次建模题目难度(由高到低) C=A>B
!!!A君会先出AC题思路!!!
3 更新记录
C题的开放度非常高,不仅要自己找数据,还需要自己构建模型.。
寻找影响主题的相关因子,找到了因子就是找到了变量!
有了相关因素以后,接下来一步我们需要找到相关数据,然后量化我们上一步找的因素!
C题第一问思路已更新:
C题爬虫+数据更新:
目前市面上没有免费的新能源数据集合,数据都相对零散,需要逐个手动收集,A君实现了一个爬虫爬取相关数据开放给大家
数据来源
爬取的数据来源于以下三部分:
- 1 道路机动车辆生产企业及产品,基本为doc文件形式
- 2 新能源汽车推广应用推荐车型目录,基本为html形式
- 3 免征车辆购置税的新能源汽车车型目录,基本为pdf文件形式
其中数据主要为第2、3部分。
项目结构说明
vehicles_db/
|-- data/
| |-- origin_data(由 Spider 爬取的原始文件)
| |-- output(解析清洗后的 Excel 数据文件)
| |-- revised_data(对原始文件的备份及修改)
|
|-- DataParser/
| |-- __init__.py
| |-- clean_data.py(清洗数据脚本)
| |-- convert.py(转换文件格式脚本)
| |-- main.py(数据解析主程序)
| |-- output.py(输出解析后数据)
| |-- parse_data.py(对不同文件格式的表格数据进行解析)
|
|-- Spider/
| |-- __init__.py
| |-- download.py(下载目标链接的响应内容)
| |-- main.py(爬虫主程序)
| |-- output.py(下载目标文件)
| |-- parse_respa.py(对响应内容进行解析)
| |-- spider.py(异步爬虫函数)
| |-- urls.py(构造初始 url)
|
|-- __init__.py
|-- main.py
环境及依赖
- Python 3.X
- pandas
- win32com
- pdfplumber
- docx
- bs4
- aiohttp
- asyncio
- json
运行方法
进入 vehicles_db 文件夹,运行 main.py 文件即可。
输出数据位于 /data/output 文件夹中。
输出
部分输出如图所示:
爬虫代码不需要大家重新运行,数据已经爬好上传,大家直接下载即可!
4 最新思路更新
🥇 最新思路更新(看最新发布的文章即可):
https://blog.csdn.net/dc_sinor?type=blog