CSP-202012-2-期末预测之最佳阈值

CSP-202012-2-期末预测之最佳阈值

【70分思路】

  • 本题的难点还是时间复杂度,暴力枚举会导致时间超限。
  • 对于每一个可能的阈值theta,代码都重新计算了整个predict数组,统计预测正确的数目,因为有两个嵌套的循环,使得时间复杂度是O(m^2)
#include <iostream>
using namespace std;
int main() {int m;cin >> m;int* y = new int[m];int* result = new int[m];int* ac_num = new int[m];int ac_num_max = -1, y_max = -1;for (int i = 0; i < m; i++){cin >> y[i] >> result[i];ac_num[i] = 0;}for (int i = 0; i < m; i++){int theta = y[i];int* predict = new int[m];for (int j = 0; j < m; j++){predict[j] = 0;}// 计算predictfor (int j = 0; j < m; j++){if (y[j] >= theta){predict[j] = 1;}}// 统计正确次数for (int j = 0; j < m; j++){if (predict[j] == result[j]){ac_num[i]++;}}// 预测正确的次数最多if (ac_num[i] > ac_num_max){ac_num_max = ac_num[i];y_max = theta;}// 多个阈值均可以达到最高准确率时,选取其中最大的else if (ac_num[i] == ac_num_max){if (theta > y_max){y_max = theta;}}delete[]predict;}cout << y_max;delete[]y;delete[]result;delete[]ac_num;return 0;
}

【100分思路】

【核心思路】:利用排序一次遍历来减少计算量。思路是先将输入的y数组和结果result数组按照y值排序,然后一次性计算不同theta值对应的正确预测数量。这样做可以将时间复杂度降低到O(m log m)(主要是排序的时间复杂度,之后只需线性时间就可以计算所有可能的theta值)
上述代码通过一种巧妙的方法实现了对不同theta(阈值)的处理,仅通过单次遍历数据即可更新基于不同theta值的预测正确数。这种方法的核心在于利用排序后的数据和对预测正确数的连续更新,而不是重新计算每一个可能的theta值对应的预测正确数。以下是这个过程的详细解释:

具体思路

  1. 排序数据: 首先,通过将数据点按y值进行排序,确保在遍历数据时,theta值是逐渐增加的。这意味着,我们只需要考虑在这些y值变化的地方theta可能会导致预测结果的变化,而不是在每个可能的y

  2. 初始化正确预测数: 在开始遍历之前,计算了一个初始的正确预测数,这是基于假设theta小于最小y值(即所有数据点的预测结果都是1)的情况。这相当于设置了一个非常低的初始阈值,使得所有预测都是1,然后计算这个情况下正确预测的数量。

  3. 遍历并更新: 遍历排序后的数据时,每次遇到一个新的y值,都相当于theta发生了变化

    • 如果theta小于当前的y值,当前点的预测结果会是1;
    • 如果theta等于或大于当前的y值,当前点的预测结果则为0(假设预测规则是y >= theta为1,否则为0)。
    • 每当theta变化,都会影响到当前点的预测正确与否。
      • 如果当前点实际结果为1,那么当theta增加到等于当前点的y值时,之前计入的正确预测数需要减1(因为这个点现在被错误地预测为0)
      • 如果当前点的实际结果为0,相反的,当theta增加到等于当前点的y值时,之前未计入的正确预测数需要增加1(因为这个点现在被正确地预测为0)。这一逻辑体现在对currentPredictions的更新上。
  4. 处理相同的y值: 在实际数据中,可能存在多个数据点具有相同的y值。当处理这样的数据点时,只有在所有具有相同y值的数据点都被考虑完毕后,才会更新theta值。这意味着,如果连续几个数据点有相同的y值,我们会在遍历到最后一个具有该y值的数据点后,才考虑theta值的变化对预测正确数的影响。这一点通过跳过重复y值的逻辑实现,从而确保了每个不同的theta值只被考虑一次。

  5. 更新最大准确预测数和theta 在遍历过程中,每次theta变化后,都会评估当前的正确预测数。如果这个数值超过了之前记录的最大准确预测数,或者在达到相同的最大准确预测数时具有更大的theta值,则更新记录的最大准确预测数和对应的theta值。这保证了在所有考虑的theta值中,选择了能够产生最大准确预测数的最大theta值。

#include <iostream>
#include <algorithm>
using namespace std;struct Data {int y;int result;
};// 比较函数,用于sort对Data数组进行排序,基于y值升序排列
bool compareData(const Data& a, const Data& b) {return a.y < b.y;
}int main() {int m;cin >> m; Data* data = new Data[m]; for (int i = 0; i < m; i++) {cin >> data[i].y >> data[i].result;}    sort(data, data + m, compareData); // 对数据点按y值进行升序排序int correctPredictions = 0; // 正确预测的初始数量,假设所有数据点的预测结果都是1for (int i = 0; i < m; i++) {if (data[i].result == 1) {correctPredictions++; // 统计实际结果为1的数量}}int ac_num_max = correctPredictions; // 记录最大准确预测数int y_max = data[0].y; // 记录达到最大准确预测数的y阈值int currentPredictions = correctPredictions; // 当前阈值下的准确预测数for (int i = 0; i < m; i++) {// 如果当前点的实际结果为0,则假设以当前点的y值为阈值时,将使得预测为1的数量增加// 因为实际为0但预测为1的情况会减少if (data[i].result == 0) {currentPredictions++;}else {// 反之,如果实际结果为1,以当前点的y值为阈值会使得这个点预测错误(预测为0),因此准确预测数减少currentPredictions--;}// 跳过重复的y值,避免对相同阈值的重复计算if (i < m - 1 && data[i].y == data[i + 1].y) {continue;}// 更新记录的最大准确预测数及对应的y阈值// 这里的条件是为了确保,当有多个阈值产生相同的最大准确预测数时,选择y值较大的那个if (currentPredictions >= ac_num_max) {ac_num_max = currentPredictions;// 选择下一个不同的y值作为阈值,确保在所有相同的最大准确预测数中选择最大的y值y_max = i < m - 1 ? data[i + 1].y : data[i].y;}}cout << y_max; // 输出达到最大准确预测数的最大y阈值delete[] data; // 释放动态分配的内存return 0;
}

请添加图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/463428.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Redis(02)——事务管理

事务概念 Redis事务的本质是一组命令的集合。事务支持一次执行多个命令&#xff0c;一个事务中所有命令都会被序列化&#xff0c;在事务执行过程中&#xff0c;会按照顺序串行化执行队列中的命令&#xff0c;其他客户端提交的命令请求不会插入到事务执行命令序列中 Redis事务…

图书商城系统

文章目录 图书商城系统一、项目演示二、项目介绍三、系统部分功能截图四、部分代码展示五、底部获取项目&#xff08;9.9&#xffe5;带走&#xff09; 图书商城系统 一、项目演示 网上书城 二、项目介绍 基于SSM的图书商城网站 运行环境:idea或eclipse 数据库:mysql 开发语…

外包干了一个月,技术明显进步。。。。

先说一下自己的情况&#xff0c;本科生&#xff0c;19年通过校招进入南京某软件公司&#xff0c;干了接近2年的功能测试&#xff0c;今年年初&#xff0c;感觉自己不能够在这样下去了&#xff0c;长时间呆在一个舒适的环境会让一个人堕落!而我已经在一个企业干了2年的功能测试&…

CVE-2022-0760 漏洞复现

CVE-2022-0760 NSS [HNCTF 2022 WEEK2]ohmywordpress 【CVE-2022-0760】 题目描述&#xff1a;flag在数据库里面。 开题&#xff1a; 顺着按钮一直点下去会发现出现一个按钮叫安装WordPress 安装完之后的界面&#xff0c;有一个搜索框。 F12看看network。 又出现了这个Wor…

【SpringBoot】Redis集中管理Session和自定义用户参数解决登录状态及校验问题

&#x1f3e1;浩泽学编程&#xff1a;个人主页 &#x1f525; 推荐专栏&#xff1a;《深入浅出SpringBoot》《java对AI的调用开发》 《RabbitMQ》《Spring》《SpringMVC》 &#x1f6f8;学无止境&#xff0c;不骄不躁&#xff0c;知行合一 文章目录 前言一、分布…

Taro+ vue3 + template nut-ui 4.0 + pinia 的前端框架模板搭建

1.展示 目前我们有一个需要做H5 微信小程序的需求。当然我们可选的框架有很多,比如说:uni-app Taro京东框架 去做这些前端需求 2.介绍 Taro ①.项目的具体结构 Taro框架中 的目录结构 大体上都是一样的 page页面 store ② 项目的store 状态管理 状态管理使用的是pinia v…

探索C语言的内存魔法:动态内存管理解析

✨✨ 欢迎大家来到贝蒂大讲堂✨✨ &#x1f388;&#x1f388;养成好习惯&#xff0c;先赞后看哦~&#x1f388;&#x1f388; 所属专栏&#xff1a;C语言学习 贝蒂的主页&#xff1a;Betty‘s blog 1. 静态开辟内存 通过前面的学习&#xff0c;我们已经掌握了两种开辟内存的方…

滑块验证码识别代码分享

平时我们开发爬虫会遇到各种各样的滑动验证码&#xff0c;如下图所示&#xff1a; 为了解决这个问题&#xff0c;我写了一个通用的滑块验证码识别代码&#xff0c;主要是分析图片&#xff0c;然后计算出滑块滑动的像素距离。但是像素距离大多数情况下都不会等于滑动距离&#x…

【Make编译控制 06】CMake初步使用

目录 一、概述与安装 二、编译源文件 三、无关文件管理 一、概述与安装 CMake是一个跨平台的项目构建工具&#xff0c;相比于Makefile&#xff0c;CMake更加高级&#xff0c;因为CMake代码在执行的时候是会先翻译生成Makefile文件&#xff0c;再调用Makefile文件完成项目构…

EMC学习笔记(二十三)降低EMI的PCB设计指南(三)

双层板电源分配 1.单点与多点分布2.星型分布3.创建网格平面4.旁路和磁珠5.将噪声保持在芯片附近 tips&#xff1a;资料主要来自网络&#xff0c;仅供学习使用。 1.单点与多点分布 在一个真正的单点配电系统中&#xff0c;每个有源元件都有自己独立的电源和地&#xff0c;这些…

金融信贷风控决策引擎详解

风控决策引擎含义 风控决策引擎是对复杂的业务逻辑抽象化剥离出来的业务规则进行不同的分支组合、关联&#xff0c;然后层层规则递进运算&#xff0c;最终输出决策结果的产品。 传统的风控决策引擎主要实现规则的逻辑判断&#xff0c;例如&#xff1a;女厕所的规则可以制定成“…

Electron+Vue实现仿网易云音乐实战

前言 这个项目是我跟着官方文档的那个Electron入门教程大致跑了一遍,了解了下Electron开发流程之后的实战项目,所以中间应该是会有很多写法不是很规范,安全性有可能也没考虑到,可实现的各种api也不是很了解,适合初学者。 必须感谢 https://github.com/Binaryify/NeteaseC…