多源异构数据采集与融合应用综合实践

news/2024/12/16 1:07:53/文章来源:https://www.cnblogs.com/wangzilian/p/18608983

综合设计——多源异构数据采集与融合应用综合实践

Recomind荐宝

这个作业属于哪个课程 首页 - 2024数据采集与融合技术实践 - 福州大学 - 班级博客 - 博客园
组名、项目介绍 组名:超级无迪爬虫高手元始天尊暴龙战士 Recomind荐宝是一款创新型的购物推荐网站,它整合了多源异构数据与先进的大语言模型技术。无论你是在寻找时尚服饰、电子产品、家居用品还是其他各类商品,只需向荐宝提供你心仪物品的文字描述或者图片,它就能为你精准推荐。 快速精准搜索和多平台信息处理。
团队成员学号 舒锦城042201520,王恒杰102202104,王梓铭102202105,杨邑豪102202117,邱予102202121,承宇豪102202134,王梓联102202154,郑奇键102202133
这个项目目标 利用各平台的信息反馈,通过大模型的整理与提炼,给予消费者相关物品的网址,满足信息过载下的购物需求

项目源码:https://gitee.com/wangzm7511/sjcj--recomind

项目总体概述

一、项目介绍

Recomind 荐宝通过智能爬虫技术,广泛收集小红书、贴吧等热门社交平台上用户们的评论和推荐信息。这些丰富的数据经过 AI 系统的深度分析和综合总结,最终筛选出最受欢迎的商品呈现在你眼前。这意味着,在这里你可以轻松获取大众认可的优质好物,节省购物时间,避免选择困难,获得更满意的购物体验。

二、项目目标

本项目旨在打造一个智能物品推荐系统,用户输入物品名称或上传其图片后,系统能快速调用 AI 接口,精准推荐包含百度贴吧、小红书以及该物品官方网站等相关信息源,提升用户获取物品信息的效率和精准度,优化信息检索体验,满足用户购物决策、产品研究等多方面需求。

三、技术介绍

前端技术

  • HTML:构建网页基本结构,负责呈现页面的文本、图片、链接等元素,保障信息的稳定展示,是前端可视化基础。

  • JavaScript:赋予前端动态交互能力,响应各类用户操作,实现页面元素动态更新、数据验证处理以及与后端的异步通信,处理用户交互逻辑。

  • Vue.js:基于响应式编程模型和组件化开发,双向数据绑定自动更新页面,组件化便于代码维护和复用,用于构建复杂前端交互界面,如搜索框、图片上传及结果展示区域等。

后端技术

  • Python:以简洁语法和丰富库生态处理复杂业务逻辑,包括接收解析前端数据、与 AI 模型交互、数据库操作等,借助第三方库加速开发进程,提高代码可读性与可维护性。

  • Django:高级 Python Web 框架,内置强大的路由、数据库抽象层、模板引擎等功能,遵循 “DRY” 原则,负责处理前端 HTTP 请求,协调各组件,保障后端服务稳定安全运行,防止常见网络攻击。

人工智能技术

  • 语言模型:利用先进预训练语言模型kimi AI,理解用户输入物品名称语义,筛选出相关网站信息,提升推荐准确性和相关性。

  • EfficientNet B0:用于图像识别,在保证准确率的同时平衡计算效率与模型复杂度,快速识别上传图片中的物品类别,并转化为文本信息辅助推荐,确保推荐流程的及时性与流畅性。

四、使用流程

打开软件,输入文字或者图片

点击开始分析,稍等片刻

即可看到软件给出的推荐商品的网站,同时也可以看到关键词

个人分工部分

我们组在确定的选题后,每个人分工明确,有前后端技术人员,爬虫技术人员以及AI分析。因为我的技术有限,我负责撰写项目相关资料和测试,包括阶段性报告和答辩ppt制作。

①项目相关资料的撰写

项目成果

  • 创新点:

多平台信息抓取

使用kimi大模型进行商品推荐

  • 功能:

文字输入与图片识别

AI 接口调用与推荐功能

  • 用户反馈:

从不同平台获取信息,包括用户评价、使用心得、产品参数,用户可以更全面地了解物品,快速综合比对后做出更明智的购买决策

团队协作

  • 承宇豪

负责后端内容,主要是编写 用kimi分析文字和图片,并使用爬虫爬取苏宁易购上的相似商品这一功能接口。

  • 王恒杰:

参与讨论本次多源异构数据采集与融合应用综合实践的方案设计,并负责成果整合和汇报展示部分。

  • 王梓铭

完成前端设计与实现,用fetch API****与后端交互,并部署后端至云端,解决跨域和静态资源托管问题,同时优化后端程序确保稳定运行。

  • 郑奇健

负责前端设计优化,提升UI/UX,实现响应式设计,完善交互功能,初步展示页面。

  • 舒锦城

负责撰写项目相关资料和测试,包括阶段性报告和答辩ppt制作,项目功能测试和提出修改建议,录制演示视频。

  • 王梓联

撰写项目报告,包括技术细节和用户手册。阶段性报告以及答辩ppt。

  • 邱予

负责后端部署维护,选框架并评估性能,优化AI服务调用效率和成本。

  • 杨邑豪

完成了调用KimiAPI接口的设计,实现问题输入与对话功能,接收并返回响应结果,确保数据格式正确、响应及时,满足业务需求。

总结与展望

  • 目标

开发一个网页支持用户输入文字或图片。

使用AI接口分析用户输入,提取关键词。

基于关键词爬取相关网站的数据。

使用AI对爬取的数据进行分析,输出结论返回用户。、

  • 实现

用户可以很快的获取多平台高赞商品的推荐帖子或商品网页,减少无关信息的干扰,节省搜索时间。

  • 未来展望

未来可能采用的新技术、新方法或新工具,以提升工作效率和质量。

②ppt制作

阶段性汇报ppt

答辩ppt

心得体会

首先,开发一个支持用户输入文字或图片的网页,需要熟悉HTML、CSS、JavaScript等前端技术。这不仅是构建用户界面的基础,也是实现交互功能的关键。通过这个过程,我深刻体会到前端技术在提升用户体验方面的重要性。为了处理用户请求、调用AI接口、管理爬虫任务以及返回结果,后端技术的选择与应用同样至关重要。我学习了如何使用Django框架来搭建服务器,处理请求与响应。这让我对前后端交互有了更深入的理解。使用AI接口分析用户输入的文本,提取关键词,这涉及到了NLP的基本技能。通过实践,我学习了如何使用现有的NLP库来快速实现文本分析功能。总之,这个项目不仅让我在技术层面有了显著提升,更重要的是,它教会了我如何在实践中解决问题。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/853567.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

综合设计 ——多源异构数据采集与融合应用综合实践

这个作业属于哪个课程 https://edu.cnblogs.com/campus/fzu/2024DataCollectionandFusiontechnology/组名 超级无迪爬虫高手元始天尊暴龙战士项目介绍 Recomind荐宝是一款创新型的购物推荐网站,整合了多源异构数据与先进的大语言模型技术。无论用户是在寻找时尚服饰、电子产品…

数据采集综合实践

这个项目属于哪个课程 https://edu.cnblogs.com/campus/fzu/2024DataCollectionandFusiontechnology/组名、项目简介 组名:都给爷爬项目目标:为心理疾病患者进行个性化的音乐疗愈项目需求:市面上大多数音乐软件都需要会员而且存在打榜等现象,不能完全个性化推荐,我们希望我…

2024CSICN长城杯--Crypto--WriteUp

2024CSICN&长城杯--Crypto--WriteUprasnd task: from Crypto.Util.number import getPrime, bytes_to_long from random import randint import osFLAG = os.getenv("FLAG").encode() flag1 = FLAG[:15] flag2 = FLAG[15:]def crypto1():p = getPrime(1024)q = g…

OS笔记

os cpu执行两种性质的程序内核态程序(管态) 用户态程序内核态执行的特权指令包含:I/O指令 中断指令 存取内存中寄存器指令 程序状态字寄存器变更指令和硬件关联的指令(最底层)包含:时钟管理 中断处理 设备驱动运行比较频繁的指令(最底层的上层)包含:进程管理 内存管理 设…

财务知识-会计做账全套流程

财务知识-会计做账全套流程

druid多数据源配置

AOP实现说明 jump数据源注解 DataSource.javaAOP实现 DataSourceAspect.java数据源常量 DataSourceNames.java动态数据源 DynamicDataSource.java动态数据源config DynamicDataSourceConfig.javaDataSource.java package com.saicmotor.carapp.service.bvalue.manage.common.co…

docker pull拉取镜像超时了 ,可以使用Github Action 构建docker镜像 可以构建arm架构 x86架构镜像

首先要有个GitHub账号把这个项目fork到自己账号底下 地址:https://github.com/wukongdaily/DockerTarBuilder fork了之后进入自己的这个项目底下 点击"Actions" 左边可以选择构建镜像的架构 右边输入要构建的镜像名 输入之后点击 ”Run workflow“ 进行构建 在这里…

44. JavaScript之BOM、DOM

1. BOM 1.1 概念 Browser Object Model是指浏览器对象模型,它使 JavaScript 能与浏览器进行交互。 BOM是浏览器提供的API集合,主要用于处理与浏览器环境相关的任务,如窗口管理、导航、cookie、location等。 1.2 window对象 [1]open() 第一个参数是目标网址,第二个参数可以为…

【嵌入式开发】到底什么是指令集?什么是微架构?他们是什么关系?

一、简述 二、指令集 三、微架构及其与指令集的关系? 四、芯片厂、ARM公司和这些指令集、微架构是什么关系? 五、x86和ARM的竞争!一、简述 CPU的设计遵循图灵机的基本设计思想:任何复杂的运算都可以分解为有限个基本指令的组合来完成。这些基本指令比如加、减、乘、与、或、…

福卫兵-多源异构数据采集与融合应用综合实践

这个项目属于哪个课程 <首页 - 2024数据采集与融合技术实践 - 福州大学 - 班级博客 - 博客园 (cnblogs.com)>这个作业要求在哪里 <综合设计 - 作业 - 2024数据采集与融合技术实践 - 班级博客 - 博客园 (cnblogs.com)>组名、项目简介 <组名:福小兵,项目需求:实…

福卫兵——多源异构数据采集与融合应用综合实践

福州大学多模态网络舆情分析与可视化系统序号 信息类别 内容描述1 这个项目属于哪个课程 数据采集与融合综合实践2 组名、项目简介 组名:福小兵,项目需求:实时舆情监控系统,项目目标:为福州大学提供舆情监控与决策辅助工具,技术路线:使用 Flask 后端、Memfire(PostgreSQ…

SQL优化之《预警事件统计》

在做一件什么事情: 在首页大屏上,可以通过各种维度展示事件统计信息。 sql如下:点击查看代码 SELECTcount( * ) count,camera_code groupName FROMalarm_event WHEREalarm_event.illegal_tag ="24"AND alarm_event.organization_code ="310000110000"AN…