微软近日推出了Phi-2，这是一款小型语言模型，但其性能却十分强大-编程知识

微软近日推出了Phi-2，这是一款小型语言模型，但其性能却十分强大

news/2025/1/11 3:49:31/文章来源:https://blog.csdn.net/2301_79342058/article/details/135073432

每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/

来这里看看： https://huggingface.co/microsoft/phi-2

当我们谈论与生成性人工智能（AI）相关的语言模型时，我们通常首先想到的是大型语言模型（LLM），这些模型驱动了大多数流行的聊天机器人，例如ChatGPT、Bard和Copilot。然而，微软的新型语言模型Phi-2展示了小型语言模型（SLM）在生成性AI领域也有巨大的潜力。

微软于周三发布了Phi-2，这是一款能够进行常识推理和语言理解的小型语言模型，现已在Azure AI Studio模型目录中提供。尽管Phi-2被称为“小型”，但它在模型中包含了27亿参数，远超过Phi-1.5的13亿参数。Phi-2在不到130亿参数的语言模型中展现了“最先进的性能”，甚至在复杂基准测试中超越了规模大25倍的模型。Phi-2在多个不同的基准测试中超越了包括Meta的Llama-2、Mistral以及谷歌的Gemini Nano 2在内的模型，Gemini Nano 2是谷歌最强大LLM的最小版本。

Phi-2的性能结果与微软开发具有突破性能力和与大规模模型相当性能的SLM的目标一致。

微软在训练Phi-2时非常挑剔地选择了数据。公司首先使用了所谓的“教科书质量”数据。微软随后通过添加精心挑选的网络数据来增强语言模型数据库，这些数据在教育价值和内容质量上经过了筛选。

那么，为什么微软专注于SLM？

SLM是LLM的一种成本效益较高的替代品。在不需要LLM的强大能力来完成任务时，较小的模型也很有用。

此外，运行SLM所需的计算能力远低于LLM。这种降低的要求意味着用户不必投资昂贵的GPU来满足他们的数据处理需求。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/285119.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

redis各种数据类型的应用场景

redis各种数据类型的应用场景

String应用场景单值缓存 SET key value GET key 对象缓存 SET user:1 value(json格式数据)MSET user:1:name zhuge user:1:balance 1888 MGET user:1:name user:1:balance 分布式锁 SETNX product:10001 true //返回1代表获取锁成功 …

阅读更多...

iPhone 17Pro/Max或升级4800万像素长焦镜头，配备自研Wi-Fi 7芯片。

iPhone 17Pro/Max或升级4800万像素长焦镜头，配备自研Wi-Fi 7芯片。

iPhone 16未至，关于iPhone 17系列的相关消息就已经放出，到底是谁走漏了风声。海通国际证券技术分析师Jeff Pu近日发布报告称，苹果将为2025年推出的iPhone 17ProMax配备4800万像素的长焦镜头。经调查，该分析师认为提升iPhone拍摄方…

阅读更多...

【百度PARL】强化学习笔记

【百度PARL】强化学习笔记

文章目录强化学习基本知识一些框架Value-based的方法Q表格举个例子强化的概念TD更新 Sarsa算法SampleSarsa Agent类 On_policy vs off_policy函数逼近与神经网络DQN算法DQN创新点DQN代码实现model.pyalgorithm.pyagent.py总结：举个例子实战视频：世界…

阅读更多...

centos安装opencv并在springboot中使用

centos安装opencv并在springboot中使用

使用conda安装opencv，并在docker运行的容器中使用，这里以运行则springboot应用的容器为例步骤一：安装在conda中安装 # 安装依赖 conda install numpy matplotlib# 安装opencv conda install -c conda-forge opencv # 或者制定版本 conda…

阅读更多...

AI创作系统ChatGPT网站源码，支持AI绘画，支持GPT语音对话+智能思维导图生成

AI创作系统ChatGPT网站源码，支持AI绘画，支持GPT语音对话+智能思维导图生成

一、前言 SparkAi创作系统是基于ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统，支持OpenAI-GPT全模型国内AI全模型。本期针对源码系统整体测试下来非常完美，可以说SparkAi是目前国内一款的ChatGPT对接OpenAI软件系统。那么如何搭建部署AI创作Ch…

阅读更多...

开发企业展示小程序的关键步骤和技巧

开发企业展示小程序的关键步骤和技巧

随着移动互联网的快速发展，小程序已经成为企业展示形象、推广产品和服务的重要工具。拥有一个优秀的小程序可以帮助企业提高品牌知名度，吸引更多潜在客户，提升用户体验。以下是拥有一个展示小程序的步骤： 确定需求和目标首先&am…

阅读更多...

linux修改用户uid和gid并且修改文件所有权（所属用户及所属用户组）（chown命令、chgrp命令）（批量修改查找并修改文件、目录uid和gid）

linux修改用户uid和gid并且修改文件所有权（所属用户及所属用户组）（chown命令、chgrp命令）（批量修改查找并修改文件、目录uid和gid）

文章目录修改Linux用户UID和GID以及文件所有权1. 修改用户的UID和GID1.1 用户UID和GID的概念1.2 修改用户UID1.3 修改用户GID 2. 修改文件所有权2.1 文件所有权的概念2.2 修改文件所有者（chown命令）2.3 修改文件所属用户组（chgrp命令&#x…

阅读更多...

测试工具Jmeter：下载安装与环境配置

测试工具Jmeter：下载安装与环境配置

Jmeter是一款很出色的测试工具，这篇文章将介绍Jmeter的下载、安装和环境配置。 1. Jmeter下载 Jmeter官网：Apache JMeter - Download Apache JMeter 如图中所示，第一个下载项是运行在Linux中的，第二个是Windows运行的&#xff0…

阅读更多...

Gitlab仓库推送到Gitee仓库的一种思路

Gitlab仓库推送到Gitee仓库的一种思路

文章目录 Gitlab仓库推送到Gitee仓库的一种思路1、创建Gitee的ssh公钥（默认已有Gitlab的ssh公钥）2、添加Gitlab远程仓库地址3、添加Gitee远程仓库地址4、拉取Gitlab远程仓库指定分支到本地仓库指定分支（以test分支为例）5、推送本地…

阅读更多...

超详细整理，Java接口自动化测试实战-rest-assured

超详细整理，Java接口自动化测试实战-rest-assured

1、关于rest-assured rest-assured 是一个能够简化测试rest服务的Java DSL，像ruby或者python一样的动态语言去测试和验证http服务。基于java并且兼容了groovy动态语言的特性，使我们像写脚本语言一样去测试http服务。例如：你的http服务&a…

阅读更多...

【玩转 TableAgent 数据智能分析】股票交易数据分析+预测

【玩转 TableAgent 数据智能分析】股票交易数据分析+预测

文章目录一、什么是TableAgent二、TableAgent 的特点三、实践前言四、实践准备4.1 打开官网4.2 注册账号4.3 界面介绍4.4 数据准备五、确认分析需求六、TableAgent体验七、分析结果解读八、总结&展望一、什么是TableAgent TableAgent是一款面向企业用户的智能数据分析工…

阅读更多...

我做了一个在手机灵动岛锁屏看实时网速/步数/下班倒计时/跑步距离/照片/待办/倒计时/手机使用次数/帧率...的软件

我做了一个在手机灵动岛锁屏看实时网速/步数/下班倒计时/跑步距离/照片/待办/倒计时/手机使用次数/帧率...的软件

我做了一个在手机灵动岛&锁屏看实时网速/步数/下班倒计时/跑步距离/照片/待办/倒计时/手机使用次数/帧率…的软件 Island Widgets 的作用： 提醒您 ： 准时下班每天运动陪伴家人保持体重放下手机每日待办当前网速手机使用强度实时热搜现在天气… 初…

阅读更多...

推荐文章

最新文章