国产最强多模态大模型Step Fun-1V,究竟有多好用?

前言:

2023年是大模型的元年,随着ChatGPT的爆火,将大模型带入了公众的视野 ,国内也随之掀起了百模大战的浪潮。在这股浪潮的推动下,诸多科技公司,乃至大厂都争相推出自己的大模型产品,希望能够在大模型领域占据一席之地。一时间,各种大模型如雨后春笋般涌现。故而,今天就来介绍一下,国产最强多模态大模型-阶跃星辰。


 在其它大模型都忙着展示自己的身姿,吸引市场注意力的时候,

阶跃星辰则一直在蛰伏,不断的打磨自己的产品。

直到2024年3月份才正式对外发布了Step系列通用大模型,包括:

Step-1千亿参数语言大模型

Step-1V千亿参数多模态大模型

Step-2万亿参数MoE语言大模型预览版

其中,Step-1V一经发布,就直接登顶国内多模态榜首

这是OpenCompass发布的,截止到2024年5月2日的全球多模态排行榜,

GPT-4毋庸置疑依旧冠绝群雄,

排除掉开源的 InternVL-Chat-V1.5,紧随其后的就是Step-1V了。

在具体介绍之前,我们先来简单的了解一下阶跃星辰的团队背景

其创始人是前微软全球副总裁、微软亚洲互联网工程院首席科学家姜大昕博士

在微软期间,他负责了Bing的全球搜索体验工作,以及AI School China和NLP方向的技术研发

其核心团队也由在人工智能领域经验丰富的顶尖人才组成

目前,团队已经扩展到了150多人的规模

言归正传,阶跃星辰目前一共发布了两款To C的产品:

跃问:个人效率助手

冒泡鸭:AI互动平台

咱也是申请到了内测资格,下面就让大家看看它的多模态到底是怎么个事?

先来试一下它的解读能力

效果还不错,再来试一下,联网和检索的能力

最近比较火的网络热梗,也是不在话下

让它来解读一下Sora的技术报告

把技术报告原文丢给它,几秒钟后,就把它消化好了

再试一下它的识图能力

可能是我上传的照片有点局限,下面我又重新上传了一张全景

果不其然,它立马清晰的描绘出了照片中的建筑物,指出了东方明珠、中心大厦等地标建筑

再看一下它的数据处理和逻辑输出的能力

结果显而易见,完全没毛病,NaN是因为没有2020年的数据,

所以无法计算出2021年的净利增长率

个人感觉,整体使用下来,效果确实不错,

多模态该有的能力都有,但是具体的效果如何,还是需要大家自行去深入体验。

下面,再来看看阶跃星辰的第二个 To C产品 冒泡鸭,

它是一个AI开放世界平台,里面有诸多的智能对话体,

可以通过对话的方式来沉浸到剧情的角色扮演中

探索性和趣味性都很强,比较符合年轻人的口味。

随便点开了一个智能体,跟他聊了一下,根本停不下来,我说的话它基本都能接上

里面几乎可以表达你的所有想法(懂的都懂),确实挺好玩 

小哥哥和小姐姐的声音真好听~

除了这种聊天的智能体以外,还可以玩单人版“剧本杀”,都非常有意思 

冒泡鸭目前有app版和web版, 感兴趣的小伙伴可以自行去体验一下


综合来看,阶跃星辰发布的两款产品,都比较符合年轻人的口味,也是目前大模型产品发展的主流方向,除了阶跃星辰之外,还有之前我们介绍过的MiniMax也在做智能问答体的产品。

阶跃星辰蛰伏一年,确实给了大家一个满意的答复,目前他们正在内测万亿参数的大模型Step-2,浅浅的期待一下吧。

最后的最后,如果你觉得咱写的文章有那么一丁丁的意思,不妨点个赞,顺手留个关注,

小的必将兢兢业业的给大家带来更有意思的文章~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/671394.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Flutter开发Dart中的队列(Queue)

文章目录 Dart中的队列(Queue)基本操作示例队列的类型队列的应用总结 Dart中的队列(Queue) 队列是一种抽象的数据结构,遵循“先进先出”(FIFO)的原则。这意味着最早添加的元素将首先被移除。队…

Java基础教程 - 5 数组

更好的阅读体验:点这里 ( www.doubibiji.com ) 更好的阅读体验:点这里 ( www.doubibiji.com ) 更好的阅读体验:点这里 ( www.doubibiji.com ) 5 数组 前面我们保存数据…

正则将段落分割成句子

这里分割段落不区分中英文标点,你可以根据需求改 分割后标点跟随句子后面 def split_sentences_keep_delimiter(text):pattern r[^。!!??::;;,,][。!!??::;&#xff…

与Apollo共创生态:让智驾技术为各行业发展赋能

目录 一、引言 二、Apollo七周年大会主要内容回顾 2.1活动回顾链接 2.2Apollo项目介绍 2.2.1Apollo项目发展介绍 2.2.2实验用车传感器介绍 2.2.3硬件连接概述 2.2.4软件概述 2.3Apollo X 企业自动驾驶解决方案介绍 2.3.1Apollo X 企业自动驾驶解决方案优势 2.3.2 Ap…

LIUNX系统编程:进程池的实现

1.什么是进程池 每一个可执行程序,在被执行前都要转化为进程,操作系统都要为其创建PCB,地址空间,页表,构建映射关系,进程池就是创建进程时,创建很多个进程,如果要执行程序&#xff…

认识ansible 了解常用模块

ansible是什么? Ansible是一个基于Python开发的配置管理和应用部署工具,现在也在自动化管理领域大放异彩。它融合了众多老牌运维工具的优点,Pubbet和Saltstack能实现的功能,Ansible基本上都可以实现。是自动化运维工具&#xff0…

硬件设计 之 压敏电阻简单介绍

1. 什么是压敏电阻(Varistor Voltage): 压敏电阻(Varistor)是一种特殊类型的电阻器件,具有非线性电阻特性。它的主要作用是保护电子电路免受过电压或过电流的损害。 测定电流为1mA,此时TNR端子…

触动精灵纯本地离线文字识别插件

目的 触动精灵是一款可以模拟鼠标和键盘操作的自动化工具。它可以帮助用户自动完成一些重复的、繁琐的任务,节省大量人工操作的时间。但触动精灵的图色功能比较单一,无法识别屏幕上的图像,根据图像的变化自动执行相应的操作。本篇文章主要讲解…

LeetCode 226.翻转二叉树(全网最多的解法)

LeetCode 226.翻转二叉树 1、题目 题目链接:226. 翻转二叉树 给你一棵二叉树的根节点 root ,翻转这棵二叉树,并返回其根节点。 示例 1: 输入:root [4,2,7,1,3,6,9] 输出:[4,7,2,9,6,3,1]示例 2&#…

4.堆_树(汇总版)

目录 1.树概念及结构 1.1树的概念 1.2 树的相关定义 1.3 树的表示 2.二叉树概念及结构 2.1概念 2.2现实中的二叉树 2.3 特殊的二叉树 2.4 二叉树的性质 2.5 二叉树的存储结构 3.二叉树的顺序结构及实现 3.1 二叉树的顺序结构--堆 3.2 堆的实现 3.2.1打印 3.2.2 …

# 怎么关闭 win10 系统中自带的【文件预览】功能?关闭WIN10【文件预览】功能的方法

怎么关闭 win10 系统中自带的【文件预览】功能?关闭WIN10【文件预览】功能的方法 win10 系统中自带的【文件预览】功能,默认是开启状态的,如果需要关闭它,一步搞定。 1、打开电脑文件浏览器,随便进入有文件的一个文件…

CI/CD笔记.Gitlab系列.新用户管理

CI/CD笔记.Gitlab系列 新用户管理 - 文章信息 - Author: 李俊才 (jcLee95) Visit me at CSDN: https://jclee95.blog.csdn.netMy WebSite:http://thispage.tech/Email: 291148484163.com. Shenzhen ChinaAddress of this article:https://blog.csdn.net/qq_285502…