Google Gemini API快速上手(附申请步骤)

前言

12月6日,谷歌发布新一代大模型Gemini的demo, 同时,Bard已将模型更新为Gemini Pro

Gemini 是谷歌目前最新最强的大语言模型,支持多模态(文字,图片,音频,视频等等)处理

美国时间12月13日,Gemini API对公众开放,本文将教学Google Generative AI的简易使用流程。

根据谷歌提供的价格信息,将会有两个收费方式,现阶段的免费版本可以每分钟60次请求,足够满足个人用户的需求了。

至于收费版本,目前还不能用,但是收费标准已经公布了。Gemini Pro 付费版的定价是每千个字符0.00025美元,每张图片0.0025美元,输出每千个字符0.0005美元。另外谷歌会使用免费版Google Pro API的输入和输出来提高模型能力,但是承诺付费版不会用于训练和改进产品(保护隐私)。

一 如何申请 Gemini Pro API

1. 准备一个谷歌账号,已经有了请跳过。

2. 建议使用美国节点访问。

3. 打开Google AI Studio 申请api的网址:https://makersuite.google.com/app/apikey。当然你也可以打开Gemini的首页 http://ai.google.dev ,并点击 Get API key in Google AI Studio 按钮。你需要先同意使用条款才能继续使用。

4. 点击左边菜单里的 Get API key,然后在右边点击 Create API key in new project。

二 生成式AI平台 MakerSuite (Google AI Studio)

MakerSuite是一个基于浏览器的 IDE,用于使用Generative language model(生成式语言模型)进行原型设计。借助 MakerSuite,可以快速试用模型并试验不同的prompt(提示)

模型参数设定 (第一次使用建议全部保持默认):

Model模型选择Gemini Pro(文字),Gemini Pro Vision (图片)

Temperature温度决定模型的创造力,越高越想象力丰富,越低越稳定

Safety settings安全设定中可以调整对骚扰,仇恨,性,恐怖等言论的屏蔽程度

Top K: 选择输出token的方式,top 1 表示永远输出评分最高的回答,top 10 表示在前10评分的回答中取样输出一个回答

Top P: 选择输出token的方式,如果前x个回答的概率之和高于p,则【Top P,其中P=p】等价于【Top K,其中K=x】

左侧Create new将提供四种不同的方式与模型互动

2.1 Freeform prompt 文本/图片提示:输入一段提示,LLM将根据提示进行一段创作

2.2 Structured prompt 结构化提示:提供表格输入,可以输入至多500组【输入,输出】的案例,根据案例,LLM可学习并基于案例处理新的提示

2.3 Chat prompt 聊天提示:与chatgpt和bard类似的聊天框模式,支持输入历史会话

2.4 Fine-tuning model模型调整

训练参数设定(第一次使用建议默认)

Model模型选择Text Bison,这是老模型PaLM2,新的Gemini截至目前还没可用

Tuning epochs 整个训练集的完整训练遍历次数

Batch size 一次训练迭代中用于验证的样本数量,越大越容易过拟合,越小越容易欠拟合

Learning rate 训练迭代中调整参数的强度,越大越容易过拟合,越小越容易欠拟合

点击Tune开始自动调参。模型调整完毕后,可以在上个环节的各种提示测试中使用自己的新模型

三 API调用

# setup
import google.generativeai as genaigenai.configure(api_key='xxx')  # 填入自己的api_key# 查询模型
for m in genai.list_models():print(m.name)print(m.supported_generation_methods)

这里可以看到通过api可以访问谷歌的7个模型,其中最关注的是gemini-pro和gemini-pro-vision这两个模型,其中gemini-pro是语言模型只能输出文字内容,而gemini-pro-vision是多模态模型可以读取和分析图片的内容。

内容生成

model = genai.GenerativeModel('gemini-pro')
response = model.generate_content("告诉我太阳系中最大行星的相关知识")
print(response.text)

流式输出

Gemini模型同样也具备流式输出的功能,这可以在某些应用场景中带来比较好的用户体验

model = genai.GenerativeModel('gemini-pro')
response = model.generate_content("给我上海3日游攻略", stream=True)for chunk in response:print(chunk.text)print("_"*80)

聊天模式

# setup
import google.generativeai as genaigenai.configure(api_key='XXX')  # 填入自己的api_keymodel = genai.GenerativeModel(model_name="gemini-pro")chat = model.start_chat(history=[])response = chat.send_message("你好,我叫Wayne")
print(response.text)response = chat.send_message("怎么称呼你啊?")
print(response.text)response =chat.send_message("你还记得我叫什么吗?")
print(response.text)for message in chat.history:print(f'**{message.role}**: {message.parts[0].text}')

参考资料

Google Gemini API快速上手 - 知乎 (zhihu.com)

谷歌Gemini API 应用(一):基础应用-CSDN博客

https://ai.google.dev/

https://ai.google.dev/docs?hl=zh-cn

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/283846.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

消息队列kafka详解:Kafka原理分析总结

一、概述 Kakfa起初是由LinkedIn公司开发的一个分布式的消息系统,后成为Apache的一部分,它使用Scala编写,以可水平扩展和高吞吐率而被广泛使用。目前越来越多的开源分布式处理系统如Cloudera、Apache Storm、Spark等都支持与Kafka集成。 Kaf…

Javaweb考前复习冲刺(不断更新版)

Javaweb考前复习冲刺 第一章: JavaWeb 入门 JavaWeb是指:以Java作为后台语言的项目工程。 javaweb项目创建的过程: 首先集成Tomcat服务器环境新建dynamic web project部署工程运行 路由含义: ​ http://localhost:8080/工程…

AI数字人直播问题及解决方案!

青否数字人SaaS系统(数字人源码:zhibo175)目前支持哪些平台使用数字人直播 目前支持的平台有:抖音、快手、视频号、淘宝/天猫、京东、小红书、拼多多,哔哩哔哩,tiktok,阿里国际站,用…

【改进YOLOv8】磁瓦缺陷分类系统:改进LSKNet骨干网络的YOLOv8

1.研究背景与意义 项目参考AAAI Association for the Advancement of Artificial Intelligence 研究背景与意义 近年来,随着智能制造产业的不断发展,基于人工智能与机器视觉的自动化产品缺陷检测技术在各行各业中得到了广泛应用。磁瓦作为永磁电机的主…

Python PIP安装pycorrector、kemln报错

本来想装个pycorrector用一下,结果在安装其依赖包kemln的时候疯狂报错,报错关键词包括但不限于Bash、Cmake,C啥的,搜了很多文章,终于摸索到了安装的办法。 1、安装bash 去官网https://gitforwindows.org/下载bash&am…

ssm基于java web的计算机office课程平台设计与实现论文

摘 要 使用旧方法对课程进行系统化管理已经不再让人们信赖了,把现在的网络信息技术运用在课程的管理上面可以解决许多信息管理上面的难题,比如处理数据时间很长,数据存在错误不能及时纠正等问题。 这次开发的计算机office课程平台有管理员&a…

2023云南爱心鸟暖冬公益——临沧322名山区孩子戴上爱心妈妈红围巾

严冬来临,为了关爱高寒山区学校里的孩子们,2023年12月15日,云南爱心鸟联合送子鸟医院以及失独妈妈们共同开展了“爱心鸟暖冬红围巾”公益活动。他们收集了手织红围巾、保暖衣物和学习用品等爱心捐赠物资,为临沧永德县大雪山乡蚂蝗…

倾斜摄影三维模型重建的几何坐标变换技术方法浅析

倾斜摄影三维模型重建的几何坐标变换技术方法浅析 倾斜摄影三维模型数据的坐标变换是将相机坐标系下获取的倾斜摄影图像转换为地理坐标系下的三维模型数据,以实现地理空间信息的表达与分析。在实际应用中,需要进行坐标变换的主要包括航片图像、相机姿态参…

【算法与数据结构】455、LeetCode分发饼干

文章目录 一、题目二、解法三、完整代码 所有的LeetCode题解索引,可以看这篇文章——【算法和数据结构】LeetCode题解。 一、题目 二、解法 思路分析:因为大饼干可以满足大胃口的孩子也必然可以满足小胃口的孩子,如果要尽可能的满足孩子的胃口…

二十九、获取文件属性及相关信息

二十九、获取文件属性及相关信息QFileInfo QFileInfo 提供有关文件在文件系统中的名称 位置 (路径)、访问权限及它是目录还是符号链接、等信息。文件的大小、最后修改/读取时间也是可用的。QFileInfo 也可以被用于获取信息有关 Qt resource . QFileInf…

代码随想录算法训练营第十八天 | 前中后序构造二叉树

目录 力扣题目 力扣题目记录 513.找树左下角的值 递归 迭代法 总结 112. 路径总和 106.从中序与后序遍历序列构造二叉树 总结 力扣题目 用时:2h 1、513.找树左下角的值 2、112. 路径总和 3、106.从中序与后序遍历序列构造二叉树 力扣题目记录 513.找树…

美易官方:油价下跌进一步推动新兴市场资产上涨

随着油价的持续下跌,新兴市场资产有望进一步上涨。 随着全球经济的复苏,新兴市场国家在经济发展方面的表现也越来越突出。然而,由于全球油价的持续下跌,一些投资者可能会担心这些国家的经济增长是否会受到影响。实际上&#xff0c…