Amazon Bedrock 实践:零基础创建贪吃蛇游戏

本文探讨了如何利用 Amazon Bedrock 和大型语言模型,快速创建经典的贪吃蛇游戏原型代码。重点展示了利用提示工程,将创新想法高效转化为可运行代码方面的过程。文章还介绍了评估和优化提示词质量的最佳实践。

亚马逊云科技开发者社区为开发者们提供全球的开发技术资源。这里有技术文档、开发案例、技术专栏、培训视频、活动与竞赛等。帮助中国开发者对接世界最前沿技术,观点,和项目,并将中国优秀开发者或技术推荐给全球云社区。如果你还没有关注/收藏,看到这里请一定不要匆匆划过,点这里让它成为你的技术宝库!

原文出处来自作者于 2024 年 8 月在 community.aws 发表的博客:

“From Concept to Playable in seconds:Creating the Greedy Snake Game with Amazon Bedrock”:https://huggingface.co/meta-llama/Meta-Llama-3.1-70B-Instruct?trk=cndc-detail

概述

在软件开发领域演进的历史长河中,开发者投入的时间一直是一种非常宝贵的资源。作为开发者,我们一直在不断地寻求创新的方法来简化工作流程、减少技术债务,并希望以提升开发的速度和效率将想法快速付诸实践。而生成式 AI(Generative AI)正是这一游戏规则的改变者,它有望彻底革新我们进行编码和解决问题的方式。

想象一下,你能够快速进行原型开发和概念验证,这已经是 Amazon Bedrock 这种生成式 AI 平台所能提供的现实了。通过利用在海量数据上训练的大型语言模型的强大能力,我们可以加速开发周期,并评估提示词的质量以获得最佳结果。

在这篇博客文章中,我将探讨如何利用 Amazon Bedrock,使用自然语言从零开始创建经典的贪吃蛇游戏。此外,我还将探讨如何进一步利用 Amazon Bedrock 上的大模型来评估和改进我的提示词,确保更高质量的代码输出。通过结合正确的提示词和合适的大模型,我们将目睹一个从创新想法到可玩游戏的完整生成之旅,而这一切只需几秒钟,这都归功于 Amazon Bedrock 能够简化原型设计,并实现快速概念验证。

让我们开始这段愉快的自然语言直接编写贪吃蛇游戏之旅吧!

使用的大型语言模型

我用于生成游戏代码的大型语言模型,采用了在 Amazon Bedrock 上的 Meta Llama 3.1 70B Instruct。

Amazon Bedrock 是一个强大的生成式 AI 平台,允许开发者为各种用例(包括代码生成等)创建和微调大型模型。而 Meta Llama 3.1 70B Instruct 模型专门用于遵循指令和生成高质量代码。你可以在 Hugging Face 上参考模型卡片以了解更多详情:https://huggingface.co/meta-llama/Meta-Llama-3.1-70B-Instruct?trk=cndc-detail

提示工程方法

成功使用生成式 AI 的关键之一在于提示工程(Prompt Engineering):即创建清晰、具体的提示词,以指导模型精确生成所需的输出。

以下是我用来生成贪吃蛇游戏代码的提示词:

“Write a short and high-quality python script for the following task, something a very skilled python expert would write. You are writing code for an experienced developer so only add comments for things that are non-obvious. Make sure to include any imports required.

NEVER write anything before the python block. After you are done generating the code and after the python block, check your work carefully to make sure there are no mistakes, errors, or inconsistencies.

If there are errors, list those errors in tags, then generate a new version with those errors fixed. If there are no errors, write "CHECKED:NO ERRORS" in tags.

Here is the task:write a greedy snake game.

Double check your work to ensure no errors or inconsistencies.”

正如你所看到的,这个提示词为游戏的功能、要使用的库以及其他实现细节提供了详细的要求。提供这种程度的明确性对于从生成式 AI 模型获得高质量的代码输出至关重要。

在 Amazon Bedrock Chat Playground 中,单击“Run”以将上述提示词提交给 Meta Llama 3.1 70B Instruct 模型,然后等待几秒钟模型的响应。如下截图所示:

image.png

输出:贪吃蛇游戏代码

输入提示词后,Amazon Bedrock 上的 Llama 3.1 70B Instruct 模型,在几秒内迅速生成了以下的 Python 代码,该代码基本实现了一个功能齐全的贪吃蛇游戏。生成的完整代码如下:

import pygame
import sys
import random# Initialize Pygame
pygame.init()# Set up some constants
WIDTH, HEIGHT = 800, 600
BLOCK_SIZE = 20
SPEED = 10# Set up some colors
WHITE = (255, 255, 255)
RED = (255, 0, 0)
GREEN = (0, 255, 0)# Set up the display
screen = pygame.display.set_mode((WIDTH, HEIGHT))# Set up the font
font = pygame.font.Font(None, 36)# Set up the snake and food
snake = [(200, 200), (220, 200), (240, 200)]
food = (400, 300)# Set up the direction
direction = 'RIGHT'# Game loop
while True:for event in pygame.event.get():if event.type == pygame.QUIT:pygame.quit()sys.exit()elif event.type == pygame.KEYDOWN:if event.key == pygame.K_UP and direction != 'DOWN':direction = 'UP'elif event.key == pygame.K_DOWN and direction != 'UP':direction = 'DOWN'elif event.key == pygame.K_LEFT and direction != 'RIGHT':direction = 'LEFT'elif event.key == pygame.K_RIGHT and direction != 'LEFT':direction = 'RIGHT'# Move the snakehead = snake[-1]if direction == 'UP':new_head = (head[0], head[1] - BLOCK_SIZE)elif direction == 'DOWN':new_head = (head[0], head[1] + BLOCK_SIZE)elif direction == 'LEFT':new_head = (head[0] - BLOCK_SIZE, head[1])elif direction == 'RIGHT':new_head = (head[0] + BLOCK_SIZE, head[1])snake.append(new_head)# Check if the snake has eaten the foodif snake[-1] == food:food = (random.randint(0, WIDTH - BLOCK_SIZE) // BLOCK_SIZE * BLOCK_SIZE,random.randint(0, HEIGHT - BLOCK_SIZE) // BLOCK_SIZE * BLOCK_SIZE)else:snake.pop(0)# Check if the snake has hit the edge or itselfif (snake[-1][0] < 0 or snake[-1][0] >= WIDTH orsnake[-1][1] < 0 or snake[-1][1] >= HEIGHT orsnake[-1] in snake[:-1]):pygame.quit()sys.exit()# Draw everythingscreen.fill(WHITE)for pos in snake:pygame.draw.rect(screen, GREEN, pygame.Rect(pos[0], pos[1], BLOCK_SIZE, BLOCK_SIZE))pygame.draw.rect(screen, RED, pygame.Rect(food[0], food[1], BLOCK_SIZE, BLOCK_SIZE))text = font.render(f'Score:{len(snake)}', True, (0, 0, 0))screen.blit(text, (10, 10))# Update the displaypygame.display.flip()# Cap the frame ratepygame.time.delay(1000 // SPEED)

该代码的主要功能实现包括:初始化 Pygame,设置游戏的尺寸、块大小和速度等常量、定义显示元素的颜色、初始化显示屏幕等等。代码还设置了用于显示得分(贪吃蛇每吃到一个食物将获得一分)的字体,初始化了蛇和食物的位置,以及设置了蛇移动的初始方向等游戏要素。

游戏会循环持续检查用户输入事件,如用户退出了游戏,或者使用了方向键改变蛇的运动方向等。游戏主要逻辑将根据用户输入以及蛇的当前方向,来更新蛇的位置,并同时检查与食物或边界的是否碰撞,从而决定是否更新相应分数等。此外,游戏的循环代码还处理了在屏幕上渲染游戏元素,并限制帧率。

以下图像显示了我实际调试代码的场景。以代码片段作为背景,前景是正在运行的游戏截图:

image.png

值得一提的是,这个全面且可执行的代码是根据一段文本提示词生成的,没有提供任何补充示例或训练数据。这展示了 Amazon Bedrock 上的该大语言模型(Llama 3.1 70B Instruct)具有将自然语言描述直接转化为完整代码的出色能力,从而节省了游戏开发者相比于从头开始编写游戏代码所需的大量时间。

当然生成的代码并非完美无缺,可能需要增强或扩展一些额外功能。但它确实为开发者提供了一个坚实的基础。

评估提示词的质量

虽然我们已经成功生成了贪吃蛇游戏的一份完整代码,但我还是想客观地评估使用的提示词质量,因为我考虑未来是否可以更好地使用 AI 来生成代码。

我所参考的标准来自《Generative AI on AWS》一书中总结的 16 项提示工程最佳实践。我已将这 16 项最佳实践纳入我的评估提示词中,以评估之前用于生成贪吃蛇游戏的提示词质量。

完整的评估提示词如下:

Here are the key prompt-engineering best practices discussed in Chapter 2 of the book “Generative AI on AWS”:

  • Be clear and concise in your prompts. Avoid ambiguity.

  • Move the instruction to the end of the prompt for large amounts of input text.

  • Clearly convey the subject using who, what, where, when, why, how etc.

  • Use explicit directives if you want output in a particular format.

  • Avoid negative formulations if a more straightforward phrasing exists.

  • Include context and few-shot example prompts to guide the model.

  • Specify the desired size of the response.

  • Provide a specific response format using an example.

  • Define what the model should do if it cannot answer confidently (e.g. respond "I don't know").

  • Ask the model to "think step-by-step" for complex prompts requiring reasoning.

  • Add constraints like maximum length or excluded information for more control.

  • Evaluate the model's responses and refine prompts as needed.

  • Use disclaimers or avoid prompts the model should not answer for sensitive domains.

  • Use XML/HTML tags to create structure within the prompt.

  • Focus the model on specific parts of the input text.

  • Mask personally identifiable information from the model's output.

Based on the above 16 prompt-engineering best practices, please evaluate the following prompts I used to generate a Greedy Snake Game:

“Write a short and high-quality python script for the following task, something a very skilled python expert would write. You are writing code for an experienced developer so only add comments for things that are non-obvious. Make sure to include any imports required.

NEVER write anything before the python block. After you are done generating the code and after the python block, check your work carefully to make sure there are no mistakes, errors, or inconsistencies.

If there are errors, list those errors in tags, then generate a new version with those errors fixed. If there are no errors, write "CHECKED:NO ERRORS" in tags.

Here is the task:write a greedy snake game.

Double check your work to ensure no errors or inconsistencies.”

我在 Amazon Bedrock Chat Playground 中提交了上述提示词,如下图所示:

image.png

几秒钟后,收到了以下模型的完整评估输出:

模型输出提供了对我的提示词优点,以及潜在改进空间等非常有价值的见解。

首先,它在“优点”部分承认了我的提示语的优势:

  1. 明确简洁:你的提示语结构清晰,易于理解。

  2. 具体指示:你明确要求输出 Python 脚本格式和对高级别 Python 专家的期望水平。

  3. 上下文和少量示例提示语:你提供了一个明确的任务描述(贪吃蛇游戏)并指出了预期输出(高质量 Python 脚本)。

  4. 要求响应的大小:你要求一个“简短”的脚本。

  5. 具体响应格式:你使用python块来指示预期格式。

  6. 错误处理:你指示模型检查其工作并列出错误,或者如果没有错误则写“CHECKED:NO ERRORS”。

此外模型还建议如“缺陷”部分所示,提出一些改进提示语的建议:

  1. 含糊不清:虽然你的提示语总体很清楚,但“一个非常熟练的 Python 专家会写的东西”这句话可能有些主观和含糊不清。

  2. 否定表述:你用了“千万不要在python块之前写任何内容”,可以改为正面说法,例如“只能在python块中写代码”。

  3. 缺乏约束条件:你没有具体说明脚本的长度、复杂度或特定要求(如游戏功能、难度等级)的限制。

  4. 缺乏免责声明:你没有提及任何敏感领域或游戏内容可能存在的问题。

模型还提供了以下详细的代码修改具体建议:

  1. 考虑将“一个非常熟练的 Python 专家会写的东西”改为更客观的要求,如“遵循 Python 编码的最佳实践”。

  2. 用更积极的指示替换“千万不要在python块之前写任何内容”,比如“只能在python块中写代码”。

  3. 添加约束条件,例如“脚本不应超过 200 行代码”或“游戏应至少有 3 个等级”。

  4. 考虑添加一个免责声明,如“请确保游戏内容适合所有年龄段,不含任何令人反感的材料”。

总结

生成式 AI 彻底改变软件开发的潜力是巨大的。通过利用 Amazon Bedrock 和大型语言模型,开发者目前已经可以继续简化工作流程,快速构建原型并验证伟大的想法,这将加快软件开发迭代速度,以前所未有的效率将想法变为现实。

贪吃蛇游戏的例子展示了生成式 AI 将一个简单的提示词,转化为可运行游戏代码的惊人能力。然而,我们必须认识到:虽然生成的代码可以提供一个良好的基础,但可能需要进一步的完善和优化。

随着生成式 AI 的不断发展,我们可以期待更先进的模型、更好的提示词技术,以及与开发工具的更紧密集成。提前拥抱这一技术将获得重大的竞争优势。

最后,生成式 AI 并不是要取代人类开发者,而是增强他们能力的强大工具。通过将人类创造力与人工智能相结合,我们可以开启创新的软件开发新前景,创造更加非凡的软件产品和解决方案。

注:本文封面图像使用了 Amazon Bedrock 上的 Stable Diffusion XL 1.0 模型生成。提示词如下:

“A stylized digital illustration with a futuristic and technology-inspired design, depicting a large coiled snake made of sleek metallic materials and circuit board patterns. The snake's body forms the shape of the Amazon Bedrock logo in the center. Surrounding the snake are various coding elements, such as code snippets, programming symbols, and binary patterns, arranged in an abstract and visually striking way. The overall image should convey a sense of innovation, artificial intelligence, and the fusion of technology and creativity”

文章来源:https://dev.amazoncloud.cn/column/article/66ceac7c1db7ac34cb43b585?sc_medium=regulartraffic&sc_campaign=crossplatform&sc_channel=bokey

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/788502.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

题解:P11000 [蓝桥杯 2024 省 Python B] 数字串个数

P1100,纪念这个特别的数字,来水一篇。用 \(1 \sim 9\) 没有任何特殊情况的方法数:\(9^{10000}\)。 排除没有 \(3\) 和 \(7\) 的方法。 \(9^{10000} - 8^{10000} - 8^{10000}\) 加上 \(3\) 和 \(7\) 混一起的方法数。 \(9^{10000} - {(9 - 1)}^{10000} - {(9 - 1)}^{10000} +…

【音视频通话】使用asp.net core 8+vue3 实现高效音视频通话

引言在三年前,写智能小车的时候,当时小车上有一个摄像头需要采集,实现推拉流的操作,技术选型当时第一版用的是nginx的rtmp的推拉流,服务器的配置环境是centos,2H4G3M的一个配置,nginx的rtmp的延迟是20秒,超慢,后来研究了SRS以及ZLMediaKit这两个开源的推拉流服务器,没…

免费、开源、详细完整的unity游戏、游戏源码、教程:人工智能分析和处理对话的美好三维世界(定期更新)

免费、开源、详细完整的unity游戏、游戏源码、教程:人工智能分析和处理对话的美好三维世界。这份unity游戏、游戏源码、教程:完全免费,完全开源,完整详细,通俗易懂,适合初学者入门,定期更新。 我不想和任何人说话,任何人不要跟我说话,不要打扰我,我要安安静静的写。我…

小企业必备:优选局域网文档管理软件推荐

国内外主流的10款局域网文档管理软件对比:1.PingCode;2.Worktile;3.语雀;4.联想Filez企业网盘;5.亿方云;6.黑域基地;7.Joplin;8.MediaWiki;9.TiddlyWiki;10.Zim Wiki。在处理局域网文档时,企业常常面临着文件管理不系统、数据安全性差等问题,这不仅影响团队协作效率…

机器学习之——决策树信息熵计算[附加计算程序]

0 前言本文主要讲述了决策树背后的信息熵的公式含义及计算方式,并列举出多道例题帮助理解。1 信息熵的定义 1.1 信息熵公式笔者使用下图(1-1)直观理解信息熵的含义。信息熵越大,表示该随机变量的不确定性越高。对于均匀分布,信息熵达到最大值。 1.2 证明:对于均匀分布,信息…

phpinclude-labs做题记录

Level 1 file协议payload:?wrappers=/flag Level 2 data协议 去包含data协议中的内容其实相当于进行了一次远程包含,所以data协议的利用条件需要 php.ini 中开启 allow_url_fopen 和 allow_url_include GET: ?wrappers=, 然后 POST:helloctf=system(cat /flag); Level 3 dat…

数据结构学习第一周

本文需要掌握的知识 1.认识数据结构 2.了解数据结构(逻辑结构)的分类 3.内存储器模型以及分配方式(物理结构) 4.认识Node类 5.简单了解泛型1 .数据结构(D-S/Data Structure) 1.1简介 1.1.1数据 分为原子数据和复合数据 1.1.2结构 分为逻辑结构和物理结构数据结构是由数据和数…

用 Higress AI 网关降低 AI 调用成本 - 阿里云天池云原生编程挑战赛参赛攻略

我们要在 Higress 网关中编写 WebAssembly(wasm)插件,使得在 http 请求的各个阶段(requestHeader,requestBody,responseHeader,responseBody)能够将相应的请求或返回捕获进行业务逻辑的处理。具体到本比赛,主要需要实现的是缓存对大模型的请求(openai 接口的形式)在…

科研项目管理工具选型全攻略

国内外主流的 10 款科研院所项目管理系统对比:PingCode、Worktile、云效、Tower 、Zoho Projects、Notion、Wrike、ClickUp、Asana、Teambition。在科研院所的日常运营中,项目管理系统的选择显得尤为重要。选择不当可能导致资源浪费、进度延误甚至项目失败,这是每个科研团队…

ensp使用交换机配置svi连通网段

ensp使用交换机配置svi连通网段 实验目的 如下图所示,PC1、PC2、PC3分别位于不同网段,使用S5700型号交换机连接,目前需要配置交换机和主机,主机能够互相连通。常用命令un in en:关闭信息通知 dis ip int b:显示端口ip配置情况(brief模式) dis ip routing-table:显示路…

B 端产品未来几年的发展趋势

未来几年,B 端产品领域将面临着诸多挑战和机遇。人工智能与机器学习的深度融合、云计算与容器化技术的持续发展、用户体验与设计的重要性日益凸显、数据安全与隐私保护的挑战与机遇、行业垂直化与专业化发展以及敏捷开发与持续交付的普及等趋势,将对 B 端产品经理提出更高的要…

postgresql下Schema和DataBase

database —> schema —> table 1.同一个实例下,不同database是不能相互访问的,即独立的。 2.同一个数据库,不同模式下的表是可以相互访问,即可共享的 3.不同模式下,表名可以是一样。也就是表在模式下是独立。 ##授权某个库下的某个模式下有创建表的权限grant creat…