9月,OpenDataLab 全新版本上线,支持用户自主发布原创数据集,同时升级了 CLI/SDK 工具、数据集详情页,让 AI 数据集开源更方便、展示更清晰。还有创作领好礼活动,快来看看吧!
(注意!旧版 CLI 工具将于近期停止运维,请大家及时安装最新版本,避免影响使用)
一、轻松开源你的数据集
选择一个好用的 AI 数据发布平台,将对开源成果推广起到事半功倍的效果。
使用 OpenDataLab 一键发布原创数据集,立享 3 大优势:
● 无需网站开发和维护,节省各类运维成本;
● 规范的审核机制和开源流程,保护数据和版权安全;
● 超大存储容量和网络加速,无需科学上网,即刻畅享国内外高速传输体验。
现在,只需简单4步:注册作者账号→创建数据集仓库→上传数据→提交并公开,轻松完成你的原创数据集发布与分享。
详细操作步骤,请见文档:
https://openxlab.org.cn/docs/datasets/数据集创建流程.html
对于限制开放的敏感数据,平台上线了审批功能,允许用户向作者提交申请,签署使用协议,由作者同意后开放下载。(如需审批设置,请联系OpenDataLab小助手手动设置)
平台内嵌严格的“算法+人工”审核机制,可有效识别和处理高风险、高敏感数据,最大程度确保数据得以安全、规范地上传、使用。同时欢迎大家积极纠错与举报。
二、CLI/SDK一键获取和分享数据
OpenDataLab 命令行界面(CLI,Command Line Interface)是一个非常方便的工具,用户可以对 OpenDataLab 上的公开数据集进行下载,同时它支持Windows,Linux和Mac平台,饱受用户好评。
为了提升体验,此次发布了全新的 CLI命令行和 Python SDK 工具,新增数据集上传、管理功能,您可以使用指令一键查看、创建、上传、下载、编辑开源数据集。断点续传功能加持,让数据传输更稳定、更快速。
立即安装最新版本 CLI / SDK 、完成相应鉴权配置,即可使用。每个数据集下载指令可在详情页获取。
数据集CLI(命令行工具) 详细说明:
https://openxlab.org.cn/docs/developers/数据集/数据集CLI(命令行工具).html
数据集Python SDK 详细说明:
https://openxlab.org.cn/docs/developers/数据集/数据集python%20SDK.html
(数据集详情页,下载指令获取示意)
三、详情页展示更丰富
全新升级的数据集详情页,除了原有的数据集标签栏、发布信息栏外,新增数据集介绍、数据集详情、设置板块。
(数据集详情页示意)
●“数据集介绍”
作者可以 Markdown 格式灵活、个性地编辑介绍信息,添加封面、引文、统计图表、URL链接等,搭建特色的数据集展示页面;
●“数据详情”
上传的图片格式文件可自动被解析,在数据详情作为样例预览和统计,让数据结构一目了然;
●“数据文件”
作者可从网页端选择以文件、文件夹、压缩包等三种不同形式上传数据;如果选择"压缩包",系统将会在上传后自动解压您的文件;
●“设置”
数据集作者可以自由设置数据集状态,“私有”或“公开”。创建的数据集默认“私有”状态,仅作者可见,需手动公开后用户可访问,以方便维护管理。
四、创作领好礼
联系小助手,回复“报名”参与活动
9月8日12:00前,前20位成功提交原创数据集链接者
赠送价值100元大礼包,快来报名吧
更多公开数据集,欢迎访问OpenDataLab官网查看与下载:https://opendatalab.org.cn/