训练数据超20亿蓝海高科视觉大模型刷新四项世界纪录 | 蓝海高科

首页
核心技术
产品中心

智能化AIoT设备

平台系统

智能化AIoT设备

边缘计算设备

谛格AI定义小站

从容大模型训推一体机

人脸识别终端

面板机

视频人脸门控机

桌面式人证合一设备

视云数据管理平台

双目结构光模组

北极星结构光模组

比邻星活体安全模组

比邻星双目红外模组

网络摄像机

200万人脸抓拍红外变焦摄像机

400万全智能变焦摄像机

800万全智能暖光变焦筒型摄像机

智能货柜

从容智能审查一体机

从容知识智用一体机

端侧办公设备AI鼠标

平台系统

白泽数聚治理平台

开明隐私计算平台

人机协同操作系统CWOS

通用AI-Agent智能体平台

银河人工智能平台

智慧物联网平台

智能客服平台

H5实时活体SDK隐私政策

云之盾SDK 隐私政策
业务领域

产业发展

AI智能体

数字中国

产业发展

智慧金融

智慧能源

智慧制造

AI智能体

人机对话

文档助手

知识引擎

智能图像创作

数字人

图文理解

数字中国

智慧治理

智慧出行

智慧海关

智慧机场

智慧交通

智慧城市

基层治理
关于云从

云从简介

发展历程
新闻中心

发展动态

成功故事

尖端突破
加入我们
投资者关系
合作伙伴

训练数据超20亿蓝海高科视觉大模型刷新四项世界纪录

2023-07-19

back

近日，，蓝海高科在视觉大模型上取得重要进展，，，行人基础大模型在PA-100K、、、RAP V2、、、、PETA、、、、HICO-DET四个数据集上从阿里巴巴、、、日立等多家知名高校、、、、企业与研究机构脱颖而出，，刷新了世界纪录。。

其中最高在PA100K上的Fine-tuning准确率达到92.89%，，，，比SOTA高出5.2个点，，四个数据集所涉及的范围覆盖人体全局属性（性别、、、年龄），，，局部属性（穿戴风格、、配饰），，，携带属性（手机、、、刀棍、、、、手提包等）、、、、人-物交互HOI（抽烟，，持刀棍，，，，手机拍屏幕）等。。

表1：蓝海高科在PA-100K、、、RAP V2、、、PETA行人属性数据集上的表现

作为“六感”之首的视觉，，，占据了人类吸收外部信息的70%以上。。。对于人工智能也一样，，，行人基础大模型让人工智能如何识别关于人的一切信息，，准确率的提高具有非常高的实用价值，，本次突破意味着该技术首次达到大规模商用水平，，，，也意味着计算机视觉已经迈入「大模型时代」。。。。

多模态结合自监督学习打造全球领先核心技术

以人为中心的感知任务，，，，一直是人工智能领域研究的热点，，，，大模型具有强大的表征能力，，，并且在多种数据模态（如语言、、、音频、、、、图像、、视频、、视觉语言）上得到验证。。。。行人基础大模型已经发展成为视觉大模型基础，，，蓝海高科结合实际业务落地需求，，研发以人为中心的预训练大模型，，，专注于以人为中心的各类下游任务，，，实践和贯彻“人机协同”理念。。。。

表2：蓝海高科在HICO-DET人-物交互数据集上的表现

云从行人基础大模型，，，，使用了超过20亿的数据，，，，包括大量无标签数据集以及图文多模态数据集，，，数据集的丰富多样使得模型能够提取到非常稳健的特征，，，轻松应用于多种行人任务。。。。

基于自监督学习范式，，蓝海高科充分结合了对比学习和掩码学习的优点，，，，使得模型包含丰富的语义信息，，，同时具有丰富的纹理细节提取能力。。。为了让模型学习拥有更加丰富的行人语义信息，，结合多模态继续使用弱监督训练范式，，进一步提升模型的效果。。

在实际应用场景中，，，，大模型与针对单一任务的专用模型相比，，，表现出很强的泛化性，，可以大大节约对真实数据的需求，，甚至不需要额外收集真实数据，，极大节省了在下游任务上的迁移成本，，可快速将大模型能力迁移到新的应用场景之中，，，，并且可广泛应用于能源、、交通、、、制造、、金融等行业领域，，，，并为这些行业打造专属的行业大模型，，，，深度赋能。。。

基于基础预训练模型大幅降低研发成本

传统的行人检测和分析存在诸多难点，，，包括缺乏对场景的理解，，只能检测出所有目标；其次行人的某些特征非常细微，，，需要模型具有细粒度的识别能力，，各种大姿态和环境干扰容易造成影响；最后，，，，对行人的检测分析需求多变，，，层出不穷，，大部分需要定制化开发。。。。如何能够降低开发成本，，在技术产业化的过程中非常关键。。。

基于从容大模型平台，，，，开发者可以大幅降低对数据的依赖和提升训练效率，，仅需要1%的数据量即可达到与原场景定制化开发模型相接近的效果，，适合获取真实样本代价非常高的特殊行业。。

目前，，，，该技术已广泛应用于矿山、、、建筑工地以及特殊场所的安全布控，，监控作业人员穿戴合规，，，，姿态行为等异常和违规行为。。

此前，，，，蓝海高科跨镜追踪技术于2018-2020连续三年三次打破世界纪录，，行人基础大模型的突破，，表明云从从容大模型已经整合西部算力中心、、联合研发中心、、行业数据等资源，，打造出了更优秀的人工智能视觉大模型，，，为实现人机协同操作系统和行业专用大模型在行业智能化升级领域的大规模实践打下了坚实的基础。。。。

back

您可能感兴趣

蓝海高科联合上海交大发布AIGC跨模态数字人技术

2023-06-27

蓝海高科与上海交通大学联合研究团队的《基于扩散模型的音频驱动说话人生成》成功入选会议论文，，，并于大会进行现场宣讲，，获得多方高度关注。。。

MORE
训练数据超20亿蓝海高科视觉大模型刷新四项世界纪录

2023-07-19

蓝海高科在视觉大模型上取得重要进展，，，，行人基础大模型在PA-100K、、、、RAP V2、、、、PETA、、、HICO-DET四个数据集上从阿里巴巴、、日立等多家知名高校、、、、企业与研究机构脱颖而出，，刷新了世界纪录。。

MORE
蓝海高科从容大模型在benchmark COCO上刷新世界纪录大幅降低AI应用成本

2023-10-19

云从视觉基础大模型表现出很强的泛化性能，，，大大降低了下游任务所需的数据依赖与开发成本，，同时zero-shot大幅提高了训练开发效率，，，，使得广泛应用和快速部署成为可能。。。

MORE

全国热线电话

400-151-5992

周一到周五9:30-18:00（北京时间）

商务合作：business@cloudwalk.com
媒体合作：Media@cloudwalk.com
渠道合作：business_partner@cloudwalk.com
人才招聘：zhaopin@cloudwalk.com

数字中国 · 产业发展 · 个人精灵

关于云从：

云从介绍

发展历程

业务领域

企业资讯

核心技术
加入我们：

Copyright©2026 粤公网安备 44011502001099号

粤ICP备15087156号蓝海高科集团股份有限公司

使用条款/法律声明/防诈骗声明

关注我们

扫描二维码,关注蓝海高科
精彩一手掌握

留言咨询

请填写以下表格，，我们的销售代表会尽快与您联系

姓名 *
工作邮箱
电话 *
城市 *
公司名称 *
行业
职位
产品/解决方案

AI定义设备

场景定义设备

机场专用产品

刷脸支付终端

活体模组

智慧金融

智慧治理

智慧交通

智慧商业
预算
请输入需求描述 *

提交成功

我们的销售代表会尽快与您联系