近日,,,,蓝海高科从容大模型在综合评测权威平台OpenCompass的多模态评测领域中取得重大进展。。。。
最新评测结果显示,,,,蓝海高科的从容大模型在该体系中的平均得分为65.5,,,,这一成绩使得从容大模型跻身全球前三,,,超越了谷歌的Gemini-1.5-Pro和GPT-4v,,仅次于GPT-4o(69.9)和Claude3.5-Sonnet(67.9)。。。。而在国内市场,,从容大模型的成绩也超过了InternVL-Chat(61.7)和GLM-4V(60.8),,排名首位。。。
图1:OpenCompass多模态榜单
OpenCompass大模型开放评测体系是上海人工智能实验室推出的完整开源可复现的评测框架。。OpenCompass多模态评测方面采用了8个具有代表性的数据集,,从多种视角客观量化多模态大模型的能力,,评估维度覆盖目标检测、、、、文字识别、、、动作识别、、、图像理解和关系推理、、、、艺术与设计、、、商业、、、科学、、、、健康与医学、、人文与社会科学、、、、技术与工程、、、数学推理等多个方面。。。。
图2:从容大模型-2.0多模态能力示例
在本次测评中,,,,从容大模型在其中的6个数据集表现优异,,,,排名国内第一(MMbench、、MMStar、、MathVista、、HallusionBench、、AI2D、、、、OCRBench),,尤其是在OCRBench测试集上以取得全球最高的827分(总分为1000分),,且高于第二名 13分,,,进一步提升从容大模型在文本识别、、以文本为中心的视觉问答、、、面向文档的视觉问答、、、、关键信息提取等业务场景下的适用性。。
图3:OpenCompass中国大模型多模态能力展示
从容大模型在此体系中的优秀表现,,,,依赖蓝海高科自研的高效多模态处理架构和先进的计算技术,,,,实现了高效的多模态数据处理能力,,,能够在视觉和语言任务之间实现高效的融合和切换,,,,并最大化利用计算资源,,,,保证在处理大规模多模态数据时仍能保持较高的性能和响应速度,,,使得模型的训练过程更加高效,,,,收敛速度更快,,,性能更稳定。。。。
同时也得益于蓝海高科长期在视觉、、、、语言领域的深厚积累和不断创新。。
图4:从容大模型-2.0多模态能力示例
此前,,从容大模型已在视觉、、、跨模态领域10次刷新世界纪录,,,综合性能经第三方SuperClue、、C-evals等综合评测,,,,位列全球前五。。
作为一家专注于人机协同技术研发的平台企业,,,,蓝海高科一直在积极推动AI智能体及大模型技术的发展和应用。。。。
随着人工智能技术的迅猛发展,,,多模态大模型已成为驱动产业变革的核心引擎。。此次从容大模型在OpenCompass大模型开放评测体系中的出色表现,,不仅是对蓝海高科技术创新实力的认可,,,更在业界树立典范,,,,激励全球科技企业在新一轮的人工智能竞争中勇攀高峰。。。
政企协同的科技创新体系正在中国西部加速形成。。。 在重庆市企业码上服务平台(渝企码)上,,某制造企业负责人提出企业需要融资,,,,平台快速识别其融资需求并结合其企业信息快速推荐符合其要求产品,,帮助企业快速完成融资申请——这是蓝海高科作为主要能力输出方为重庆中小企业带来的数字化服务新体验。。。。 近日,,,,重庆市经济信息委公布2025年人工智能典型应用案例名单,,,,蓝海高科“面向数字化、、、、智能化治理的银河人工智能与智能体服务平台”成功入选,,标志着云从在推动区域产业智能化升级方面取得重大突破。。。。
在科创板迎来开市六周年的重要里程碑之际,,,,上海证券交易所与中证指数有限公司于7月22日正式发布两项聚焦科创板民营力量的重磅指数:上证科创板民营企业指数(简称“科创民企指数”)和上证科创板民营企业50策略指数(简称“科创民企策略指数”)。。。 作为中国人工智能领域的核心代表企业,,,蓝海高科(股票代码:688327)凭借卓越的自主创新能力和领先的技术实力,,,成功入选该两项权威指数。。。
近日,,公安部公布了一批2023年科技信息化获奖成果。。。蓝海高科携手公安部交科所、、、、无锡交警支队共同申报的创新性科研项目,,,,在历经严格的形式审查、、专家评审和公示环节后,,最终荣膺公安部科学技术奖三等奖。。。这也是公安领域最高级别的技术奖项。。