商汤科技发布多模态多任务通用大模型“书生(INTERN)2.5”
来源:芥末堆 发表于2023-03-18 10:22:44 编辑:时寒峰
摘要: 原标题:商汤科技发布多模态多任务通用大模型书生(INTERN)2.5 近日,商汤科技发布多模态多任务通用大模型书生(INTERN)2.5。其拥有30亿参数,是物体检

  原标题:商汤科技发布多模态多任务通用大模型“书生(INTERN)2.5”

  近日,商汤科技发布多模态多任务通用大模型“书生(INTERN)2.5”。其拥有30亿参数,是物体检测标杆数据集COCO中 超过65.0 mAP的模型,“书生2.5”的图文跨模态开放任务处理能力可为自动驾驶、机器人等通用场景任务提供高效精准的感知和理解能力支持。

  据介绍,“书生”由商汤科技、上海人工智能实验室、清华大学、香港中文大学、上海交通大学于2021年11月首次共同发布,并持续联合研发。目前,“书生2.5”多模态通用大模型已在商汤参与的通用视觉开源平台OpenGVLab开源。

222222222222.jpg

  据悉,“书生2.5”可通过文本来定义任务,从而灵活地定义不同场景的任务需求,并根据给定视觉图像和任务的提示性语句,给出相应的指令或作答,进而具备通用场景下的高级感知和复杂问题处理能力,比如图像描述、视觉问答、视觉推理和文字识别等。

  在自动驾驶和居家机器人等通用场景下,“书生2.5”可辅助处理各种复杂任务。例如,在自动驾驶场景中,可以大幅提升场景感知理解能力,准确辅助车辆判断交通信号灯状态、道路标志牌等信息,为车辆决策规划提供有效信息输入。

  此外,“书生2.5”可根据文本快速检索出视觉内容,例如,可在相册中返回文本所指定的相关图像,或是在视频中检索出与文本描述最相关的帧,提高视频中时间定位任务的效率。此外还支持引入物体检测框,根据文本返回最相关的物体,实现开放世界视频或图像中物体检测及视觉定位。

投稿邮箱:qingjuedu@163.com
相关推荐
大疆农业发布 “云上疆果” 计划,云上管理数字果园
大疆农业发布 “云上疆果” 计划,云上管理数字果园

原标题:大疆农业发布 云上疆果 计划,云上管理数字果园 近日,大疆创新科技

公司3分钟前

商汤科技发布多模态多任务通用大模型“书生(INTERN)
商汤科技发布多模态多任务通用大模型“书生(INTERN)

原标题:商汤科技发布多模态多任务通用大模型书生(INTERN)2.5 近日,商汤科

公司7分钟前

学而思声明:遵守“双减”要求,不存在“重启大规模
学而思声明:遵守“双减”要求,不存在“重启大规模

原标题:学而思声明:遵守双减要求,不存在重启大规模线下招生的情况 14日晚

公司2023-03-15 17:27:05

知乎教育业务或将分拆独立发展,持续发力职业学习需
知乎教育业务或将分拆独立发展,持续发力职业学习需

原标题:知乎教育业务或将分拆独立发展,持续发力职业学习需求 据媒体市界

公司2023-03-15 17:11:07

孩子王原CTO何辉成立元数科技,提供数据采集、应用业
孩子王原CTO何辉成立元数科技,提供数据采集、应用业

原标题:孩子王原CTO何辉成立元数科技,提供数据采集、应用业务及全渠道数字

公司2023-03-14 19:30:30

中国电信将与惠农网开展生态合作,聚焦农业全产业数
中国电信将与惠农网开展生态合作,聚焦农业全产业数

原标题:中国电信将与惠农网开展生态合作,聚焦农业全产业数字化服务 3月

公司2023-03-14 19:29:20

新疆潜能教育致力于打造更为完善的成人教育梦想“充
新疆潜能教育致力于打造更为完善的成人教育梦想“充

原标题:新疆潜能教育致力于打造更为完善的成人教育梦想充电桩 近年来,随

公司2023-03-12 10:00:52

联想集团携手中国农业大学,开展智慧农业领域合作
联想集团携手中国农业大学,开展智慧农业领域合作

原标题:联想集团携手中国农业大学,开展智慧农业领域合作 近日,联想集团

公司2023-03-11 09:23:29

绿城康养打造学院式养老模式,三大品牌构建养老产业
绿城康养打造学院式养老模式,三大品牌构建养老产业

原标题:绿城康养打造学院式养老模式,三大品牌构建养老产业生态布局 人口

公司2023-03-11 09:22:23

2B2C双管齐下,八赫兹健康打造普惠型数字疗法产品
2B2C双管齐下,八赫兹健康打造普惠型数字疗法产品

原标题:2B2C双管齐下,八赫兹健康打造普惠型数字疗法产品 在中国,以阿尔茨

公司2023-03-11 09:19:11