商汤科技发布多模态多任务通用大模型“书生(INTERN)2.5”
来源:芥末堆 发表于2023-03-18 10:22:44 编辑:时寒峰
摘要: 原标题:商汤科技发布多模态多任务通用大模型书生(INTERN)2.5 近日,商汤科技发布多模态多任务通用大模型书生(INTERN)2.5。其拥有30亿参数,是物体检

  原标题:商汤科技发布多模态多任务通用大模型“书生(INTERN)2.5”

  近日,商汤科技发布多模态多任务通用大模型“书生(INTERN)2.5”。其拥有30亿参数,是物体检测标杆数据集COCO中唯一超过65.0 mAP的模型,“书生2.5”的图文跨模态开放任务处理能力可为自动驾驶、机器人等通用场景任务提供高效精准的感知和理解能力支持。

  据介绍,“书生”由商汤科技、上海人工智能实验室、清华大学、香港中文大学、上海交通大学于2021年11月首次共同发布,并持续联合研发。目前,“书生2.5”多模态通用大模型已在商汤参与的通用视觉开源平台OpenGVLab开源。

222222222222.jpg

  据悉,“书生2.5”可通过文本来定义任务,从而灵活地定义不同场景的任务需求,并根据给定视觉图像和任务的提示性语句,给出相应的指令或作答,进而具备通用场景下的高级感知和复杂问题处理能力,比如图像描述、视觉问答、视觉推理和文字识别等。

  在自动驾驶和居家机器人等通用场景下,“书生2.5”可辅助处理各种复杂任务。例如,在自动驾驶场景中,可以大幅提升场景感知理解能力,准确辅助车辆判断交通信号灯状态、道路标志牌等信息,为车辆决策规划提供有效信息输入。

  此外,“书生2.5”可根据文本快速检索出视觉内容,例如,可在相册中返回文本所指定的相关图像,或是在视频中检索出与文本描述最相关的帧,提高视频中时间定位任务的效率。此外还支持引入物体检测框,根据文本返回最相关的物体,实现开放世界视频或图像中物体检测及视觉定位。

投稿邮箱:qingjuedu@163.com
相关推荐
Sora问世,一石激起千层浪
Sora问世,一石激起千层浪

原标题:Sora问世,一石激起千层浪 穿着时尚的女性漫步在霓虹灯闪烁的东京街

公司2024-03-13 19:39:22

知乎职业教育之路,再进一步
知乎职业教育之路,再进一步

原标题:知乎职业教育之路,再进一步 1月11日,知乎举办主题为「启程!未来

公司2024-01-13 16:43:49

良师新文道:重塑考研培训格局铸就教育领域的新标杆
良师新文道:重塑考研培训格局铸就教育领域的新标杆

原标题:良师新文道:重塑考研培训格局铸就教育领域的新标杆 在 2023 年,随着考

公司2024-01-02 20:24:52

功不唐捐,这“泼天的富贵”高途佳品接得住
功不唐捐,这“泼天的富贵”高途佳品接得住

原标题:功不唐捐,这泼天的富贵高途佳品接得住 很多时候,越简单的人越难

公司2023-12-19 16:59:53

博实乐教育2023财年净亏损3.87亿元,海外学校恢复至疫
博实乐教育2023财年净亏损3.87亿元,海外学校恢复至疫

原标题:博实乐教育2023财年净亏损3.87亿元,海外学校恢复至疫情前水平 11月

公司2023-11-30 11:16:44

教培行业至暗时刻已过 多家教培机构重新迎来业绩高增
教培行业至暗时刻已过 多家教培机构重新迎来业绩高增

原标题:教培行业至暗时刻已过 多家教培机构重新迎来业绩高增长 经历了202

公司2023-11-28 22:30:22

高途三季度现金净流出超2亿元,大学及成人业务占比约
高途三季度现金净流出超2亿元,大学及成人业务占比约

原标题:高途三季度现金净流出超2亿元,大学及成人业务占比约25% 高途教育日

公司2023-11-27 19:32:44

微软将人工智能引入 Xbox,帮助开发者生成 AI 角色、故
微软将人工智能引入 Xbox,帮助开发者生成 AI 角色、故

原标题:微软将人工智能引入 Xbox,帮助开发者生成 AI 角色、故事剧情等 微软

公司2023-11-07 20:18:50

卫宁健康发布医疗大模型,为医疗场景提供智能知识服
卫宁健康发布医疗大模型,为医疗场景提供智能知识服

原标题:卫宁健康发布医疗大模型,为医疗场景提供智能知识服务 近日,卫宁

公司2023-11-02 14:05:25

滴滴出行将落地超3000个助老打车站牌,方便老年人就近
滴滴出行将落地超3000个助老打车站牌,方便老年人就近

原标题:滴滴出行将落地超3000个助老打车站牌,方便老年人就近打车 近日,在

公司2023-11-02 14:01:40