这是一个零样本检测模型,能够生成带有文字描述的物体box和标签。
本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。
(资料图)
现在AI圈确实到了拼手速的时候啊。
这不,Meta的SAM刚刚推出几天,就有国内程序猿来了波buff叠加,把目标检测、分割、生成几大视觉AI功能all in one!
比如基于Stable Diffusion和SAM,就能让照片中的椅子无缝换成沙发:
换装、换发色也是so easy:
项目一经发布就让不少人惊呼:手速也太快了吧!
还有人表示:我和新垣结衣的新结婚照有了。
如上就是Gounded-SAM带来的效果,项目在GitHub上已揽星1.8k。
简单来说,这就是一个zero-shot视觉应用,只需要输入图片,就能自动化检测和分割图像。
该研究来自IDEA研究院(粤港澳大湾区数字经济研究院),创始人兼理事长为沈向洋。
Grounded SAM主要由Grounding DINO和SAM两个模型组成。
其中SAM(Segment Anything)是4天前Meta刚刚推出的零样本分割模型。
它可以为图像/视频中的任何物体生成mask,包括训练过程中没出现过的物体和图像。
通过让SAM对于任何提示都返回有效的mask, 能够让模型在即使提示是模糊的或者指向多个对象的情况下,输出也应该是所有可能中一个合理的mask。这一任务用于预训练模型并通过提示解决一般的下游分割任务。
模型框架主要由一个图像编码器、一个提示编码器和一个快速mask解码器组成。在计算图像嵌入后,SAM能够在50毫秒内根据web中的任何提示生成一个分割。
Grounding DINO是该研究团队已有的成果。
这是一个零样本检测模型,能够生成带有文字描述的物体box和标签。
二者结合后,可以通过文本描述找到图片中的任意物体,然后通过SAM强大的分割能力,细粒度地分割出mask.
在这些能力之上,他们还叠加了Stable Diffusion的能力,也就是开头所展示的可控图像生成。
值得一提的是,Stable Diffusion此前也能够实现类似功能。只要涂抹掉想替换的图像元素,再输入文本提示就可以。
这一回,Grounded SAM能够省去手动选区这个步骤,直接通过文本描述来控制。
另外结合BLIP(Bootstrapping Language-Image Pre-training),生成图片标题、提取标签,再生成物体box和mask。
目前,还有更多有趣的功能正在开发中。
比如人物方面的一些拓展:更换衣服、发色、肤色等。
具体食用方法也已在GitHub上给出。项目需要Python 3.8以上版本,pytorch 1.7以上版本,torchvision 0.8以上版本,并要安装相关依赖项。具体内容可看GitHub项目页。
该研究团队来自IDEA研究院(粤港澳大湾区数字经济研究院)。
公开消息显示,该研究院是一所面向人工智能、数字经济产业及前沿科技的国际化创新型研究机构,前微软亚研院首席科学家、前微软全球智行副总裁沈向洋博士担任创始人及理事长。
对于Grounded SAM的未来工作,团队有几点展望:
自动生成图像构成新数据集具有分割预训练的强大基础模型和(Chat-)GPT合作构成一个自动生成图像标签、box和mask的pipeline,并能生成新的图像。值得一提的是,该项目的团队成员中,有不少都是知乎AI领域活跃的答主,这次也在知乎上自答了关于Grounded SAM的内容,感兴趣的童鞋可以去留言请教~
关键词:
世界时讯:视觉AI能力大一统!自动化图像检测分割,还能可控文生图,华人团队出品
全球快消息!Puma Biotechnology(PBYI.US):2023年Q1财报实现营收5280万美元
全球今亮点!已是悬崖百丈冰硬笔书法作品_已是悬崖百丈冰
沈梓捷:没想到是这结局 我压力真的很大 时刻提醒自己今年要谨慎
甘肃举办“矢志艰苦奋斗,传承陇人品格”优秀青年代表座谈会
“五一”假期海口龙华区接待游客29.67万人次,同比增长124.79%
五一期间,济南市场监管部门共检查特种设备使用单位273家
2022年度保险服务质量指数出炉,提升保险业服务还有较大空间-通讯
苹果无需合约版是什么意思_无需合约版是什么意思|通讯
快消息!封测产业实惨,开始放无薪假
2023年广州中考第一梯度投档控制线划定在9%
研究人员捕捉到光合作用最后一幕中难以捉摸的缺失步骤
【吐槽】淮安某银行真“独特”啊~
【播资讯】太危险!36岁男子头疼自行在家针灸扎破心脏 进了ICU
环球热推荐:河南一大学禁止豫E车牌进校?校方回应:不存在此类情况 正常报备即可
信息:天娱数科:已接入GPT4API接口 主要用于持续优化内容生产效率与创意
当前关注:美国批准中国航司新增每周四班往返中美 系近三年来首次增班
辞职的“华为天才少年”稚晖君:走出舒适区,奔赴星辰大海丨Z世代 正青春-时快讯
环球实时:冲刺·杭州亚运style④攀岩:岩壁上的芭蕾与龙上村的美丽经济
东风股份:5月4日召开业绩说明会,投资者参与_当前关注
江苏江阴疑发生凶案 警方:追查逃犯 市民不必过分担心 环球微资讯
【天天新要闻】5月4日山东滨化液碱报价下行
天天亮点!共富工坊“浔”龙虾看花海
郑州职院两专业获批河南省职业教育示范性专业点立项建设项目 世界即时
广交会采购商“买买买” “传统+流行”赋能服装产业发展 观点
男子高铁上突发疾病 众人6分钟紧急救治助其脱险
【世界聚看点】dnf掉线数据清理工具_dnf掉线数据清理
世界快报:雅艺科技:截止2023年4月28日股东人数7930人(含信用账户)
内蒙古自治区察哈尔右翼后旗发布霜冻蓝色预警_关注
中国制造用“新”绘就出海画卷|世界报道
今日热讯:四川三姐弟水坑溺亡最小3岁,事发时母亲正在干农活
让青春在社区实践中绽放绚丽之花!首届宝山区社区青年先锋选树结果揭晓
【快播报】怎么从型号看空调匹数_空调型号匹数对照表
【报资讯】这个“五一”小长假河南接待游客5518万人次,旅游收入310.1亿元
全球聚焦:办护照需要什么东西(办护照需要什么)
南阳大中专院校排名 二、南阳理工学院简介
相关新闻