科技前沿

一通百通 AI分割一切！智源提出通用分割模型SegGPT 的那种 (一通百通app)

admin 2025-01-05 次阅读

一通百通 AI分割一切！智源提出通用分割模型SegGPT 的那种 (一通百通app)

AI分割一切！智源提出通用分割模型SegGPT，「一通百通」的那种

鱼羊来源：量子位

SegmentAnything Model

视觉领域的GPT-3时刻，真的要来了？

Meta分割一切的SAM（SegmentAnything Model）刚炸完场，几乎同时，国内的智源研究院视觉团队也提出了通用分割模型SegGPT——

Segment Everything in Context，首个利用视觉上下文完成各种分割任务的通用视觉模型。

就像这样，在一张画面中标注出彩虹，就能批量分割其他画面中的彩虹。

和 SAM 相比，视觉模型的 In-context 能力是最大差异点：

这也就意味着，SAM的精细标注能力，与SegGPT的批量化标注分割能力，还能进一步相结合，产生全新的CV应用。

具体而言，SegGPT 是智源通用视觉模型 Painter 的衍生模型，针对分割一切物体的目标做出优化。

SegGPT 训练完成后无需微调，只需提供示例即可自动推理并完成对应分割任务，包括图像和视频中的实例、类别、零部件、轮廓、文本、人脸等等。

该模型具有以下优势能力：

更多案例展示

作者在广泛的任务上对SegGPT进行了评估，包括少样本语义分割、视频对象分割、语义分割和全景分割。下图中具体展示了SegGPT在实例、类别、零部件、轮廓、文本和任意形状物体上的分割结果。

用画笔大致圈出行星环带（左图），在预测图中准确输出目标图像中的行星环带（右图）。

SegGPT能够根据用户提供的宇航员头盔掩码这一上下文（左图），在新的图片中预测出对应的宇航员头盔区域（右图）。

训练方法

SegGPT将不同的分割任务统一到一个通用的上下文学习框架中，通过将各类分割数据转换为相同格式的图像来统一各式各样的数据形式。

具体来说，SegGPT的训练被定义为一个上下文着色问题，对于每个数据样本都有随机的颜色映射。

目标是根据上下文完成各种任务，而不是依赖于特定的颜色。训练后，SegGPT可以通过上下文推理在图像或视频中执行任意分割任务，例如实例、类别、零部件、轮廓、文本等。

论文地址：

代码地址：

Demo：

— 完 —

版权所有，未经授权不得以任何形式转载及使用，违者必究。

实例分割计算机视觉

声明：本文来自用户分享和网络收集，仅供学习与参考，测试请备份。

相关文章

一通百通 AI分割一切！智源提出通用分割模型SegGPT 的那种 (一通百通app)

科技前沿

一通百通 AI分割一切！智源提出通用分割模型SegGPT 的那种 (一通百通app)

2025-01-05 937次阅读

深度赋智 AutoML论文获NeurIPS (深度赋智科技有限公司)

科技前沿

深度赋智 AutoML论文获NeurIPS (深度赋智科技有限公司)

2025-01-05 907次阅读

吴恩达新动作以数据为中心的AI 建立全新机器学习资源Hub 大本营 (吴恩达yolo)

科技前沿

吴恩达新动作以数据为中心的AI 建立全新机器学习资源Hub 大本营 (吴恩达yolo)

2025-01-05 409次阅读

公司年亏40亿正在盖大楼的DeepMind最新财务数据曝光人均年薪400万 (公司年亏损第二年买车)

科技前沿

公司年亏40亿正在盖大楼的DeepMind最新财务数据曝光人均年薪400万 (公司年亏损第二年买车)

2025-01-05 292次阅读

70多篇分门别类推特800赞图网络论文实现大合集从未如此全面

科技前沿

70多篇分门别类推特800赞图网络论文实现大合集从未如此全面

2025-01-05 600次阅读

和超算2个月得出的结果只差1%丨马萨诸塞大学出品我用1台笔记本模拟黑洞引力波

科技前沿

和超算2个月得出的结果只差1%丨马萨诸塞大学出品我用1台笔记本模拟黑洞引力波

2025-01-05 873次阅读

深度赋智 AutoML论文获NeurIPS (深度赋智科技有限公司)

上一篇文章

深度赋智 AutoML论文获NeurIPS (深度赋智科技有限公司)

2025-01-05 907次阅读

下一篇文章

没有了！