【KJKX科技快讯】7月17日消息,香港科技大学团队近日成功研发出一款名为Semantic-SAM的图像分割人工智能模型,为图像处理领域注入了新的活力。该模型在粒度和语义功能方面较之前的SAM模型有着显著的提升,能够实现对物体的多粒度级别分割和语义标签的提取。

据悉,Semantic-SAM的开发基于著名的Mask
DINO框架,不过研究团队主要对解码器部分进行了改进,使其能够同时支持通用分割和交互式分割。通过采用解耦的物体分类和部件分类方法,Semantic-SAM学习到了物体和部件的语义信息,从而在多粒度分割任务和交互分割任务方面取得了优化效果。这一突破性的成果为图像分割技术的发展带来了更大的潜力。

研究团队在进行了一系列实验后发现,Semantic-SAM模型在分割质量和粒度可控性方面表现优于之前的SAM模型。它能够更准确地分割出不同粒度级别上的物体,并为这些实体提供准确的语义标签,为图像理解和应用提供了更精细的信息。这一重要进展为计算机视觉领域的研究者和工程师们提供了更多的工具和技术支持,有望推动相关领域的创新应用。

为了进一步推广该模型的应用,香港科技大学团队已经将Semantic-SAM项目发布在GitHub上,并同时上传了论文至ArXiv平台,以供研究者和开发者们参考和使用。这一开源举措有助于促进学术界和工业界的合作与交流,推动图像分割领域的不断发展。

文章采集于互联网