语义

人工智能

有证据了，MIT表明：大型语言模型≠随机鹦鹉，确实能学到语义

虽然大型预训练语言模型（LLM）在一系列下游任务中展现出飞速提升的性能，但它们是否真的理解其使用和生成的文本语义？长期以来，AI社区对这一问题存在很大的分歧。有一种猜测是，纯粹基…

5037
2023年7月17日
000
人工智能

图像分割模型实战——用户反馈应用（1）

译者 | 朱先忠审校 | 重楼图像分割是机器学习中的一个热门话题，如今已经得到广泛应用。在视觉模型领域，可以根据一些标准进行训练来实现分割图像，这通常是按照熟悉类型的对象的轮廓…

9818
2023年7月17日
000
人工智能

生成式语义分割新范式GMMSeg，可同时处理闭集和开集识别

当前主流语义分割算法本质上是基于 softmax 分类器的判别式分类模型，直接对 p (class|pixel feature) 进行建模，而完全忽略了潜在的像素数据分布，即 p …

9455
2023年7月16日
000
人工智能

文本图片编辑新范式，单个模型实现多文本引导图像编辑

论文简要概述利用文本对图像进行编辑的相关研究非常火热，最近许多研究都基于去噪扩散模型来提升效果而少有学者继续关注 GAN 的相关研究。本文基于经典的 StyleGAN 和 CLI…

0008
2023年7月16日
000
人工智能

真的这么丝滑吗？Hinton组提出基于大型全景掩码的实例分割框架，图像视频场景丝滑切换

全景分割是一项基本的视觉任务，该任务旨在为图像的每个像素指定语义标签和实例标签。语义标签描述每个像素的类别（例如天空、竖直物体等），实例标签为图像中的每个实例提供唯一的 ID（以区…

慕君年
2023年7月16日
000
人工智能

推理速度比Stable Diffusion快2倍；视觉Transformer统一图像文本

论文 1：One Model to Edit Them All: Free-Form Text-Driven Image Manipulation with Semantic Mo…

Z
2023年7月16日
000
人工智能

自动驾驶方向开源数据集资源汇总

城市景观图像对数据集数据集下载地址：http://m6z.cn/6qBe8e 城市景观数据（数据集主页）包含从德国驾驶的车辆中拍摄的标记视频。此版本是作为 Pix2Pix 论文…

7360
2023年7月15日
000
人工智能

何以为猫？可解释AI从语义层面理解CNN的识别机制

近年来，CNN 因其优异的性能，在计算机视觉、自然语言处理等各个领域受到了研究者们的青睐。但是，CNN 是一个「黑盒」模型，即模型的学习内容和决策过程很难用人类能够理解的方式提…

8604
2023年7月15日
000