物体
-
苹果、俄勒冈州立提出AutoFocusFormer: 摆脱传统栅格,采用自适应下采样的图像分割
传统 RGB 图像以栅格(raster)形式储存,像素点的分布在整个图像上均匀统一。然而,这种均匀分布往往与图像实际内容的密度分布相去甚远。尤其是在现今常用的深度网络中,在编码部分…
-
能抓取玻璃碎片、水下透明物,清华提出通用型透明物体抓取框架,成功率极高
复杂环境下透明物体的感知和抓取是机器人领域和计算机视觉领域公认的难题。近日,来自清华大学深圳国际研究生院的团队与合作者提出了一种视 – 触融合的透明物体抓取框架,该框架…
-
当「分割一切」遇上图像修补:无需精细标记,单击物体实现物体移除、内容填补、场景替换
4 月初,Meta 发布了史上首个图像分割基础模型–SAM(Segment Anything Model)[1]。作为分割模型,SAM 的能力强大,操作使用方式也十分友…
-
使用TensorFlow和Keras,轻松搭建并训练你的第一个神经网络
AI技术发展迅猛,利用各种先进的AI模型,可以打造聊天机器人、仿人机器人、自动驾驶汽车等。AI已经成为发展最快的技术,而对象检测和物体分类是最近的趋势。 本文将介绍使用卷积神经网络…
-
人工智能改变遥感的四种方式
人工智能(AI)技术的应用每年都在快速增长。 从建筑到医疗保健,人工智能正在改变每个行业的运作方式。当然,其正在产生重大影响的一个行业是科学行业——尤其是人工智能遥感领域。 人工智…
-
分割一切还不够,还要视频跟踪一切,《清明上河图》也能轻松拿下
本月初,Meta 发布「分割一切」AI 模型(Segment Anything Model,简称 SAM),可以为任何图像或视频中的任何物体生成 mask,甚至包括没有见过的物体和…
-
英伟达新方法入选CVPR 2023:对未知物体的6D姿态追踪和三维重建
本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。 普通手机“随手”拍的雕像,一下就变成了精细的三维重建图。 水杯来回动的动态场景下,细节清晰可见: 静态…
-
GPT-4竟然有身体,167cm!清华、北师大重磅研究:ChatGPT能像人一样感知行动
ChatGPT的语言能力确实很惊艳,但大语言模型在没有人类身体、且缺乏实践经验的情况下,是否能像人类一样感知到真实世界呢? 最近,来自清华大学、北京师范大学的研究人员就对ChatG…
-
当「分割一切」遇上图像修补:无需精细标记,单击物体实现物体移除、内容填补、场景替换
4 月初,Meta 发布了史上首个图像分割基础模型–SAM(Segment Anything Model)[1]。作为分割模型,SAM 的能力强大,操作使用方式也十分友…
-
英伟达新方法入选CVPR 2023:对未知物体的6D姿态追踪和三维重建
本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。 普通手机“随手”拍的雕像,一下就变成了精细的三维重建图。 水杯来回动的动态场景下,细节清晰可见: 静态…
-
未知物体也能轻松识别分割,效果可迁移
从来没有见过的新物体,它也能进行很好地分割。 这是DeepMind研究出的一种新的学习框架:目标发现和表示网络(Object discovery and representatio…
-
Habitat Challenge 2022冠军技术:字节AI Lab提出融合传统和模仿学习的主动导航
物体目标导航 (Object Navigation) 是智能机器人的基本任务之一。在此任务中,智能机器人在一个未知的新环境中主动探索并找到人指定的某类物体。物体目标导航任务面向未来…