南京栢拓视觉申请用于识别危险动态目标的辅助驾驶系统专利,可在困难条件下对危险目标进行识别
国家知识产权局信息显示,南京栢拓视觉科技有限公司申请一项名为“一种用于识别危险动态目标的辅助驾驶系统”的专利,公开号CN 119693918 A,申请日期为2024年12月。
国家知识产权局信息显示,南京栢拓视觉科技有限公司申请一项名为“一种用于识别危险动态目标的辅助驾驶系统”的专利,公开号CN 119693918 A,申请日期为2024年12月。
具体来说,UFO 提出了一种基于特征检索的分割方法,将分割任务重新定义为计算 token 特征和图像特征的相似度,无需 SAM,最多仅需输出 16 个 token 即可实现 MLLM 的精细分割。UFO 还支持文本格式的目标框输出,通过并行解码高效支持密集检测
本文提出新任务——空间-时间实例分割,目标对整个传感器输入(包括连续事件和可选对齐帧)进行实例分割。为此,介绍了名为MouseSIS的数据集,其中包含对齐的灰度帧和事件,标注了多达7只自由移动和互动的老鼠的真实标签(像素级实例分割)。此外,还提供了两种参考方法
本文作者来自北京大学和阿里通义万相实验室。其中论文第一作者是汤昊,北京大学 2022 级博士生,目前主要关注统一的多模态任务建模算法。指导教授是王立威老师,北京大学智能学院教授,曾获 NeurIPS 2024 最佳论文奖、ICLR 2023 杰出论文奖及 IC
国家知识产权局信息显示,中国移动通信集团广东有限公司、中移湾区(广东)创新研究院有限公司、中国移动通信集团有限公司申请一项名为“基于可信执行环境的隐私保护认证人求交方法、装置”的专利,公开号CN 119646789 A,申请日期为2024年10月。
当天,文心快码Baidu Comate也发布了文心大模型4.5支持的新版本,为用户带来更加强大的智能交互体验。即日起,用户可以在文心快码Baidu Comate的【Chat】功能中,选择切换至ERNIE-4.5-8K-Preview,体验这一新一代原生多模态大
目前我们不打算直接发布带有标签的旧照片划痕数据集。如果你想获取成对的数据,可以使用我们的预训练模型对收集的图像进行测试以获得标签:
Encoder的主要功能是将输入转化为固定维度的向量,它由多个相同的层组成。每层包含两个子层:自注意力层和前馈全连接层。自注意力层通过计算输入中各元素之间的注意力分数,来捕捉元素之间的长程依赖关系;前馈全连接层则将每个元素映射到不同的向量空间,以捕获更高级的特
transformer 解码器 掩码 encoder 前馈 2025-03-12 18:40 6
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqiz
Mask R-CNN(Region-Based Convolutional Neural Networks)是一种扩展自Faster R-CNN的目标检测与实例分割模型。Mask R-CNN通过在传统的目标检测任务中引入像素级的分割掩码,使得实例分割成为可能。
继 Meta Segment Anything Model (SAM) 用于图像取得成功之后,我们发布了 SAM 2,这是一种统一的模型,用于在图像和视频中实时提示对象分割,可实现最先进的性能。为了与我们的开放科学方法保持一致,我们通过宽松的 Apache 2
meta 掩码 metasegment 2025-01-13 19:18 9
金融界 2025 年 1 月 8 日消息,国家知识产权局信息显示,国网江西省电力有限公司信息通信分公司申请一项名为“一种日志异常检测语言模型自监督训练中混合掩码方法”的专利,公开号 CN 119248618 A,申请日期为 2024 年 12 月。
在机器学习领域存在一个普遍的认知误区,即可解释性与准确性存在对立关系。这种观点认为可解释模型在复杂度上存在固有限制,因此无法达到最优性能水平,神经网络之所以能够在各个领域占据主导地位,正是因为其超越了人类可理解的范畴。
计算机视觉的自监督学习取得了巨大的进步,并改进了许多下游视觉任务,例如图像分类、语义分割和对象检测。其中,生成式自监督视觉学习方法如MAE和BEiT表现出良好的性能。然而,它们的全局掩码重建机制在计算上要求很高。