-
>
决战行测5000题(言语理解与表达)
-
>
软件性能测试.分析与调优实践之路
-
>
第一行代码Android
-
>
深度学习
-
>
Unreal Engine 4蓝图完全学习教程
-
>
深入理解计算机系统-原书第3版
-
>
Word/Excel PPT 2013办公应用从入门到精通-(附赠1DVD.含语音视频教学+办公模板+PDF电子书)
视觉问答理论与实践 版权信息
- ISBN:9787121475313
- 条形码:9787121475313 ; 978-7-121-47531-3
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 所属分类:>
视觉问答理论与实践 内容简介
视觉问答任务要求机器根据指定的视觉图像内容, 对单轮或多轮的自然语言问题进行作答。其本质上是一个多学科的研究问题,涉及计算机视觉、自然语言处理、知识表示与推理等。本书共5 部分,第1 部分介绍在计算机视觉和自然语言处理领域广泛使用的基本方法和技术,包括卷积神经网络、序列建模和注意力机制等。本书将视觉问答分为图像和视频方法。第2 部分将图像视觉问答进一步分为五类,即联合嵌入、注意力机制、记忆网络、组合推理和图神经网络。此外,概述基于图像的其他视觉问答任务,例如基于知识的视觉问答、视觉问答的视觉和语言预训练。第3 部分讨论基于视频的视觉问答及其相关模型。第4 部分讨论与视觉问答相关的高级任务,包括具身视觉问答、医学视觉问答、基于文本的视觉问答、视觉问题生成、视觉对话和指代表达理解,它们是视觉问答任务的扩展。第5 部分对该领域进行总结和展望,讨论视觉问答领域的未来研究方向。
视觉问答理论与实践 目录
视觉问答理论与实践 作者简介
吴琦,澳大利亚阿德莱德大学高级讲师(副教授),博士生导师,澳大利亚青年学者基金获得者 (Australian Research Council DECRA Fellow),澳大利亚机器人视觉研究中心(ACRV)vision-language课题组组长,澳大利亚科学院罗素奖获得者。吴琦博士于2015年在英国巴斯大学获得博士学位,致力于计算机视觉领域研究,尤其关注于计算机视觉-自然语言相关领域的研究。吴琦博士在CVPR,ICCV,ECCV, NeurIPS, TPAMI等多个国际会议和期刊发表论文七十余篇,吴琦博士亦担任TPAMI,IJCV,TIP,CVPR,NIPS,ACL等学术期刊会议审稿人以及ICCV2021 领域主席。
- >
月亮与六便士
月亮与六便士
¥18.1¥42.0 - >
我与地坛
我与地坛
¥20.2¥28.0 - >
我从未如此眷恋人间
我从未如此眷恋人间
¥17.5¥49.8 - >
唐代进士录
唐代进士录
¥18.3¥39.8 - >
龙榆生:词曲概论/大家小书
龙榆生:词曲概论/大家小书
¥9.2¥24.0 - >
姑妈的宝刀
姑妈的宝刀
¥9.9¥30.0 - >
新文学天穹两巨星--鲁迅与胡适/红烛学术丛书(红烛学术丛书)
新文学天穹两巨星--鲁迅与胡适/红烛学术丛书(红烛学术丛书)
¥9.9¥23.0 - >
罗庸西南联大授课录
罗庸西南联大授课录
¥16.6¥32.0
-
Photoshop CS图像处理技术
¥27.2¥36 -
激漫:第8部:用电脑绘制漫画
¥17.6¥29.8 -
AutoCAD 2022快速入门、进阶与精通
¥70¥100 -
地理课件制作
¥26.8¥28 -
影视动画场景设计与表现
¥27.3¥39 -
从零开始玩转剪映
¥45.2¥59