名称:手写AI-LLM多模态视觉大模型2024
描述:《手写AI-LLM多模态视觉大模型2024》课程系统讲解视觉与多模态大模型的核心技术,涵盖自监督学习(MoCo、MAE)、视觉基础模型(ViT、DINO)、多模态模型(CLIP、LLaVA)及下游迁移方法(Adapter、视觉Prompt)。课程通过代码实战(MoCo、MAE、CLIP等)和项目案例(PandaGPT微调、VPT下游迁移),帮助学员掌握大模型训练、微调及应用,适合AI开发者深入多模态视觉领域。
链接:
百度:
知识宝库 - 支付
查看隐藏内容,需支付
3金币 !
夸克:
📁 大小:1.91 GB
🏷 标签:#多模态大模型 #自监督学习 #ViT #CLIP #LLaVA #视觉Prompt #模型微调 #下游迁移 #代码实战 #手写AI #手写AILLM百度网盘 #quark
└─手写AI-LLM多模态视觉大模型2024
├─1.大模型技术概述│ 1. 视觉大模型技术概述_ev.mp4│├─2.自监督学习的原理与方法│ 2.1自监督学习与前置任务_ev.mp4│ 2.2对比学习与SimCLR_ev.mp4│ 2.3Moco模型_ev.mp4│ 2.4MoCo代码详解_ev.mp4│ 2.5掩码重建与BEiT_ev.mp4│├─3.视觉基础大模型的架构│ 3.1 ViT与其变种_ev.mp4│ 3.2 MoCo v3自监督骨干网络_ev.mp4│ 3.3 DINO模型_ev.mp4│ 3.4 DINO代码详解_ev.mp4│ 3.5 MAE模型_ev.mp4│ 3.6 MAE代码详解_ev.mp4│ 3.7 SAM模型_ev.mp4│├─4.多模态视觉大模型│ 4.1 多模态学习的概念_ev.mp4│ 4.2 多模态网络的架构_ev.mp4│ 4.3 CLIP模型_ev.mp4│ 4.4 CLIP代码详解_ev.mp4│ 4.5 GLIP模型_ev.mp4│ 4.6 Flamingo模型_ev.mp4│ 4.7 LLaVA模型_ev.mp4│├─5.下游任务迁移与视觉提示│ 5.1 线性探测与微调_ev.mp4│ 5.2 线性探测与微调代码详解_ev.mp4│ 5.3 Adapter方法_ev.mp4│ 5.4 Adapter代码详解_ev.mp4│ 5.5 视觉prompt方法_ev.mp4│ 5.6 视觉Prompt代码详解_ev.mp4│ 5.7 小结_ev.mp4│├─6.实战-多模态大模型微调│ 6.1 PandaGPT框架介绍_ev.mp4│ 6.2 环境与模型配置_ev.mp4│ 6.3 项目代码通览_ev.mp4│ 6.4 数据集加载_ev.mp4│ 6.5 模型定义_ev.mp4│ 6.6 模型实现_ev.mp4│ 6.7 Demo运行_ev.mp4│ code .zip│ Vicuna模型加载指南.txt│ 端口映射方法.txt│├─7.实战-基于视觉提示的下游迁移│ 7.1 VPT框架通览_ev.mp4│ 7.2 数据集加载_ev.mp4│ 7.3 模型定义_ev.mp4│ 7.4 模型实现1_ev.mp4│ 7.5 模型实现2_ev.mp4│ 7.6 病理图像下游迁移_ev.mp4│ BCI数据集下载.txt│ code .zip│└─文档+资料 资料.zip