矩见 AI 文档
CortexGrid AI Docs
首页
搜索
资料下载
常见问题
浏览文档
全部折叠
大模型面试
Transformer基础
LayerNormalization详解
Tokenizer与分词技术
Transformer架构详解
Transformer模型图解详解
位置编码
多头注意力与注意力变体
大模型主流架构对比
激活函数对比与选择
自注意力机制
预训练与训练
优化器与学习率策略
增量预训练策略
损失函数详解
数据准备与样本拼接
训练经验与最佳实践
预训练任务与目标
微调与对齐
Adapter与Prefix-Tuning
LoRA系列详解
PPO算法详解
Prompt-Learning与提示工程
RLHF原理与流程
RLHF变种方法
全参数微调
大模型微调方法综述
分布式训练
22 数据并行DP与DDP
23 流水线并行与模型并行
24 DeepSpeed与ZeRO优化
25 混合精度训练AMP
26 分布式训练故障处理
推理与部署
KV Cache与推理优化
vLLM与PagedAttention
其他推理框架对比
大模型推理基础
显存优化策略
软硬件配置指南
量化技术详解
RAG
34-RAG基础架构
35-文本分块与嵌入策略
36-检索优化与向量库
37-Graph-RAG与知识图谱
38-RAG评测与优化
39-RAG实战案例
Agent与工具
40-Agent架构设计
41-LangChain核心组件
多轮对话与记忆机制
工具调用与Function Calling
模型专题
44-LLaMA系列演进
45-GPT系列技术要点
MoE混合专家架构
中文大模型适配策略
百川模型解析
幻觉与评测
大模型幻觉成因
幻觉缓解策略
数据泄露与测试集问题
模型评测方法
传统ML与DL基础
53-机器学习基础概念
优化算法与正则化
深度学习基础
经典机器学习算法
高级技巧
Chain-of-Thought 思维链
CoT变体方法
小样本学习与上下文学习
模型蒸馏技术
NLP任务专题
向量检索
命名实体识别
文本分类
文本摘要
实战面试
大厂面试真题汇总
大模型系统设计题
校招面试经验
面试技巧与准备
浏览文档
全部折叠
大模型面试
Transformer基础
LayerNormalization详解
Tokenizer与分词技术
Transformer架构详解
Transformer模型图解详解
位置编码
多头注意力与注意力变体
大模型主流架构对比
激活函数对比与选择
自注意力机制
预训练与训练
优化器与学习率策略
增量预训练策略
损失函数详解
数据准备与样本拼接
训练经验与最佳实践
预训练任务与目标
微调与对齐
Adapter与Prefix-Tuning
LoRA系列详解
PPO算法详解
Prompt-Learning与提示工程
RLHF原理与流程
RLHF变种方法
全参数微调
大模型微调方法综述
分布式训练
22 数据并行DP与DDP
23 流水线并行与模型并行
24 DeepSpeed与ZeRO优化
25 混合精度训练AMP
26 分布式训练故障处理
推理与部署
KV Cache与推理优化
vLLM与PagedAttention
其他推理框架对比
大模型推理基础
显存优化策略
软硬件配置指南
量化技术详解
RAG
34-RAG基础架构
35-文本分块与嵌入策略
36-检索优化与向量库
37-Graph-RAG与知识图谱
38-RAG评测与优化
39-RAG实战案例
Agent与工具
40-Agent架构设计
41-LangChain核心组件
多轮对话与记忆机制
工具调用与Function Calling
模型专题
44-LLaMA系列演进
45-GPT系列技术要点
MoE混合专家架构
中文大模型适配策略
百川模型解析
幻觉与评测
大模型幻觉成因
幻觉缓解策略
数据泄露与测试集问题
模型评测方法
传统ML与DL基础
53-机器学习基础概念
优化算法与正则化
深度学习基础
经典机器学习算法
高级技巧
Chain-of-Thought 思维链
CoT变体方法
小样本学习与上下文学习
模型蒸馏技术
NLP任务专题
向量检索
命名实体识别
文本分类
文本摘要
实战面试
大厂面试真题汇总
大模型系统设计题
校招面试经验
面试技巧与准备