搜索 - 矩见AI知识库

矩见 AI 文档CortexGrid AI Docs

浏览文档

LayerNormalization详解 Tokenizer与分词技术 Transformer架构详解 Transformer模型图解详解位置编码多头注意力与注意力变体大模型主流架构对比激活函数对比与选择自注意力机制

优化器与学习率策略增量预训练策略损失函数详解数据准备与样本拼接训练经验与最佳实践预训练任务与目标

Adapter与Prefix-Tuning LoRA系列详解 PPO算法详解 Prompt-Learning与提示工程 RLHF原理与流程 RLHF变种方法全参数微调大模型微调方法综述

22 数据并行DP与DDP 23 流水线并行与模型并行 24 DeepSpeed与ZeRO优化 25 混合精度训练AMP 26 分布式训练故障处理

KV Cache与推理优化 vLLM与PagedAttention 其他推理框架对比大模型推理基础显存优化策略软硬件配置指南量化技术详解

34-RAG基础架构 35-文本分块与嵌入策略 36-检索优化与向量库 37-Graph-RAG与知识图谱 38-RAG评测与优化 39-RAG实战案例

40-Agent架构设计 41-LangChain核心组件多轮对话与记忆机制工具调用与Function Calling

44-LLaMA系列演进 45-GPT系列技术要点 MoE混合专家架构中文大模型适配策略百川模型解析

大模型幻觉成因幻觉缓解策略数据泄露与测试集问题模型评测方法

53-机器学习基础概念优化算法与正则化深度学习基础经典机器学习算法

Chain-of-Thought 思维链 CoT变体方法小样本学习与上下文学习模型蒸馏技术

向量检索命名实体识别文本分类文本摘要

大厂面试真题汇总大模型系统设计题校招面试经验面试技巧与准备

浏览文档

LayerNormalization详解 Tokenizer与分词技术 Transformer架构详解 Transformer模型图解详解位置编码多头注意力与注意力变体大模型主流架构对比激活函数对比与选择自注意力机制

优化器与学习率策略增量预训练策略损失函数详解数据准备与样本拼接训练经验与最佳实践预训练任务与目标

Adapter与Prefix-Tuning LoRA系列详解 PPO算法详解 Prompt-Learning与提示工程 RLHF原理与流程 RLHF变种方法全参数微调大模型微调方法综述

22 数据并行DP与DDP 23 流水线并行与模型并行 24 DeepSpeed与ZeRO优化 25 混合精度训练AMP 26 分布式训练故障处理

KV Cache与推理优化 vLLM与PagedAttention 其他推理框架对比大模型推理基础显存优化策略软硬件配置指南量化技术详解

34-RAG基础架构 35-文本分块与嵌入策略 36-检索优化与向量库 37-Graph-RAG与知识图谱 38-RAG评测与优化 39-RAG实战案例

40-Agent架构设计 41-LangChain核心组件多轮对话与记忆机制工具调用与Function Calling

44-LLaMA系列演进 45-GPT系列技术要点 MoE混合专家架构中文大模型适配策略百川模型解析

大模型幻觉成因幻觉缓解策略数据泄露与测试集问题模型评测方法

53-机器学习基础概念优化算法与正则化深度学习基础经典机器学习算法

Chain-of-Thought 思维链 CoT变体方法小样本学习与上下文学习模型蒸馏技术

向量检索命名实体识别文本分类文本摘要

大厂面试真题汇总大模型系统设计题校招面试经验面试技巧与准备