大模型论文解读:自然语言系统生成文本质量评估新框架: G-Eval

|文末点击阅读原文查看网页版| 更多专栏文章点击查看: LLM 架构专栏

LLM架构从基础到精通之注意力机制

LLM架构从基础到精通之注意力机制 本文2w字,阅读时长~~ 看速度 2025年01月14日 晴 零下3度 1. LLM大模型架构专栏|| 从NLP基础谈起 2.LLM大模型架构专栏|| 自然语言处理(NLP)之建模 3. LLM大模型架构之词

LLM架构从基础到精通之门控循环单元(GRUs)

LLM架构从基础到精通之门控循环单元(GRUs) 以下是已更新文章: 1. LLM大模型架构专栏|| 从NLP基础谈起 2.LLM大模型架构专栏|| 自然语言处理(NLP)之建模 3. LLM大模型架构之词嵌入(Part1)

LLM架构从基础到精通之LSTM

以下是已更新文章: 1. LLM大模型架构专栏|| 从NLP基础谈起 2.LLM大模型架构专栏|| 自然语言处理(NLP)之建模 3. LLM大模型架构之词嵌入(Part1)

LLM架构从基础到精通之循环神经网络(RNN)

LLM架构从基础到精通之循环神经网络(RNN) 以下是已更新文章: 1. LLM大模型架构专栏|| 从NLP基础谈起 2.LLM大模型架构专栏|| 自然语言处理(NLP)之建模 3. LLM大模型架构之词嵌入(Part1)

强化学习详解第三部分:蒙特卡洛与时间差分学习,从经验中学习

在探索强化学习的征程中,我们已经钻研了基础概念,还审视了那些假定对环境有全面认知的基于价值的方法。然而在现实世界里,智能体几乎无法获取关于其所处环境的完美模型。 |文末点击阅读原文查看网页版| 更多专栏文章点击查看:

LLM架构从基础到精 深入探究编码器 - 解码器架构:从 RNN 到 Transformer 的自然语言处理模型及实际应用


深入探究编码器 - 解码器架构:从RNN到Transformer的自然语言处理模型 本文1w字,阅读时长~~ 看速度 2025年01月10日 晴 零下3度 1. LLM大模型架构专栏|| 从NLP基础谈起 2.LLM大模型架构专栏|| 自然语言处理(

LLM架构从基础到精通之 Word2Vec 训练全解析


以下是已更新文章: 1. LLM大模型架构专栏|| 从NLP基础谈起 2.LLM大模型架构专栏|| 自然语言处理(NLP)之建模 3. LLM大模型架构之词嵌入(Part1)

LLM架构从基础到精通之词向量3


LLM大模型架构之词嵌入(Part3) 以下是已更新文章: 1. LLM大模型架构专栏|| 从NLP基础谈起 2.LLM大模型架构专栏|| 自然语言处理(NLP)之建模 3. LLM大模型架构之词嵌入(Part1)

ReSearch框架:通过强化学习推理搜索的LLM框架


论文与代码 论文:https://arxiv.org/abs/2503.19470 代码:https://github.com/Agent-RL/ReSearch 摘要 将推理与外部搜索过程集成颇具挑战,尤其是针对复杂多跳问题。本文提出ReSearch框架,通过强化学习训练大语言模型(LLMs)进行