宇宙
生活
随笔
大模型
RAG
强化学习
Agent
LLM架构
论文
论文速递
机器学习
多模态
基础模型
理论基础
欢迎订阅
开源
大模型
强化学习
Agent
LLM架构
论文
机器学习
多模态
基础模型
分类
标签
归档
上网导航
1
2W8000字读懂GPT全家桶:从GPT-1到O1的技术演进与突破
2
强化学习详解第三部分:蒙特卡洛与时间差分学习,从经验中学习
3
万字解析非结构化文档中的隐藏价值:多模态检索增强生成(RAG)的前景
4
2W8000字深度剖析25种RAG变体
5
深度解析创新RAG:PIKE-RAG与DeepRAG,RAG技术的创新变革
登录
柏企
吹灭读书灯,一身都是月
累计撰写
101
篇文章
累计创建
16
个分类
累计收获
168
个点赞
导航
宇宙
生活
随笔
大模型
RAG
强化学习
Agent
LLM架构
论文
论文速递
机器学习
多模态
基础模型
理论基础
欢迎订阅
开源
大模型
强化学习
Agent
LLM架构
论文
机器学习
多模态
基础模型
分类
标签
归档
上网导航
目录
一文读懂 GenPRM:用生成推理扩展过程奖励模型测试时间计算
一文读懂 GenPRM:用生成推理扩展过程奖励模型测试时间计算 论文链接 代码链接 模型链接 参考文献:GenPRM: Scaling Test-Time Compute of Process Reward Models via Generative Reasoning by Zhao et al.
2025-04-12 13:57
9
0
0
24.9℃
基础模型
向量相似性搜索与图数据库:数据处理的创新融合
向量相似性搜索与图数据库:数据处理的创新融合 近日热文:全网最全的神经网络数学原理(代码和公式)直观解释 欢迎关注知乎和公众号的专栏内容 LLM架构专栏 知乎LLM专栏
2025-04-10 22:09
14
0
4
33.4℃
RAG
使用 DeepSeek-R1 等推理模型将 RAG 转换为 RAT,以实现更智能的 AI
使用 DeepSeek-R1 等推理模型将 RAG 转换为 RAT,以实现更智能的 AI 传统的检索增强生成(RAG)系统在生成具备上下文感知的答案方面表现出色。然而,它们往往存在以下不足: 精确性不足:单次推理可能会忽略复杂查询中的细微差别。 理解不够深入:若没有迭代过程,输出结果可能无法全面解决
2025-04-10 21:15
12
0
5
35.2℃
RAG
LLM架构
DeepSeek R1:了解 GRPO 和多阶段训练
DeepSeek R1:了解GRPO和多阶段训练 近日热文:全网最全的神经网络数学原理(代码和公式)直观解释 欢迎关注知乎和公众号的专栏内容 LLM架构专栏
2025-04-10 21:11
8
0
2
28.8℃
LLM架构
深度探索:DeepSeek-R1 如何从零开始训练,以及这项开源研究将如何以前所未有的速度推动 AI 进步
近日热文:全网最全的神经网络数学原理(代码和公式)直观解释 欢迎关注知乎和公众号的专栏内容 LLM架构专栏
2025-04-10 21:06
8
0
2
28.8℃
开源
开源 AI 大升级!DeepSeek 发布 Janus Pro 7B 多模态模型,免费又强大!
DeepSeek发布了Janus Pro 7B。这是一款免费的多模态AI,它不仅能精准理解图像,还能根据文本生成高质量的视觉图像。 那些单一功能的模型可以退下了,Janus Pro来统一AI的 “视觉” 与 “想象力” 了。接下来咱们详细分析一下,为什么这次发布引起了广泛关注,以及你现在就能上手使用
2025-04-10 20:55
9
0
2
28.9℃
开源
大模型论文精选||多智能体微调:通过多样推理链实现自我提升
多智能体微调是一种实现自我提升的补充方法,它将微调应用于语言模型的多智能体群体。一组均基于相同基础模型的语言模型,通过模型间的多智能体交互生成的数据,分别对各个模型进行更新,实现独立的专业化。通过在不同的数据集上训练每个模型,这种方法能够让各个模型实现专业化,并使整个模型集合更加多样化。 方法 多智
2025-04-10 20:45
10
0
4
33.0℃
基础模型
Agent
大模型论文精选|| 多 LLM 文本摘要:创新方法与卓越成果
多LLM文本摘要:创新方法与卓越成果 论文 https://arxiv.org/abs/2412.15487 Multi-LLM Text Summarization 2412.15487 多LLM摘要框架在每一轮对话中有两个至关重要的步骤:生成和评估。根据使用的是多LLM去中心化摘要还是中心化摘要
2025-04-10 20:39
10
0
1
27.0℃
LLM架构
基础模型
从CLIP到未来:深入探讨视觉任务的视觉语言模型VLM
“如果模型可以识别图像而无需针对该特定任务进行训练怎么办?”欢迎来到视觉语言模型的世界。 更多专栏文章点击查看: LLM 架构专栏
2025-04-10 20:30
12
0
2
29.2℃
LLM架构
ViT功能可视化:探索视觉Transformer学到了什么?
ViT功能可视化:探索视觉Transformer学到了什么
2025-04-10 20:23
6
0
1
26.6℃
多模态
上一页
下一页
1
2
3
4
5
6
7
…
11
弹