🤖 Dogely AI 前沿
AI自动化驱动的中文人工智能资讯平台。覆盖大模型、AI Agent、多模态AI、具身智能、AI开源生态等全产业链,为中文读者提供最快、最全、最深度的AI内容。
最新文章
DeepSeek系统架构的逐层分类拆解分析,从底层基础设施到用户端分发全链路
一、底层基础设施层 1. 硬件服务器集群 算力单元 : GPU集群 :基于NVIDIA H800/H100 GPU构建,单集群规模超10,000卡,采用NVLink全互联架构实现低延迟通信。 国产化支持 :适配海光DCU、寒武纪MLU等国产芯片,通过澎峰科技PerfXLM+框架优化算力利用率。 ...
DeepSeek强化学习(Reinforcement Learning)基础与实践
DeepSeek强化学习(Reinforcement Learning)基础与实践 最新推荐文章于 2025-02-21 01:26:07 发布 Evaporator Core 最新推荐文章于 2025-02-21 01:26:07 发布 阅读量140 收藏 点赞数 4 分类专栏: 强化学习 ...
我是如何看懂 DeepSeek中的 GRPO 算法?
一、如何看懂 DeepSeek中的 GRPO 算法? 1、前置知识 概率统计, 微积分 深度学习基础(损失, 归一化,反向传播,梯度下降,Pytorch等) 信息熵, 交叉熵, 绝对熵(KL 散度) Transformers,Bert, GPT等模型 2、LLM 训练流程 预训练 数据格式:掩码无监...
Deepseek的核心是强化学习?哪什么是强化学习?通俗解释与专业解读
最近Deepseek爆火,引发了大家对强化学习技术的关注,今天就从通俗科普角度和好专业技术角度跟大家一起探讨下强化学习的概念。 (关注公众号“AI演进”,持续学习与更新AI知识!) 一、让大家都能听懂的方式解读“强化学习” 举个例子类比一下:小明玩游戏自学成才 想象小明在玩一个复杂游戏,但没人告诉小...
DeepSeek开源周来袭!5分钟搞定 DeepSeek 本地部署,有手就行?
春节期间突然被 DeepSeek 刷屏了,这热度是真大,到处都是新闻和本地部署的教程,等热度过了过,简单记录下自己本地部署及相关的内容,不过有能力的还是阅读论文和部署完整版的进一步使用。 一、什么是 DeepSeek R1 2025.01.20 DeepSeek-R1 发布,DeepSeek R1 ...
解读 DeepSeek 关键 RL 算法 GRPO
DeepSeek GRPO:面向超大规模RLHF的梯度正则化策略优化算法 引言 深入浅出/通俗易懂/浅尝深悟/简约透彻/浅显直白/言简意赅/简明扼要的先来一遍 直观感受 GRPO是什么 GRPO是一种强化学习算法,就像是一个聪明的小助手,专门用来帮助像DeepSeek这样的大语言模型变得更聪明,特别...
智能时代的社交网络:Facebook如何通过AI重塑用户互动
在数字化和智能化的浪潮中,人工智能(AI)正在推动社交网络平台的变革。Facebook(现Meta Platforms)作为全球领先的社交平台,正借助AI技术重新定义用户互动和增长方式。本文将从多个角度探讨Facebook如何通过AI驱动社交网络的重塑,从而提升用户体验和平台功能。 用户行为分析:洞...
DeepSeek全方位解读:模型介绍,优势及应用场景
前言 在当今快速发展的科技世界里,人工智能(AI)已经成为推动社会进步和创新的关键力量。从智能家居到自动驾驶汽车,再到复杂的数据分析与预测模型,AI的应用无处不在,并不断拓展着人类认知和技术实现的边界。而在众多引领这场智能革命的企业和研究机构中,DeepSeek以其独特的核心技术和前瞻性的研究方向脱...
【DeepSeek论文精读】4. DeepSeek
0. 论文概况 0.1 简介 2024 年 5 月,DeepSeek 发表论文「 DeepSeek-V2:强大、经济且高效的混合专家语言模型 」(DeepSeek-V2: A Strong, Economical, and Efficient Mixture-of-Experts Language ...
DeepSeek:AI 驱动的未来搜索引擎
在信息爆炸的时代,搜索引擎已成为我们获取知识的必备工具。然而,传统搜索引擎往往局限于关键词匹配,难以理解用户真实意图,更无法提供个性化、智能化的搜索体验。DeepSeek 的出现,打破了这一僵局,为搜索引擎领域带来了革命性的变革。 DeepSeek 是一款基于人工智能技术的新一代搜索引擎,它突破了传...
