最新文章
DeepSeek:强化学习引领AI创新的新时代
近几年来,人工智能(AI)领域瞬息万变,各类新技术层出不穷,然而,一匹黑马的出现,令行业内外为之惊叹,这就是DeepSeek。作为AI研究的新兴力量,DeepSeek在推理能力上取得了重大突破,尤其是通过强化学习(Reinforcement Learning, RL)技术,支撑起了现代AI的一部分发...
DeepSeek最强专业拆解来了,清交复教授超硬核解读
DeepSeek的写作能力为何飞跃?PTX是否真正做到了绕开CUDA的垄断? 编辑 | ZeR0 智东西2月3日报道,周日晚间,五位高校教授夜话DeepSeek,从模型方法、框架、系统、基础设施等角度,阐述DeepSeek的技术原理与未来方向,揭秘其优化方法如何提升算力能效,信息量很大。 如何复现...
deepseek 和强化学习
标题:“socketTCP通信心跳包实例” 在介绍“socketTCP通信心跳包实例”之前,我们首先要明确几个基本概念。TCP(Transmission Control Protocol)是一种面向连接的、可靠的、基于字节流的传输层通信协议。Socket编程是一种网络编程的手段,它允许程序之间通过网...
宋亭亭等:DeepSeek或催化中高阶智驾加速渗透
中新经纬2月12日电 题:DeepSeek或催化中高阶智驾加速渗透 作者 宋亭亭 华泰证券研究所分析师 张硕 华泰证券研究所分析师 智能驾驶作为AI技术最具前景且能快速落地的应用场景之一,正迎来前所未有的发展机遇。DeepSeek的横空出世,在成本和技术上实现了双突破,不仅为智驾领域带来...
deepseek强化学习
标题:“socketTCP通信心跳包实例” 在介绍“socketTCP通信心跳包实例”之前,我们首先要明确几个基本概念。TCP(Transmission Control Protocol)是一种面向连接的、可靠的、基于字节流的传输层通信协议。Socket编程是一种网络编程的手段,它允许程序之间通过网...
DeepSeek的核心创新点
R1模型训练 首先,DeepSeek R1 创造性地基于 DeepSeek V3 基座模型,通过大规模强化学习技术,得到了一个纯粹通过强化学习增强的强推理模型,即 DeepSeek-R1-Zero。DeepSeek 能够实现大规模强化学习的一个重要技术特点是其采用了基于规则(rule-based)的...
DeepSeek、强化学习及DeepSeek后时代
DeepSeek、强化学习及DeepSeek后时代 强化学习这类方法善于训练具有单一技能的智能体Agent,比如教会AlphaGo如何下赢一盘棋,机器人翻跟头、恶劣环境行走,无人机在复杂环境中快速竞飞等。而强化学习本身也是一种机器学习方法,其特点在于通过设置奖励,让计算机自己去try-and-er...
Deepseek的核心是强化学习?哪什么是强化学习?通俗解释与专业解读
最近Deepseek爆火,引发了大家对强化学习技术的关注,今天就从通俗科普角度和好专业技术角度跟大家一起探讨下强化学习的概念。 (关注公众号“AI演进”,持续学习与更新AI知识!) 一、让大家都能听懂的方式解读“强化学习” 举个例子类比一下:小明玩游戏自学成才 想象小明在玩一个复杂游戏,但没人告诉小...
计科趣闻 | 玩转DeepSeek:大模型学习指南+避坑攻略
前 言 preface 同学们,假期快乐。 过年期间,相信大家已经被国产的DeepSeek这款人工智能大模型刷屏,随着人工智能的迅猛发展,DeepSeek成为了一款炙手可热的大语言模型(LLM)。但许多同学对它的认识还停留在“聊天机器人”阶段,或误以为它能“无所不知”。那么,DeepSeek 真的如...
震惊 AI 界!DeepSeek
刚看完DeepSeek R1技术报告论文《DeepSeek-R1:强化学习驱动的大语言模型推理能力提升》,这篇论文最令人震惊的点在于: DeepSeek-R1-Zero 作为一个完全没有使用任何监督微调(SFT)数据,仅通过纯粹的强化学习(RL)训练的模型,展现出了惊人的推理能力,推理基准测试上可以...
