Doge 资讯 - 聚焦狗狗币动态，掌握加密货币前沿信息 - 第163页 - Dogely Crypto

DeepSeek惊艳AI界：强化学习如何推动智能革命

广泛的应用场景强化学习的应用已经遍及众多行业，并展示出强大的能力：游戏AI ：从AlphaGo的棋盘上颠覆传统到DeepMind的StarCraft代理，强化学习在游戏领域创造了一个又一个奇迹。机器人控制：无论是在自动化生产线、无人机导航还是机械臂操作中，强化学习都使机器人能够自主地完成更为复杂的任务。自动交易：在量化金融行业，强化学习也扮演着重要角色，通过不断优化策略

Doge资讯 2025-02-23 155 阅读
强化学习新时代：DeepSeek R1如何颠覆AI推理模型的训练方式？

近年来，人工智能（AI）领域持续引发广泛关注，而DeepSeek R1作为最新的国产大语言推理模型，正如一颗重磅炸弹震惊了全球。该模型由杭州幻方量化公司开发，以其出色的表现、低训练成本和低运营成本，引发了业界的极大兴趣。本文将深入剖析DeepSeek R1的训练方法，探索其背后的科学原理以及对未来AI研究的影响。 DeepSeek R1的亮点在于完全依靠强化学习（Reinforcement

Doge资讯 2025-02-23 148 阅读
DeepSeek：强化学习引领AI创新的新时代

近几年来，人工智能（AI）领域瞬息万变，各类新技术层出不穷，然而，一匹黑马的出现，令行业内外为之惊叹，这就是DeepSeek。作为AI研究的新兴力量，DeepSeek在推理能力上取得了重大突破，尤其是通过强化学习（Reinforcement Learning, RL）技术，支撑起了现代AI的一部分发展版图，成为行业里的一道亮丽风景线。强化学习是一种重要的机器学习方法

Doge资讯 2025-02-23 232 阅读
DeepSeek最强专业拆解来了，清交复教授超硬核解读

DeepSeek的写作能力为何飞跃？PTX是否真正做到了绕开CUDA的垄断？编辑 | ZeR0 智东西2月3日报道，周日晚间，五位高校教授夜话DeepSeek，从模型方法、框架、系统、基础设施等角度，阐述DeepSeek的技术原理与未来方向，揭秘其优化方法如何提升算力能效，信息量很大。如何复现o1大推理模型？DeepSeek R1技术路线和训练流程有哪些亮点

Doge资讯 2025-02-23 184 阅读
deepseek 和强化学习

标题：“socketTCP通信心跳包实例” 在介绍“socketTCP通信心跳包实例”之前，我们首先要明确几个基本概念。TCP（Transmission Control Protocol）是一种面向连接的、可靠的、基于字节流的传输层通信协议。Socket编程是一种网络编程的手段，它允许程序之间通过网络进行数据交换。在Socket编程中，心跳包（Heartbeat Packet）是一种特定的数据包

Doge资讯 2025-02-23 155 阅读
强化学习与大模型后训练：DeepSeek R1 如何获得推理能力？

DeepSeek 正在通过其开源模型 DeepSeek-R1 革新 AI 产业，尽管资源有限，却能媲美 OpenAI 的能力。通过让前沿大模型更广泛地开放，DeepSeek 推动了全球的创新与合作。其创新的基于强化学习（RL）的后训练技术可增强大模型的推理能力和对齐性，使大模型在实际应用中更加高效且易用。在本文中，我们将重点分析 DeepSeek R1 推理模型背后的关键 RL 后训练技术

Doge资讯 2025-02-23 145 阅读
宋亭亭等：DeepSeek或催化中高阶智驾加速渗透

中新经纬2月12日电题：DeepSeek或催化中高阶智驾加速渗透　　作者宋亭亭华泰证券研究所分析师　　张硕华泰证券研究所分析师　　智能驾驶作为AI技术最具前景且能快速落地的应用场景之一，正迎来前所未有的发展机遇。DeepSeek的横空出世，在成本和技术上实现了双突破，不仅为智驾领域带来了直接的技术借鉴，更在发展思路等方面提供了宝贵启示，有望催化智驾领域的技术创新和产业变革

Doge资讯 2025-02-23 159 阅读
deepseek强化学习

标题：“socketTCP通信心跳包实例” 在介绍“socketTCP通信心跳包实例”之前，我们首先要明确几个基本概念。TCP（Transmission Control Protocol）是一种面向连接的、可靠的、基于字节流的传输层通信协议。Socket编程是一种网络编程的手段，它允许程序之间通过网络进行数据交换。在Socket编程中，心跳包（Heartbeat Packet）是一种特定的数据包

Doge资讯 2025-02-23 142 阅读
DeepSeek的核心创新点

R1模型训练首先，DeepSeek R1 创造性地基于 DeepSeek V3 基座模型，通过大规模强化学习技术，得到了一个纯粹通过强化学习增强的强推理模型，即 DeepSeek-R1-Zero。DeepSeek 能够实现大规模强化学习的一个重要技术特点是其采用了基于规则（rule-based）的方法，确保强化学习可以规模化，并实现面向强化学习的扩展（Scaling）. DeepSeek R1

Doge资讯 2025-02-23 209 阅读
DeepSeek、强化学习及DeepSeek后时代

DeepSeek、强化学习及DeepSeek后时代强化学习这类方法善于训练具有单一技能的智能体Agent，比如教会AlphaGo如何下赢一盘棋，机器人翻跟头、恶劣环境行走，无人机在复杂环境中快速竞飞等。而强化学习本身也是一种机器学习方法，其特点在于通过设置奖励，让计算机自己去try-and-error：通过试错，在行为（action）探索空间space（行为可行域）

Doge资讯 2025-02-23 201 阅读

第一页上一页 1 ... 162 163 164 ... 178 下一页尾页

推荐服务

Telegram粉丝购买

Tiktok涨粉平台

文章分类

热门文章